智能体刷屏的背后,是 AI 应用拐点的来临?AICon 北京站议程重磅公布,50+ 硬核分享不容错过 了解详情
写点什么

Llama 4 Scout 与 Maverick 现已在 Amazon Bedrock 和 SageMaker JumpStart 上线

  • 2025-05-21
    北京
  • 本文字数:777 字

    阅读完需:约 3 分钟

大小:383.32K时长:02:10
Llama 4 Scout与Maverick现已在Amazon Bedrock和SageMaker JumpStart上线

AWS 近日宣布,Meta 的最新基础模型 Llama 4 Scout 与 Llama 4 Maverick 已在 Amazon Bedrock 和 AWS SageMaker JumpStart 上线。两款模型均具备多模态能力,并采用混合专家(MoE)架构。

 

Meta 于去年四月发布的这两款模型分别包含 170 亿个活跃参数,分布在 16 个(Scout)和 128 个(Maverick)专家网络中。其中 Llama 4 Scout 针对单块英伟达 H100 GPU 通用任务进行了优化;而据 Meta 称,Llama 4 Maverick 在推理与编码能力方面表现突出,优于同类竞品。亚马逊特别强调了 MoE 架构在降低计算成本方面的价值:

 

得益于 Meta 首次采用更为高效的混合专家架构,该技术仅激活模型中与任务最相关的部分,客户能以更高计算效率进行模型训练和推理,在提升性能的同时降低成本。"

 

虽然 Llama 4 Scout 理论上支持 1000 万 token 的上下文窗口,但当前亚马逊 Bedrock 的限制为 350 万 token(官方表示将很快扩展);Llama 4 Maverick 则最高支持 100 万 token。相较于 Llama 3 系列 12.8 万 token 的上下文长度,两款模型均有显著提升。

 

在亚马逊 SageMaker JumpStart 平台,用户可根据需求通过 SageMaker Studio 或亚马逊 SageMaker Python SDK 调用新模型。两款模型默认使用配备英伟达 H100 Tensor Core GPU 的 ml.p5.48xlarge 实例,也可选择搭载英伟达 H200 Tensor Core GPU 的 ml.p5en.48xlarge 实例。Llama 4 Scout 还支持采用英伟达 L40S Tensor Core GPU 的 ml.g6e.48xlarge 实例类型。

 

在 AWS 之外,Llama 4 系列模型现已在 Databricks、GroqCloud、Lambda.ai、Cerebras Inference Cloud 等云平台上线,也可在 Hugging Face 平台使用

 

除 Scout 和 Maverick 外,Llama 4 家族还有第三款模型 Behemoth,该模型的 2880 亿活跃参数分布在 16 个专家网络中。Meta 表示当前还处于预览阶段的 Behemoth 是“最具智能的蒸馏教师模型”,Scout 与 Maverick 均是由其训练而来。

2025-05-21 14:005203

评论

发布
暂无评论
发现更多内容

java语言前景怎么样,到底需不需要参加培训

@零度

Java JAVA开发

模块四作业:设计千万级学生系统的试卷存储方案

Geek_99eefd

模块四 「架构实战营」

netty系列之:在http2中使用framecodec

程序那些事

Java java 并发 程序那些事 11月日更

Android C++系列:Linux进程间通信(一)

轻口味

c++ android 11月日更

【死磕Java并发】-----J.U.C之AQS:同步状态的获取与释放

chenssy

11月日更 死磕 Java 死磕 Java 并发

🏆【Alibaba中间件技术系列】「RocketMQ技术专题」让我们一起探索一下DefaultMQPullConsumer的实现原理及源码分析

码界西柚

阿里巴巴 RocketMQ 消息队列 11月日更 Apache RocketMQ

使用 ABAP 代码提交 SAP CRM Survey 调查问卷

汪子熙

CRM SAP abap 11月日更 问卷模型

今日谈:BoltDB数据库,一款纯Go实现的KV数据库

恒生LIGHT云社区

数据库 Go 语言 BoltDB

Windows 11再出杀手锏....

Jackpop

Golang Gin 框架之分组路由(五)

liuzhen007

11月日更

分析23个赛季NBA数据,我发现10条难以置信的信息!

Jackpop

一起来写 VS Code 插件:实现一个翻译插件

狂奔滴小马

JavaScript vscode 大前端 vs

一起来写 VS Code 插件:VS Code 版 CNode 已上线

狂奔滴小马

JavaScript vscode 大前端

管理纪要

KoLee

被Chrome坑惨了!

Jackpop

[Pulsar] 消息生命历程(三)——客户端发送消息

Zike Yang

Apache Pulsar 11月日更

《深入理解JVM虚拟机》读书笔记:第一章

Joseph295

“2021ISIG中国产业智能大会低代码峰会”即将开幕,钉钉宜搭叶周全受邀出席

一只大光圈

阿里巴巴 互联网 钉钉 低代码 钉钉宜搭

SAP CRM Survey调查问卷的模型设计原理解析

汪子熙

中间件 CRM SAP C4C 11月日更

一文讲透如何用明道云构建物料需求计划系统

明道云

入驻快讯|欢迎ShowMeBug正式入驻 InfoQ 写作平台!

InfoQ写作社区官方

使用 Omnibus 安装极狐GitLab

极狐GitLab

极狐GitLab 安装使用

2018年世界杯德国竟然输给韩国?终于找到原因了!

Jackpop

人脸检测实战:使用opencv加载深度学习模型实现人脸检测

AI浩

用 NodeJS 开发一版在线流程图网站

狂奔滴小马

JavaScript 大前端 Node

【高并发】由InterruptedException异常引发的思考

冰河

Java 并发编程 多线程 高并发 异步编程

Prometheus Exporter (八)kube-state-metrics

耳东@Erdong

Kubernetes Prometheus exporter 11月日更 kube-state-metrics

一起来写 VS Code 插件:为你的团队提供常用代码片段

狂奔滴小马

vscode 大前端

使用 NextJS 和 TailwindCSS 重构我的个人博客

狂奔滴小马

大前端 Blog nextjs

Flutter设置App的应用名字和应用logo图标的方法

坚果

flutter 11月日更

图论算法:稳定婚姻问题,如何找到最适合自己的另一半

博文视点Broadview

Llama 4 Scout与Maverick现已在Amazon Bedrock和SageMaker JumpStart上线_架构_Sergio De Simone_InfoQ精选文章