2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

英伟达入局 AI 大模型“战场”:发布两项全新大型语言模型,推动 AI 和数字生物的发展

  • 2022-09-23
    北京
  • 本文字数:1152 字

    阅读完需:约 4 分钟

英伟达入局AI大模型“战场”:发布两项全新大型语言模型,推动AI和数字生物的发展

当地时间 9 月 20 日,NVIDIA 宣布发布两项全新大型语言模型(LLM)云 AI 服务——NVIDIA NeMo 大型语言模型服务NVIDIA BioNeMo LLM 服务。使开发者能够轻松调整 LLM 并部署定制的 AI 应用程序,其可用于内容生成、文本摘要、聊天机器人、代码开发,以及蛋白质结构和生物分子特性预测等。


NVIDIA NeMo LLM 服可提供一条快速路径,以便自定义和使用在多个框架上训练的大型语言模型。开发者可以在私有云和公有云上使用 NeMo LLM 部署企业 AI 应用,还可以通过云 API 体验 Megatron 530B(大型语言模型之一),也可以通过 LLM 服务开展实验。


NVIDIA BioNeMo 服务是云应用程序编程接口(API),它可以将 LLM 用例扩展到语言以外的科学应用中,加快制药和生物技术公司的药物研发速度。


NVIDIA 创始人兼首席执行官黄仁勋表示: “大型语言模型具有改变每个行业的潜力。通过对基础模型进行调整,可将 LLM 的力量带给数百万的开发者,让他们无需重新构建庞大的模型,即可创建各种语言服务并推动科学发现。”

NeMo LLM 通过提示学习提高准确性,加快部署速度


借助 NeMo LLM 服务,开发者可以使用自己的训练数据定制基础模型——从 30 亿个参数到世界上最大的 LLM 之一 Megatron 530B。与从头开始训练模型所需的数周或数月相比,该过程只需几分钟到几小时。

 

提示学习是使用一种名为 P-tuning 的技术来定制模型,使开发者只需使用几百个示例就能快速定制最初需要使用数十亿个数据点训练的基础模型。定制流程生成任务专属的提示标记,这些标记会与基础模型相结合,为特定用例提供更高的准确性和更相关的响应。

 

开发者可以使用同一模型定制多个用例并生成许多不同的 Prompt Token。游乐场功能提供可以轻松实验并与模型互动的无代码选项,进一步提高了 LLM 对行业特定用例的有效性和可及性。

 

一旦准备好部署,经过调整的模型即可在云实例、本地系统上或通过 API 运行。

BioNeMo LLM 使研究人员能够充分利用大规模模型的力量


BioNeMo LLM 服务包括两个用于化学和生物学应用的新 BioNeMo 语言模型。该服务提供蛋白质、DNA 和生物化学数据方面的支持,帮助研究人员发现生物序列中的模式和洞察。

 

BioNeMo 使研究人员能够利用包含数十亿个参数的模型来扩大研究范围。这些大型模型可以储存更多关于蛋白质结构、基因间进化关系的信息,甚至可以生成用于治疗的新型生物分子。


除了调整基础模型之外,LLM 服务还提供通过云 API 使用现成和定制模型的选项。

     

这让开发者可以访问包括 Megatron 530B 在内的各种预训练 LLM,以及使用 NVIDIA NeMo Megatron 框架创建的 T5 和 GPT-3 模型。NVIDIA NeMo Megatron 框架现已进入公测阶段,可支持各种应用和多语言服务需求。     

 

汽车、计算、教育、医疗、电信等行业的领导者正在使用 NeMo Megatron 为客户提供中文、英语、韩语、瑞典语等语言的服务。

2022-09-23 16:354543

评论

发布
暂无评论
发现更多内容

《数字经济全景白皮书》证券财富管理篇 重磅发布

易观分析

金融 证券

《新手测试正确的打开方式》

测吧(北京)科技有限公司

软件测试 测试

IaC示例:Terraform & Ansible自动化创建K3S集群

mengzyou

DevOps ansible IaC Terraform

Vue 组件通信六种方法

默默的成长

Vue 前端 10月月更

Baklib|企业文档管过不来?试试新型文档管理

Baklib

腾讯强推Spring Security速成笔记太香了!认证授权一键搞定

程序知音

Java 架构 spring security 后端技术 Spirng

React源码分析8-状态更新的优先级机制

goClient1992

React

阿里老表总结的“JVM核心笔记”,让我瞬涨7K!

程序知音

Java 架构 性能优化 JVM 后端技术

分布式事务

C++后台开发

分布式 分布式事务 后端开发 linux开发 C++开发

在 Go 语言中使用 exec 包执行 Shell 命令

宇宙之一粟

Shell Go 语言 10月月更

从 0 到 1 上手阿里云服务器 ECS(四)

六月的雨在InfoQ

Docker 阿里云 容器技术 ECS 10月月更

Baklib|FAQ页面是什么?为什么它是必要的?

Baklib

人工智能软件及服务细分市场数据监测报告合集

易观分析

人工智能 报告

Vue 状态过度

默默的成长

前端 Vue 3 10月月更

SAP | 常见的命令字段格式

暮春零贰

SAP abap 10月月更

阿里全新推出:微服务突击手册,把所有操作都写出来了|超清PDF

程序知音

Java 微服务 阿里 SpringCloud 后端技术

云安全将进入黄金时代 - Gartner 报告解读

HummerCloud

云计算 云安全 Gartner

运维监控管理平台 TASKCTL 流程启动的3种不同模式

敏捷调度TASKCTL

大数据 数据仓库 自动化运维 TASKCTL DevOps工具

基于 openEuler 22.09 版本构建的 NestOS 全新发布!

openEuler

镜像 操作系统 openEuler

Baklib|还在为客户服务繁琐感到麻烦?快用帮助中心

Baklib

基于 Impala 的高性能数仓实践之物化视图服务

网易数帆

大数据 impala 企业号十月 PK 榜 物化视图 Calcite

一文带你玩转ProtoBuf

王中阳Go

Go 微服务 RPC protobuf 10月月更

React源码分析7-state计算流程和优先级

goClient1992

React

阿里大牛强力推荐:springboot实战派文档,采用知识点+实例的形势,深入了解

Geek_0c76c3

数据库 spring 开源 程序员 架构

数据库改造方案 | 同花顺、弘源泰平真实案例分享

TDengine

数据库 tdengine 时序数据库

中国CRM要超车,没有弯道

ToB行业头条

Bklib|客户体验数字化转型成未来企业升级的新目标

Baklib

数字化转型

Vue 全部生命周期组件整理

默默的成长

Vue 前端 10月月更

idea启动build过慢

拾光师

IDEA 10月月更

TDengine 3.0 中如何编译、创建和使用自定义函数

TDengine

数据库 tdengine 开源 时序数据库

Dataphin V3.6版来了!多项能力升级,助力企业提升全链路数据治理能力

瓴羊企业智能服务

英伟达入局AI大模型“战场”:发布两项全新大型语言模型,推动AI和数字生物的发展_语言 & 开发_李冬梅_InfoQ精选文章