NVIDIA 通过企业级生成式 AI 微服务为聊天机器人、AI 助手和摘要工具带来商业智能

huqihua 9个月前 (12-05)

Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 优化语义检索,实现准确的 AI 推理

亚马逊云科技 re:Invent — 太平洋时间 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一项生成式 AI 微服务,支持企业将自定义大语言模型与企业数据相连接,使其 AI 应用能够提供高度准确的响应。

NVIDIA NeMo™ Retriever 是 NVIDIA NeMo(一个用于构建、自定义和部署生成式 AI 模型的框架和工具系列)的一项全新服务,通过企业级检索增强生成(RAG)功能,帮助组织加强其生成式 AI 应用。

作为一项语义检索微服务,NeMo Retriever 借助经 NVIDIA 优化的算法,帮助生成式 AI 应用作出更加准确的回答。使用该微服务的开发者,可以将其 AI 应用与位于各个云和数据中心的业务数据相连通。该服务为 AI 代工添加了 NVIDIA 优化的 RAG 功能,并被整合到亚马逊云科技 Marketplace 上的 NVIDIA AI Enterprise 软件平台中。

Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先与 NVIDIA 合作,将生产就绪型 RAG 功能整合至其自定义生成式 AI 应用和服务中。

NVIDIA 创始人兼首席执行官黄仁勋表示:“具有 RAG 功能的生成式 AI 应用是企业的下一个杀手级应用。借助 NVIDIA NeMo Retriever,开发者可以创建自定义生成式 AI 聊天机器人、AI 助手和摘要工具。它们能够访问企业的业务数据,通过准确且有价值的生成式 AI 智能来提高生产力。”

全球头部企业借助 NeMo Retriever 提高大语言模型(LLM)准确性

电子系统设计领导厂商 Cadence 为超大规模计算、5G 通信、汽车、移动、航空航天、消费和医疗市场的企业提供服务。该公司正与 NVIDIA 合作,为工业电子设计领域的生成式 AI 应用开发 RAG 功能。

Cadence 总裁兼首席执行官 Anirudh Devgan 表示:“生成式 AI 引入了创新方法来满足客户需求,比如能在设计流程早期发现潜在缺陷的工具等。我们的研究人员正在与 NVIDIA 合作,使用 NeMo Retriever 进一步提高生成式 AI 应用的准确性和相关性,以便发现问题,并帮助客户更快地将优质产品推向市场。”

破解精确的生成式 AI 应用的“密码”

与开源 RAG 工具套件不同,NeMo Retriever 是通过具有商业可行性的模型、API 稳定性、安全补丁和企业级支持,来为生产就绪型生成式 AI 赋能。

经 NVIDIA 优化的算法使 Retriever 的嵌入模型能够产出准确性最高的结果。经过优化的嵌入模型能够捕捉单词之间的关系,使 LLM 能够处理和分析文本数据。

企业可以使用 NeMo Retriever 将 LLM 连接到多个数据源和知识库,这样用户就可以轻松地与数据交互,并通过简单的对话指令获得准确且最新的答案。通过使用由 Retriever 驱动的应用,企业可以使用户安全地访问多种数据格式的信息,如文本、PDF、图像和视频等。

借助 NeMo Retriever,企业能够以更少的训练获得更准确的结果,加快产品上市时间,并减少生成式 AI 应用开发产生的能耗。

通过 NVIDIA AI Enterprise 实现可靠、简单且安全的部署

企业可以在几乎任何数据中心或云端的 NVIDIA 加速计算上部署由 NeMo Retriever 驱动的应用,以便在推理过程中运行。NVIDIA AI Enterprise 可支持通过 NVIDIA Triton 推理服务器™、NVIDIA TensorRT™、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 软件进行加速的高性能推理。

供应情况

开发者可以注册并抢先体验 NVIDIA NeMo Retriever

关于 NVIDIA

自 1993 年成立以来,NVIDIA(NASDAQ: NVDA)一直是加速计算领域的先驱。NVIDIA 1999 年发明的 GPU 驱动了 PC 游戏市场的增长,并重新定义了现代计算机图形,开启了现代 AI 时代,正在推动跨市场的工业数字化。NVIDIA 现在是一家全栈计算公司,其数据中心规模的解决方案正在重塑整个行业。

本新闻稿中的部分声明包括但不限于有关以下内容的声明:我们的产品、服务和技术,包括 NVIDIA NeMo Retriever、NVIDIA NeMo、NVIDIA AI Enterprise 的优势、影响、性能和供货情况;部分企业率先与 NVIDIA 一起将生产就绪型 RAG 功能整合到其自定义生成式 AI 应用和服务;具有 RAG 功能的生成式 AI 应用成为企业的下一个杀手级应用;企业拥有数百个自定义生成式 AI 聊天机器人、AI 助手和摘要工具,它们能够通过访问企业的数据,提供准确和有价值的智能;全球头部企业借助 NeMo Retriever 提高 LLM 的准确性,包括其带来的好处和影响等均为前瞻性声明,存在风险与不确定性,且最终结果可能与预期存在极大差异。可能导致实际结果出现极大差异的重要因素包括:全球经济状况;我们在制造、组装、包装和测试产品方面对第三方的依赖性;技术发展和竞争的影响;新产品和技术的发展或对我们现有产品和技术的改良;市场对我们的产品或合作伙伴产品的接受情况;设计、制造或软件缺陷;消费者偏好或需求的变化;行业标准和界面的变化;将我们的产品或技术集成到系统中时意外损耗的性能;以及 NVIDIA 近期提交给美国证券交易委员会 (SEC) 的报告(包括但不限于 Form 10-K 年报及 Form 10-Q 季报)中屡次具体说明的其他因素。提交给 SEC 的报告副本发布在公司网站上,且可免费从 NVIDIA 获得。这些前瞻性声明不能保证未来的表现,仅在规定日期有效。除非法律另有要求,否则 NVIDIA 对更新这些前瞻性声明以反映未来事件或环境不承担任何责任。

©2023 NVIDIA Corporation。版权所有。NVIDIA、NVIDIA 徽标、NVIDIA NeMo、NVIDIA Triton 推理服务器、NVIDIA TensorRT 是 NVIDIA Corporation 在美国和其他国家的商标和/或注册商标。其他公司和产品名称可能为与之相关的各自公司的商标。功能、价格、供货情况和规格如有变更,恕不另行通知。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到