前沿科技
2024/07/24 14:25:09
英伟达今日宣布推出多项新服务和产品,旨在帮助企业更快速、更精准地开发和部署定制化生成式AI应用。其中,企业和国家可以通过英伟达AI Foundry使用自己的资料并搭配Llama 3.1 405B和英伟达Nemotron模型来建立“超级模型”。
英伟达AI Foundry提供全面的生成式服务,涵盖集合管理、合成资料产生、微调、检索、防护和评估,并且协助企业使用最新的Llama 3.1开源模型系列,为特定领域创建定制化的“超级模型”。AI Foundry由英伟达DGX Cloud AI平台驱动,根据需求灵活扩展计算资源。
创始人兼CEO黄仁勋表示“Llama 3.1模型的开放发布代表着企业采用生成式AI的关键时刻。英伟达AI Foundry已全面整合Llama 3.1,准备协助企业建置和部署定制化的Llama超级模型。”
Llama 3.1模型的NIM推论微服务,相比不使用NIM,可将推论吞吐量提高2.5倍。企业可通过ai.nvidia.com网站下载使用。
此外,英伟达还推出了NeMo Retriever NIM微服务,可与Llama 3.1 NIM配合使用,为AI应用提供高精度的检索增强生成(RAG)能力。NeMo Retriever包含最新的嵌入和重新排序模型,可显着提升AI回答的准确性。
英伟达表示,这些新服务和产品正被多家领先企业采用。例如,埃森哲率先使用AI Foundry为客户建构定制化Llama模型;沙特阿美、AT&T、Uber等公司已开始使用Llama NIM微服务;DataStax、Cohesity、NetApp等公司则整合了NeMo Retriever微服务以提升其精确度。
Meta CEO马克·祖克伯指出,新的Llama 3.1系列模型是开源AI的重要一步。企业可通过英伟达AI Foundry轻松创建和定制化先进的AI服务,并通过英伟达 NIM部署。
英伟达强调,这些新产品和服务旨在简化企业AI开发流程,加快产品上市时间,同时提高AI应用的准确性和性能。随着生成式AI在各行业的快速应用,英伟达正致力于为企业提供从开发到部署的全方位支持。
Copyright © 2012-现在 书生家电网, All Rights Reserved.