英伟达AI Foundry服务加速企业生成式AI应用开发

前沿科技

2024/07/24 14:25:09

　　英伟达今日宣布推出多项新服务和产品，旨在帮助企业更快速、更精准地开发和部署定制化生成式AI应用。其中，企业和国家可以通过英伟达AI Foundry使用自己的资料并搭配Llama 3.1 405B和英伟达Nemotron模型来建立“超级模型”。

　　英伟达AI Foundry提供全面的生成式服务，涵盖集合管理、合成资料产生、微调、检索、防护和评估，并且协助企业使用最新的Llama 3.1开源模型系列，为特定领域创建定制化的“超级模型”。AI Foundry由英伟达DGX Cloud AI平台驱动，根据需求灵活扩展计算资源。

　　创始人兼CEO黄仁勋表示“Llama 3.1模型的开放发布代表着企业采用生成式AI的关键时刻。英伟达AI Foundry已全面整合Llama 3.1，准备协助企业建置和部署定制化的Llama超级模型。”

　　Llama 3.1模型的NIM推论微服务，相比不使用NIM，可将推论吞吐量提高2.5倍。企业可通过ai.nvidia.com网站下载使用。

　　此外，英伟达还推出了NeMo Retriever NIM微服务，可与Llama 3.1 NIM配合使用，为AI应用提供高精度的检索增强生成（RAG）能力。NeMo Retriever包含最新的嵌入和重新排序模型，可显着提升AI回答的准确性。

　　英伟达表示，这些新服务和产品正被多家领先企业采用。例如，埃森哲率先使用AI Foundry为客户建构定制化Llama模型；沙特阿美、AT＆T、Uber等公司已开始使用Llama NIM微服务;DataStax、Cohesity、NetApp等公司则整合了NeMo Retriever微服务以提升其精确度。

　　Meta CEO马克·祖克伯指出，新的Llama 3.1系列模型是开源AI的重要一步。企业可通过英伟达AI Foundry轻松创建和定制化先进的AI服务，并通过英伟达 NIM部署。

　　英伟达强调，这些新产品和服务旨在简化企业AI开发流程，加快产品上市时间，同时提高AI应用的准确性和性能。随着生成式AI在各行业的快速应用，英伟达正致力于为企业提供从开发到部署的全方位支持。

次阅读

分享到