ICC訊 亞馬遜云科技 re:Invent — 太平洋時(shí)間 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一項(xiàng)生成式 AI 微服務(wù),支持企業(yè)將自定義大語言模型與企業(yè)數(shù)據(jù)相連接,使其 AI 應(yīng)用能夠提供高度準(zhǔn)確的響應(yīng)。
NVIDIA NeMo? Retriever 是 NVIDIA NeMo(一個(gè)用于構(gòu)建、自定義和部署生成式 AI 模型的框架和工具系列)的一項(xiàng)全新服務(wù),通過企業(yè)級(jí)檢索增強(qiáng)生成(RAG)功能,幫助組織加強(qiáng)其生成式 AI 應(yīng)用。
作為一項(xiàng)語義檢索微服務(wù),NeMo Retriever 借助經(jīng) NVIDIA 優(yōu)化的算法,幫助生成式 AI 應(yīng)用作出更加準(zhǔn)確的回答。使用該微服務(wù)的開發(fā)者,可以將其 AI 應(yīng)用與位于各個(gè)云和數(shù)據(jù)中心的業(yè)務(wù)數(shù)據(jù)相連通。該服務(wù)為 AI 代工添加了 NVIDIA 優(yōu)化的 RAG 功能,并被整合到亞馬遜云科技 Marketplace 上的 NVIDIA AI Enterprise 軟件平臺(tái)中。
Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先與 NVIDIA 合作,將生產(chǎn)就緒型 RAG 功能整合至其自定義生成式 AI 應(yīng)用和服務(wù)中。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“具有 RAG 功能的生成式 AI 應(yīng)用是企業(yè)的下一個(gè)殺手級(jí)應(yīng)用。借助 NVIDIA NeMo Retriever,開發(fā)者可以創(chuàng)建自定義生成式 AI 聊天機(jī)器人、AI 助手和摘要工具。它們能夠訪問企業(yè)的業(yè)務(wù)數(shù)據(jù),通過準(zhǔn)確且有價(jià)值的生成式 AI 智能來提高生產(chǎn)力。”
全球頭部企業(yè)借助 NeMo Retriever 提高大語言模型(LLM)準(zhǔn)確性
電子系統(tǒng)設(shè)計(jì)領(lǐng)導(dǎo)廠商 Cadence 為超大規(guī)模計(jì)算、5G 通信、汽車、移動(dòng)、航空航天、消費(fèi)和醫(yī)療市場(chǎng)的企業(yè)提供服務(wù)。該公司正與 NVIDIA 合作,為工業(yè)電子設(shè)計(jì)領(lǐng)域的生成式 AI 應(yīng)用開發(fā) RAG 功能。
Cadence 總裁兼首席執(zhí)行官 Anirudh Devgan 表示:“生成式 AI 引入了創(chuàng)新方法來滿足客戶需求,比如能在設(shè)計(jì)流程早期發(fā)現(xiàn)潛在缺陷的工具等。我們的研究人員正在與 NVIDIA 合作,使用 NeMo Retriever 進(jìn)一步提高生成式 AI 應(yīng)用的準(zhǔn)確性和相關(guān)性,以便發(fā)現(xiàn)問題,并幫助客戶更快地將優(yōu)質(zhì)產(chǎn)品推向市場(chǎng)?!?
破解精確的生成式 AI 應(yīng)用的“密碼”
與開源 RAG 工具套件不同,NeMo Retriever 是通過具有商業(yè)可行性的模型、API 穩(wěn)定性、安全補(bǔ)丁和企業(yè)級(jí)支持,來為生產(chǎn)就緒型生成式 AI 賦能。
經(jīng) NVIDIA 優(yōu)化的算法使 Retriever 的嵌入模型能夠產(chǎn)出準(zhǔn)確性最高的結(jié)果。經(jīng)過優(yōu)化的嵌入模型能夠捕捉單詞之間的關(guān)系,使 LLM 能夠處理和分析文本數(shù)據(jù)。
企業(yè)可以使用 NeMo Retriever 將 LLM 連接到多個(gè)數(shù)據(jù)源和知識(shí)庫,這樣用戶就可以輕松地與數(shù)據(jù)交互,并通過簡(jiǎn)單的對(duì)話指令獲得準(zhǔn)確且最新的答案。通過使用由 Retriever 驅(qū)動(dòng)的應(yīng)用,企業(yè)可以使用戶安全地訪問多種數(shù)據(jù)格式的信息,如文本、PDF、圖像和視頻等。
借助 NeMo Retriever,企業(yè)能夠以更少的訓(xùn)練獲得更準(zhǔn)確的結(jié)果,加快產(chǎn)品上市時(shí)間,并減少生成式 AI 應(yīng)用開發(fā)產(chǎn)生的能耗。
通過 NVIDIA AI Enterprise 實(shí)現(xiàn)可靠、簡(jiǎn)單且安全的部署
企業(yè)可以在幾乎任何數(shù)據(jù)中心或云端的 NVIDIA 加速計(jì)算上部署由 NeMo Retriever 驅(qū)動(dòng)的應(yīng)用,以便在推理過程中運(yùn)行。NVIDIA AI Enterprise 可支持通過 NVIDIA Triton 推理服務(wù)器?、NVIDIA TensorRT?、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 軟件進(jìn)行加速的高性能推理。
供應(yīng)情況
開發(fā)者可以注冊(cè)并搶先體驗(yàn) NVIDIA NeMo Retriever。
關(guān)于NVIDIA
自 1993 年成立以來,NVIDIA(NASDAQ: NVDA)一直是加速計(jì)算領(lǐng)域的先驅(qū)。NVIDIA 1999 年發(fā)明的 GPU 驅(qū)動(dòng)了 PC 游戲市場(chǎng)的增長(zhǎng),并重新定義了現(xiàn)代計(jì)算機(jī)圖形,開啟了現(xiàn)代 AI 時(shí)代,正在推動(dòng)跨市場(chǎng)的工業(yè)數(shù)字化。NVIDIA 現(xiàn)在是一家全棧計(jì)算公司,其數(shù)據(jù)中心規(guī)模的解決方案正在重塑整個(gè)行業(yè)。更多信息,請(qǐng)?jiān)L問 https://nvidianews.nvidia.com/。