NVIDIA 通過企業(yè)級生成式 AI 微服務為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

訊石光通訊網(wǎng) 發(fā)布時間:2023/11/29 15:01:40 編者:iccsz

摘要：Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 優(yōu)化語義檢索，實現(xiàn)準確的 AI 推理。

ICC訊 亞馬遜云科技 re:Invent — 太平洋時間 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一項生成式 AI 微服務，支持企業(yè)將自定義大語言模型與企業(yè)數(shù)據(jù)相連接，使其 AI 應用能夠提供高度準確的響應。

NVIDIA NeMo? Retriever 是 NVIDIA NeMo(一個用于構建、自定義和部署生成式 AI 模型的框架和工具系列)的一項全新服務，通過企業(yè)級檢索增強生成(RAG)功能，幫助組織加強其生成式 AI 應用。

作為一項語義檢索微服務，NeMo Retriever 借助經(jīng) NVIDIA 優(yōu)化的算法，幫助生成式 AI 應用作出更加準確的回答。使用該微服務的開發(fā)者，可以將其 AI 應用與位于各個云和數(shù)據(jù)中心的業(yè)務數(shù)據(jù)相連通。該服務為 AI 代工添加了 NVIDIA 優(yōu)化的 RAG 功能，并被整合到亞馬遜云科技 Marketplace 上的 NVIDIA AI Enterprise 軟件平臺中。

Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先與 NVIDIA 合作，將生產(chǎn)就緒型 RAG 功能整合至其自定義生成式 AI 應用和服務中。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示：“具有 RAG 功能的生成式 AI 應用是企業(yè)的下一個殺手級應用。借助 NVIDIA NeMo Retriever，開發(fā)者可以創(chuàng)建自定義生成式 AI 聊天機器人、AI 助手和摘要工具。它們能夠訪問企業(yè)的業(yè)務數(shù)據(jù)，通過準確且有價值的生成式 AI 智能來提高生產(chǎn)力。”

全球頭部企業(yè)借助 NeMo Retriever 提高大語言模型(LLM)準確性

電子系統(tǒng)設計領導廠商 Cadence 為超大規(guī)模計算、5G 通信、汽車、移動、航空航天、消費和醫(yī)療市場的企業(yè)提供服務。該公司正與 NVIDIA 合作，為工業(yè)電子設計領域的生成式 AI 應用開發(fā) RAG 功能。

Cadence 總裁兼首席執(zhí)行官 Anirudh Devgan 表示：“生成式 AI 引入了創(chuàng)新方法來滿足客戶需求，比如能在設計流程早期發(fā)現(xiàn)潛在缺陷的工具等。我們的研究人員正在與 NVIDIA 合作，使用 NeMo Retriever 進一步提高生成式 AI 應用的準確性和相關性，以便發(fā)現(xiàn)問題，并幫助客戶更快地將優(yōu)質(zhì)產(chǎn)品推向市場。”

破解精確的生成式 AI 應用的“密碼”

與開源 RAG 工具套件不同，NeMo Retriever 是通過具有商業(yè)可行性的模型、API 穩(wěn)定性、安全補丁和企業(yè)級支持，來為生產(chǎn)就緒型生成式 AI 賦能。

經(jīng) NVIDIA 優(yōu)化的算法使 Retriever 的嵌入模型能夠產(chǎn)出準確性最高的結(jié)果。經(jīng)過優(yōu)化的嵌入模型能夠捕捉單詞之間的關系，使 LLM 能夠處理和分析文本數(shù)據(jù)。

企業(yè)可以使用 NeMo Retriever 將 LLM 連接到多個數(shù)據(jù)源和知識庫，這樣用戶就可以輕松地與數(shù)據(jù)交互，并通過簡單的對話指令獲得準確且最新的答案。通過使用由 Retriever 驅(qū)動的應用，企業(yè)可以使用戶安全地訪問多種數(shù)據(jù)格式的信息，如文本、PDF、圖像和視頻等。

借助 NeMo Retriever，企業(yè)能夠以更少的訓練獲得更準確的結(jié)果，加快產(chǎn)品上市時間，并減少生成式 AI 應用開發(fā)產(chǎn)生的能耗。

通過 NVIDIA AI Enterprise 實現(xiàn)可靠、簡單且安全的部署

企業(yè)可以在幾乎任何數(shù)據(jù)中心或云端的 NVIDIA 加速計算上部署由 NeMo Retriever 驅(qū)動的應用,以便在推理過程中運行。NVIDIA AI Enterprise 可支持通過 NVIDIA Triton 推理服務器?、NVIDIA TensorRT?、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 軟件進行加速的高性能推理。

供應情況

開發(fā)者可以注冊并搶先體驗 NVIDIA NeMo Retriever。

關于NVIDIA

自 1993 年成立以來，NVIDIA(NASDAQ: NVDA)一直是加速計算領域的先驅(qū)。NVIDIA 1999 年發(fā)明的 GPU 驅(qū)動了 PC 游戲市場的增長，并重新定義了現(xiàn)代計算機圖形，開啟了現(xiàn)代 AI 時代，正在推動跨市場的工業(yè)數(shù)字化。NVIDIA 現(xiàn)在是一家全棧計算公司，其數(shù)據(jù)中心規(guī)模的解決方案正在重塑整個行業(yè)。更多信息，請訪問 https://nvidianews.nvidia.com/。

內(nèi)容來自：NVIDIA
本文地址：http://huaquanjd.cn//Site/CN/News/2023/11/29/20231129070815531435.htm 轉(zhuǎn)載請保留文章出處
關鍵字:
文章標題:NVIDIA 通過企業(yè)級生成式 AI 微服務為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

1、凡本網(wǎng)注明“來源：訊石光通訊網(wǎng)”及標有原創(chuàng)的所有作品，版權均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像，違者必究。對于經(jīng)過授權可以轉(zhuǎn)載我方內(nèi)容的單位，也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標注作者信息和本站來源。
2、免責聲明，凡本網(wǎng)注明“來源：XXX（非訊石光通訊網(wǎng)）”的作品，均為轉(zhuǎn)載自其它媒體，轉(zhuǎn)載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點和對其真實性負責。因可能存在第三方轉(zhuǎn)載無法確定原網(wǎng)地址，若作品內(nèi)容、版權爭議和其它問題，請聯(lián)系本網(wǎng)，將第一時間刪除。
聯(lián)系方式：訊石光通訊網(wǎng)新聞中心　電話：0755-82960080-168 Right

NVIDIA 通過企業(yè)級生成式 AI 微服務 為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

相關新聞

NVIDIA 通過企業(yè)級生成式 AI 微服務為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能