Nvidia 推出 Mistral-NeMo-Minitron 8B,最佳化生成式 AI 模型
為什麼重要
Nvidia 推出 Mistral-NeMo-Minitron 8B 模型,因其低運算成本和高精確度,將直接提升 AI 技術在智慧手機、機器人等嵌入式裝置上的應用效率和經濟性,對消費電子和機器人技術產業造成積極影響。
背景故事
#Mistral NeMo 12B、#剪枝和蒸餾、#輕量級模型需求
Nvidia 先前推出的 Mistral NeMo 12B 模型,擁有 120 億個引數,代表著公司在生成式 AI 技術方面的一大進步。為了滿足更廣泛的應用需求和降低運算成本,英偉達採用剪枝和蒸餾技術,進一步最佳化其 AI 模型。
發生了什麼
#Mistral-NeMo-Minitron 8B、#RTX 驅動、#多個基準測試
Nvidia 宣佈推出 Mistral-NeMo-Minitron 8B 模型,這是 Mistral NeMo 12B 模型的縮小版,擁有 80 億個引數。
Mistral-NeMo-Minitron 8B 模型可以在 NVIDIA RTX 驅動的工作站上執行,易於部署和使用。
該模型在 AI 支援的聊天機器人、虛擬助理、內容生成器和教育工具等多個基準測試中表現出色,運算成本較低,提供了與原始模型相媲美的精確度。
接下來如何
#更多裝置部署、#AI Foundry、#創新和商業模式
Mistral-NeMo-Minitron 8B 模型的推出將促進生成式 AI 功能在更多裝置和環境中的部署,特別是資源有限的組織和嵌入式裝置應用場景。
預期會有更多開發人員利用 AI Foundry 進行剪枝和蒸餾,建立針對特定應用的最佳化神經網路。
此舉將推動 AI 技術的普及和應用,並可能激發新的創新和商業模式。
他們說什麼
Nvidia CEO Jensen Huang 表示,Mistral-NeMo-Minitron 8B 模型的推出標誌著公司在提供高效能、低成本 AI 解決方案方面邁出了重要一步。
市場分析師表示,Nvidia 透過這款新模型,成功平衡了運算效率和模型精確度,為 AI 技術的廣泛應用開闢了新途徑。