Kimi首個萬億參數(shù)模型開源！免費可用，超強Agent推理，附實測體驗

發(fā)布時間：2025-07-12 09:30:09來源：智東西

　　智東西7月12日報道，昨夜，國內大模型獨角獸月之暗面發(fā)布并開源了其最新一代MoE架構基礎模型Kimi K2，總參數(shù)量達到1萬億(1T)，激活參數(shù)為32B。Kimi K2已在Kimi Web端和App端中可用。

　　Kimi K2是月之暗面首款開源發(fā)布的旗艦模型，在SWE Bench Verified(編程)、Tau2(智能體)、AceBench(工具調用)這三項基準測試中，這一模型取得開源模型中的SOTA成績。

　　在自主編程(Agentic Coding)、工具調用(Tool Use)和數(shù)學推理(Math & Reasoning)這三個能力維度上，Kimi K2的表現(xiàn)超過了DeepSeek-V3-0324、Qwen-235B-A22B等模型，但在部分基準測試中略遜于Claude 4 Opus、OpenAI GPT-4.1等模型。

　　Kimi K2在預訓練階段使用了“MuonClip”優(yōu)化器實現(xiàn)萬億參數(shù)模型的訓練。這一優(yōu)化器能提高Token利用效率，緩解高質量人類數(shù)據(jù)的短缺問題。月之暗面還應用了大規(guī)模Agentic Tool Use數(shù)據(jù)合成和引入自我評價機制的通用強化學習等技術。

　　Kimi K2 API服務也同步上線。Kimi K2 API支持最長128K上下文，計費方案為每百萬輸入tokens/4元，每百萬輸出tokens/16元，輸入輸出價格均為DeepSeek V3的2倍。

　　Kimi K2系列中的兩個模型版本現(xiàn)已開源，包括未經過指令微調的基礎預訓練模型Kimi-K2-Base和通用指令微調版本Kimi-K2-Instruct(非思考模型)。前者適合科研與自定義場景，后者則可用于大多數(shù)問答與Agent任務。

　　Kimi K2現(xiàn)已上線無問芯穹Infini-AI異構云平臺(cloud.infini-ai.com/genstudio/)，用戶能以與官方API同樣的價格調用Kimi K2。

　　開源鏈接：

　　https://huggingface.co/moonshotai/Kimi-K2-Instruct

　　體驗鏈接：

　　https://www.kimi.com/

　　一、編程能力迎提升，實測效果差強人意

　　根據(jù)月之暗面博客文章，在前端開發(fā)任務中，Kimi K2能生成有設計感與視覺表現(xiàn)力的代碼，支持粒子系統(tǒng)、可視化和3D場景等表現(xiàn)形式。官方Demo中，Kimi K2開發(fā)了一個支持晝夜循環(huán)的山川峽谷3D景觀：

　　還生成了粒子特效銀河：

　　為驗證上述能力，智東西向Kimi K2發(fā)送了如下提示詞：

　　最終，Kimi K2交付的網頁渲染效果并未如官方Demo中那般逼真，交互性和功能豐富度也略遜一籌。

　　在難度較低的個人網站開發(fā)任務上，Kimi K2展現(xiàn)出一定規(guī)劃能力。在未收到明確指示的情況下，Kimi K2主動梳理了網站的目錄結構，打造出的網站可擴展性更好。

　　就智東西進行的個人網站開發(fā)測試而言，Kimi K2相較Kimi K1.5的UI審美水平進步有限。

　　▲上方為Kimi K2生成結果，下方為Kimi K1.5生成結果

　　同樣的任務交由DeepSeek-V3-0324進行處理，最終生成的結果如下：

　　二、Agent工具調用能力增強，擴展風格化寫作能力

　　月之暗面稱，Kimi K2現(xiàn)具備復雜指令解析能力，可將需求自動拆解為一系列格式規(guī)范、可直接執(zhí)行的ToolCall結構。

　　開發(fā)者可將Kimi K2接入owl、Cline、RooCode等Agent/Coding框架，完成復雜任務或自動化編碼。

　　Agent能力已可通過API使用，更多工具能力即將在Kimi上線。在月之暗面內部測試環(huán)境中的實際演示里，Kimi K2展現(xiàn)出一定體驗Agentic能力。

　　比如，將13萬行的原始數(shù)據(jù)丟給Kimi K2，它可以幫用戶分析遠程辦公比例對薪資的影響，分析顯著差異，自動生成統(tǒng)計圖表與回歸模型解讀，并用統(tǒng)一色調做出小提琴圖(violin plot) 、箱線圖(box plot)、散點圖(scatter plot)等專業(yè)圖表，整理成報告。

　　再比如，如果用戶是Coldplay粉絲，Kimi K2可以幫忙制定今年的追星計劃，完成演唱會所在城市的機酒與旅游規(guī)劃，并且生成日歷，再用html概括完整行程規(guī)劃并發(fā)送郵件。

　　Kimi K2還擁有了更強的風格化寫作能力。官方提供的Demo中，Kimi K2模仿了蘋果廣告文案風格：

　　此外，Kimi K2在通用知識推理、數(shù)學、規(guī)劃等任務中的表現(xiàn)亦有提升，比數(shù)字大小的題目已經難不住Kimi K2了。

　　結語：探索新型優(yōu)化器，未來將新增思考與視覺理解

　　根據(jù)月之暗面博客文章，Kimi K2用MuonClip優(yōu)化器支撐萬億參數(shù)模型訓練，提升token利用效率。結合大規(guī)模Agentic數(shù)據(jù)合成與通用強化學習，這一模型的通用智能能力獲得提升。

　　為了緩解大規(guī)模訓練中的attention logits偏大問題，月之暗面拋棄了傳統(tǒng)的Adam優(yōu)化器，提出MuonClip優(yōu)化器，并將其擴展到萬億參數(shù)規(guī)模，提升了訓練穩(wěn)定性和token使用效率。Kimi K2完成了15.5T token的訓練，全程無loss spike。

　　月之暗面還構建了可大規(guī)模生成多輪工具使用場景的合成pipeline，其大規(guī)模Agentic Tool Use數(shù)據(jù)合成可覆蓋數(shù)百領域、數(shù)千工具，樣本由LLM評估篩選后用于訓練。

　　Kimi K2在可驗證任務上(代碼、數(shù)學)使用了強化學習，還通過引入自我評價機制(self-judging)，解決了不可驗證任務的獎勵稀缺問題，實現(xiàn)通用強化學習，提升泛化任務表現(xiàn)。

　　目前，Kimi K2尚不支持視覺理解和思考能力，月之暗面稱這些能力將在未來陸續(xù)加入。

從無人車到智能工廠外...

最后一頁

熱點推薦