要聞

深夜突襲！萬億參數(shù)MoE模型Kimi K2上線即開源，月之暗面能否重歸C位？

2025-07-13 16:31:59

7月11日晚，月之暗面在深夜突襲，正式發(fā)布Kimi K2模型并同步開源。Kimi K2是MoE架構(gòu)基礎(chǔ)模型，具備更強代碼能力和通用Agent任務(wù)能力，分為基礎(chǔ)預(yù)訓(xùn)練版和通用指令微調(diào)版。Kimi K2的API服務(wù)已上線，支持長上下文，定價與DeepSeek-R1基本持平。專家建議，Kim需明確目標(biāo)用戶，走差異化路線以在競爭中突圍。

每經(jīng)記者｜李宇彤每經(jīng)實習(xí)編輯｜余婷婷

2025年以來略顯沉寂的月之暗面，在深夜突襲。

7月11日晚，月之暗面宣布正式發(fā)布Kimi K2模型，并同步開源。從介紹來看，Kimi K2是一款具備更強代碼能力、更擅長通用Agent（智能體）任務(wù)的MoE（Mixture of Experts，混合專家模型）架構(gòu)基礎(chǔ)模型，總參數(shù)1T，激活參數(shù)為32B。

本次開源的Kimi K2模型分為Kimi-K2-Base和Kimi-K2-Instruct兩個版本，前者是未經(jīng)過指令微調(diào)的基礎(chǔ)預(yù)訓(xùn)練模型，適合科研與自定義場景；而后者為通用指令微調(diào)版本（非思考模型），在大多數(shù)問答與Agent任務(wù)中有更好的表現(xiàn)。

2025年以來，“Kimi們”的處境正發(fā)生著改變。DeepSeek以低成本、高性能的開源模型強勢入場；MinMax更是火力全開，今年6月在向開源社區(qū)投下一枚“重磅炸彈”，發(fā)布自主研發(fā)的MiniMax-M1系列模型后，在緊隨其后的四個工作日里“一日一更”，直接“五連發(fā)”；而一眾大廠對于AI（人工智能）熱情和野心也在今年再上一個臺階，阿里、騰訊持續(xù)加碼AI，字節(jié)來勢洶洶，大模型格局的洗牌還在繼續(xù)。

拋開一切變化，硬實力才是搏擊市場的硬拳頭。這次，月之暗面能否靠Kimi K2重歸大模型C位？

Kimi K2上線即開源

月之暗面在官方介紹中稱，在SWE Bench Verified、Tau2、AceBench等基準(zhǔn)性能測試中，Kimi K2均取得開源模型中的SOTA（state-of-the-art）成績。在其公布的測評結(jié)果中，Kimi K2在Agentic Coding（自主編程）、Tool Use（工具調(diào)用）和Math&Reasoning（數(shù)學(xué)推理）三個維度的表現(xiàn)上均超過了同為開源模型的DeepSeek-V3和阿里Qwen3。值得一提的是，Kimi評測中的所有模型均為非思考模型的Kimi-K2-Instruct。

目前，Kimi K2的API（應(yīng)用程序編程接口）服務(wù)已上線，支持最長128K上下文，計費方案為4元/百萬“輸入”tokens（大模型處理文本時的最小單位），16元/百萬“輸出”tokens，兼容OpenAI和Anthropic兩種API格式。

為了體現(xiàn)Kimi K2在代碼、Agent工具調(diào)用、風(fēng)格化寫作三項能力上的提升，月之暗面也給出了具體任務(wù)下的展示。在前端開發(fā)任務(wù)中，Kimi K2支持粒子系統(tǒng)、可視化和3D（三維）場景等表現(xiàn)形式。

Kimi K2生成的山川峽谷3D景觀圖片來源：月之暗面Kimi官方公眾號截圖

而在Agent工具調(diào)用能力方面，月之暗面表示Kimi K2現(xiàn)已具備穩(wěn)定的復(fù)雜指令解析能力，可將需求自動拆解為一系列格式規(guī)范、可直接執(zhí)行的ToolCall（工具調(diào)用）結(jié)構(gòu)。在其釋出的案例中，Kimi K2規(guī)劃了參加Coldplay樂隊巡演的行程，可以完成演唱會所在城市的機酒與旅游規(guī)劃，并且生成日歷，再用html概括完整行程規(guī)劃。

《每日經(jīng)濟新聞》記者也使用Kimi K2進(jìn)行了旅游規(guī)劃的測試。根據(jù)“兩個人計劃8月份從北京出發(fā)，去日本東京以及大阪進(jìn)行為期5天的旅游，希望能看到花火大會、吃到當(dāng)?shù)靥厣澄?，幫我做一下包括機酒和行程在內(nèi)的圖文并茂的旅行規(guī)劃”的需求，Kimi K2花費3分鐘左右進(jìn)行了一份詳盡的旅游規(guī)劃，規(guī)劃中包括了具體的餐廳、食物、景點以及一些實用攻略。美中不足的是，這份規(guī)劃是以文字以及表格的形式呈現(xiàn)的，雖然在最后附上了一個百度網(wǎng)盤鏈接表示可以自取圖片內(nèi)容，但實際上該鏈接是無法打開的。

隨后，記者進(jìn)一步提出將規(guī)劃以HTML格式呈現(xiàn)，Kimi K2在隨后交付的網(wǎng)頁中補充了一些票務(wù)的信息，并完成了“圖文并茂”的需求。不過，與官方演示的案例相比，網(wǎng)頁整體的呈現(xiàn)質(zhì)量還較為粗糙。

每經(jīng)記者實測Kimi K2 圖片來源：Kimi K2 截圖

值得一提的是，此前記者還使用類似的提示詞測試過字節(jié)的扣子空間。對比兩次測試結(jié)果可以發(fā)現(xiàn)，扣子空間在網(wǎng)頁的設(shè)計上完成度更高、更為美觀。Kimi K2雖然在此略遜一籌，但旅游攻略制定上更為詳細(xì)，給出了包括餐廳、景點在內(nèi)的詳細(xì)信息，還有如“交通卡當(dāng)?shù)赝丝ū苊猱惖厥掷m(xù)費”等注意事項。

此外，本次Kimi還特別展示了Kimi K2對文字輸出風(fēng)格的掌控，并且在虛構(gòu)寫作任務(wù)中，官方還表示：Kimi K2生成的文字更關(guān)注細(xì)節(jié)與情感，不再是抽象泛泛而談。記者也以2025年北京高考的作文題目“數(shù)字閃耀時”為例，假設(shè)Kimi K2為高中生，完成一篇一類的記敘文。從完成結(jié)果上來說，整體呈現(xiàn)效果良好，但在最后收尾的部分隱約透露出一些“AI味”。

由Kimi K2撰寫的北京高考作文圖片來源：Kimi K2 截圖

Kimi也從技術(shù)角度透露，為了支撐萬億參數(shù)模型訓(xùn)練的穩(wěn)定性，Kimi K2沒有使用傳統(tǒng)的Adam優(yōu)化器，而是使用Muon優(yōu)化器。MuonClip優(yōu)化器能夠穩(wěn)健支撐萬億參數(shù)模型訓(xùn)練，顯著提升token利用效率。

Kimi的下一步要走向哪？

Kimi K2的突襲中，似乎隱含著要打一場翻身仗的決心。

2024年11月，月之暗面創(chuàng)始人楊植麟在接受《每日經(jīng)濟新聞》記者采訪時表示，將提升用戶留存視為Kimi眼下最核心的任務(wù)。而在當(dāng)時，Kimi還是國產(chǎn)大模型之中備受矚目的一個。

商業(yè)智能數(shù)據(jù)服務(wù)商QuestMobile數(shù)據(jù)顯示，截至2024年12月份，豆包、Kimi、文小言的月活躍用戶規(guī)模分別為7523萬、2101萬和1224萬。Kimi位列原生App領(lǐng)域的“三強”之一。

隨著今年年初DeepSeek的橫空出世，整個市場格局被迅速打亂。

今年5月，《每日經(jīng)濟新聞》聯(lián)合QuestMobile發(fā)布的《2025年一季度AI應(yīng)用價值榜》顯示，Kimi雖仍在月均活躍用戶規(guī)模上位于第四，但其2000萬出頭的規(guī)模已經(jīng)和以1.8億排在第一的DeepSeek相差甚遠(yuǎn)。在“月均下載用戶數(shù)環(huán)比增長”一項上，Kimi甚至出現(xiàn)了負(fù)增長，用戶數(shù)環(huán)比下降3.8%。

2025年以來，Kimi對模型的更新升級速度明顯放緩。但從2024年年底到今年5月份，Kimi在似乎瞄準(zhǔn)了垂類領(lǐng)域，尋找新的用戶群，先后和財新傳媒、小紅書、網(wǎng)易游戲《逆水寒》達(dá)成合作。

此前6月20日，Kimi發(fā)布第一個Agent——Kimi-Researcher（深度研究）。

據(jù)官方表示：“模型即Agent，Kimi-Researcher是基于端到端自主強化學(xué)習(xí)（end-to-end agentic RL）技術(shù)訓(xùn)練的新一代Agent模型，也是一個專為深度研究任務(wù)而生的Agent產(chǎn)品?！碑?dāng)時Kimi還表示將逐步開源Kimi-Researcher基礎(chǔ)預(yù)訓(xùn)練模型，以及強化學(xué)習(xí)后的模型，如今來看的話應(yīng)該就是本次發(fā)布的Kimi K2。

知名經(jīng)濟學(xué)者、工信部信息通信經(jīng)濟專家委員會委員盤和林在接受《每日經(jīng)濟新聞》記者微信采訪時對Kimi上半年的努力進(jìn)行了分析。在他看來，Kimi的努力方向是對的，但還不夠，Kimi需要將自己的AI嵌入到一個生態(tài)當(dāng)中。如今，互聯(lián)網(wǎng)平臺各大生態(tài)是封閉的，比如電商的AI可以幫助商家設(shè)計網(wǎng)站，自媒體的AI能夠幫助自媒體制作視頻，那么，Kimi的目標(biāo)用戶是誰？這方面，需要Kimi自己明確。

此外記者注意到，各家今年在升級大模型的時候往往也會“卷”到價格。

6月17日，MiniMax發(fā)布MiniMax-M1系列模型，并以token范圍分段定價。在0～12.8萬token范圍內(nèi)，據(jù)官方介紹，其定價均低于DeepSeek-R1。

6月11日，豆包大模型1.6正式發(fā)布時，火山引擎總裁譚待現(xiàn)場表示，豆包1.6首創(chuàng)按“輸入長度”區(qū)間定價，深度思考、多模態(tài)能力與基礎(chǔ)語言模型統(tǒng)一價格。豆包1.6的綜合成本只有豆包1.5深度思考模型或DeepSeek-R1的三分之一。

而本次Kimi K2的定價和DeepSeek-R1基本持平。在盤和林看來，目前價格還不完全是競爭的關(guān)鍵因素，“因為同樣價格的話，存在先入為主（的問題）。很多用戶用過一個AI，如果價格相同，為什么要去用另一個AI？這個轉(zhuǎn)換理由有兩個，另一個AI更便宜，或者另一個AI更符合自己需要。我認(rèn)為Kimi不能走低價，而是要走差異化路線?！?/p>

封面圖片來源：月之暗面Kimi公眾號

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。