99re6在线视频,a级国产乱理伦片在线观看,欧美亚洲免费,亚洲伊人久久大香线蕉影院,国产女精品视频在ktv,18禁黄色网站入口,成人一级毛片免费在线视频

每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

深夜突襲!萬億參數(shù)MoE模型Kimi K2上線即開源,月之暗面能否重歸C位?

2025-07-13 16:31:59

7月11日晚,月之暗面在深夜突襲,正式發(fā)布Kimi K2模型并同步開源。Kimi K2是MoE架構(gòu)基礎(chǔ)模型,具備更強代碼能力和通用Agent任務(wù)能力,分為基礎(chǔ)預(yù)訓(xùn)練版和通用指令微調(diào)版。Kimi K2的API服務(wù)已上線,支持長上下文,定價與DeepSeek-R1基本持平。專家建議,Kim需明確目標(biāo)用戶,走差異化路線以在競爭中突圍。

每經(jīng)記者|李宇彤    每經(jīng)實習(xí)編輯|余婷婷    

2025年以來略顯沉寂的月之暗面,在深夜突襲。

7月11日晚,月之暗面宣布正式發(fā)布Kimi K2模型,并同步開源。從介紹來看,Kimi K2是一款具備更強代碼能力、更擅長通用Agent(智能體)任務(wù)的MoE(Mixture of Experts,混合專家模型)架構(gòu)基礎(chǔ)模型,總參數(shù)1T,激活參數(shù)為32B。

本次開源的Kimi K2模型分為Kimi-K2-Base和Kimi-K2-Instruct兩個版本,前者是未經(jīng)過指令微調(diào)的基礎(chǔ)預(yù)訓(xùn)練模型,適合科研與自定義場景;而后者為通用指令微調(diào)版本(非思考模型),在大多數(shù)問答與Agent任務(wù)中有更好的表現(xiàn)。

2025年以來,“Kimi們”的處境正發(fā)生著改變。DeepSeek以低成本、高性能的開源模型強勢入場;MinMax更是火力全開,今年6月在向開源社區(qū)投下一枚“重磅炸彈”,發(fā)布自主研發(fā)的MiniMax-M1系列模型后,在緊隨其后的四個工作日里“一日一更”,直接“五連發(fā)”;而一眾大廠對于AI(人工智能)熱情和野心也在今年再上一個臺階,阿里、騰訊持續(xù)加碼AI,字節(jié)來勢洶洶,大模型格局的洗牌還在繼續(xù)。

拋開一切變化,硬實力才是搏擊市場的硬拳頭。這次,月之暗面能否靠Kimi K2重歸大模型C位?

Kimi K2上線即開源

月之暗面在官方介紹中稱,在SWE Bench Verified、Tau2、AceBench等基準(zhǔn)性能測試中,Kimi K2均取得開源模型中的SOTA(state-of-the-art)成績。在其公布的測評結(jié)果中,Kimi K2在Agentic Coding(自主編程)、Tool Use(工具調(diào)用)和Math&Reasoning(數(shù)學(xué)推理)三個維度的表現(xiàn)上均超過了同為開源模型的DeepSeek-V3和阿里Qwen3。值得一提的是,Kimi評測中的所有模型均為非思考模型的Kimi-K2-Instruct。

目前,Kimi K2的API(應(yīng)用程序編程接口)服務(wù)已上線,支持最長128K上下文,計費方案為4元/百萬“輸入”tokens(大模型處理文本時的最小單位),16元/百萬“輸出”tokens,兼容OpenAI和Anthropic兩種API格式。

為了體現(xiàn)Kimi K2在代碼、Agent工具調(diào)用、風(fēng)格化寫作三項能力上的提升,月之暗面也給出了具體任務(wù)下的展示。在前端開發(fā)任務(wù)中,Kimi K2支持粒子系統(tǒng)、可視化和3D(三維)場景等表現(xiàn)形式。

Kimi K2生成的山川峽谷3D景觀  圖片來源:月之暗面Kimi官方公眾號截圖

而在Agent工具調(diào)用能力方面,月之暗面表示Kimi K2現(xiàn)已具備穩(wěn)定的復(fù)雜指令解析能力,可將需求自動拆解為一系列格式規(guī)范、可直接執(zhí)行的ToolCall(工具調(diào)用)結(jié)構(gòu)。在其釋出的案例中,Kimi K2規(guī)劃了參加Coldplay樂隊巡演的行程,可以完成演唱會所在城市的機酒與旅游規(guī)劃,并且生成日歷,再用html概括完整行程規(guī)劃。

《每日經(jīng)濟新聞》記者也使用Kimi K2進(jìn)行了旅游規(guī)劃的測試。根據(jù)“兩個人計劃8月份從北京出發(fā),去日本東京以及大阪進(jìn)行為期5天的旅游,希望能看到花火大會、吃到當(dāng)?shù)靥厣澄?,幫我做一下包括機酒和行程在內(nèi)的圖文并茂的旅行規(guī)劃”的需求,Kimi K2花費3分鐘左右進(jìn)行了一份詳盡的旅游規(guī)劃,規(guī)劃中包括了具體的餐廳、食物、景點以及一些實用攻略。美中不足的是,這份規(guī)劃是以文字以及表格的形式呈現(xiàn)的,雖然在最后附上了一個百度網(wǎng)盤鏈接表示可以自取圖片內(nèi)容,但實際上該鏈接是無法打開的。

隨后,記者進(jìn)一步提出將規(guī)劃以HTML格式呈現(xiàn),Kimi K2在隨后交付的網(wǎng)頁中補充了一些票務(wù)的信息,并完成了“圖文并茂”的需求。不過,與官方演示的案例相比,網(wǎng)頁整體的呈現(xiàn)質(zhì)量還較為粗糙。

每經(jīng)記者實測Kimi K2  圖片來源:Kimi K2 截圖

值得一提的是,此前記者還使用類似的提示詞測試過字節(jié)的扣子空間。對比兩次測試結(jié)果可以發(fā)現(xiàn),扣子空間在網(wǎng)頁的設(shè)計上完成度更高、更為美觀。Kimi K2雖然在此略遜一籌,但旅游攻略制定上更為詳細(xì),給出了包括餐廳、景點在內(nèi)的詳細(xì)信息,還有如“交通卡當(dāng)?shù)赝丝ū苊猱惖厥掷m(xù)費”等注意事項。

此外,本次Kimi還特別展示了Kimi K2對文字輸出風(fēng)格的掌控,并且在虛構(gòu)寫作任務(wù)中,官方還表示:Kimi K2生成的文字更關(guān)注細(xì)節(jié)與情感,不再是抽象泛泛而談。記者也以2025年北京高考的作文題目“數(shù)字閃耀時”為例,假設(shè)Kimi K2為高中生,完成一篇一類的記敘文。從完成結(jié)果上來說,整體呈現(xiàn)效果良好,但在最后收尾的部分隱約透露出一些“AI味”。

由Kimi K2撰寫的北京高考作文  圖片來源:Kimi K2 截圖

Kimi也從技術(shù)角度透露,為了支撐萬億參數(shù)模型訓(xùn)練的穩(wěn)定性,Kimi K2沒有使用傳統(tǒng)的Adam優(yōu)化器,而是使用Muon優(yōu)化器。MuonClip優(yōu)化器能夠穩(wěn)健支撐萬億參數(shù)模型訓(xùn)練,顯著提升token利用效率。

Kimi的下一步要走向哪?

Kimi K2的突襲中,似乎隱含著要打一場翻身仗的決心。

2024年11月,月之暗面創(chuàng)始人楊植麟在接受《每日經(jīng)濟新聞》記者采訪時表示,將提升用戶留存視為Kimi眼下最核心的任務(wù)。而在當(dāng)時,Kimi還是國產(chǎn)大模型之中備受矚目的一個。

商業(yè)智能數(shù)據(jù)服務(wù)商QuestMobile數(shù)據(jù)顯示,截至2024年12月份,豆包、Kimi、文小言的月活躍用戶規(guī)模分別為7523萬、2101萬和1224萬。Kimi位列原生App領(lǐng)域的“三強”之一。

隨著今年年初DeepSeek的橫空出世,整個市場格局被迅速打亂。

今年5月,《每日經(jīng)濟新聞》聯(lián)合QuestMobile發(fā)布的《2025年一季度AI應(yīng)用價值榜》顯示,Kimi雖仍在月均活躍用戶規(guī)模上位于第四,但其2000萬出頭的規(guī)模已經(jīng)和以1.8億排在第一的DeepSeek相差甚遠(yuǎn)。在“月均下載用戶數(shù)環(huán)比增長”一項上,Kimi甚至出現(xiàn)了負(fù)增長,用戶數(shù)環(huán)比下降3.8%。

2025年以來,Kimi對模型的更新升級速度明顯放緩。但從2024年年底到今年5月份,Kimi在似乎瞄準(zhǔn)了垂類領(lǐng)域,尋找新的用戶群,先后和財新傳媒、小紅書、網(wǎng)易游戲《逆水寒》達(dá)成合作。

此前6月20日,Kimi發(fā)布第一個Agent——Kimi-Researcher(深度研究)。

據(jù)官方表示:“模型即Agent,Kimi-Researcher是基于端到端自主強化學(xué)習(xí)(end-to-end agentic RL)技術(shù)訓(xùn)練的新一代Agent模型,也是一個專為深度研究任務(wù)而生的Agent產(chǎn)品?!碑?dāng)時Kimi還表示將逐步開源Kimi-Researcher基礎(chǔ)預(yù)訓(xùn)練模型,以及強化學(xué)習(xí)后的模型,如今來看的話應(yīng)該就是本次發(fā)布的Kimi K2。

知名經(jīng)濟學(xué)者、工信部信息通信經(jīng)濟專家委員會委員盤和林在接受《每日經(jīng)濟新聞》記者微信采訪時對Kimi上半年的努力進(jìn)行了分析。在他看來,Kimi的努力方向是對的,但還不夠,Kimi需要將自己的AI嵌入到一個生態(tài)當(dāng)中。如今,互聯(lián)網(wǎng)平臺各大生態(tài)是封閉的,比如電商的AI可以幫助商家設(shè)計網(wǎng)站,自媒體的AI能夠幫助自媒體制作視頻,那么,Kimi的目標(biāo)用戶是誰?這方面,需要Kimi自己明確。

此外記者注意到,各家今年在升級大模型的時候往往也會“卷”到價格。

6月17日,MiniMax發(fā)布MiniMax-M1系列模型,并以token范圍分段定價。在0~12.8萬token范圍內(nèi),據(jù)官方介紹,其定價均低于DeepSeek-R1。

6月11日,豆包大模型1.6正式發(fā)布時,火山引擎總裁譚待現(xiàn)場表示,豆包1.6首創(chuàng)按“輸入長度”區(qū)間定價,深度思考、多模態(tài)能力與基礎(chǔ)語言模型統(tǒng)一價格。豆包1.6的綜合成本只有豆包1.5深度思考模型或DeepSeek-R1的三分之一。

而本次Kimi K2的定價和DeepSeek-R1基本持平。在盤和林看來,目前價格還不完全是競爭的關(guān)鍵因素,“因為同樣價格的話,存在先入為主(的問題)。很多用戶用過一個AI,如果價格相同,為什么要去用另一個AI?這個轉(zhuǎn)換理由有兩個,另一個AI更便宜,或者另一個AI更符合自己需要。我認(rèn)為Kimi不能走低價,而是要走差異化路線?!?/p>

封面圖片來源:月之暗面Kimi公眾號

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0