當(dāng)前位置：網(wǎng)站首頁先鋒資訊 DeepSeek 沖擊之下，大模型六小強(qiáng)如何「回應(yīng)」？

DeepSeek 沖擊之下，大模型六小強(qiáng)如何「回應(yīng)」？

來源：互聯(lián)網(wǎng) 發(fā)布時(shí)間：2025-02-18 15:14:09

馬上整整 1 個(gè)月了！這一個(gè)月以來，全球大模型市場受 DeepSeek 攪動，無不方寸大亂。

中外大廠、初創(chuàng)公司都頭好禿，全被追著問：你們對 DeepSeek 怎么看？DeepSeek 出來你們怎么辦？

有避而不談的，也有主動回應(yīng)的。

國內(nèi)，比如騰訊，剛剛在微信開啟灰度測試“AI 搜索”功能，接入的就是 DeepSeek-R1；比如百度，當(dāng)即宣布 4 月起文心一言免費(fèi)用，下一代文心模型決定開源……

國外，比如 OpenAI，緊急發(fā)布 o3-mini、上新深度搜索、公開 o3 思維鏈條；比如谷歌 DeepMind，新發(fā)布的 Gemini 2.0 系列，新增模型型號 Gemini 2.0 Flash-Lite，其 API 砍價(jià)能力比 DeepSeek 還狠；

然而正當(dāng)全球 AI 大模型格局重塑之際，放眼國內(nèi)，不少人還很關(guān)心一件事：

六家已成為獨(dú)角獸的大模型創(chuàng)業(yè)公司，零一萬物、百川智能、階躍星辰、智譜華章、月之暗面、MiniMax 江湖人稱大模型六小強(qiáng)。

在 DeepSeek 猛烈的沖擊波下，他們正在如何應(yīng)對？

沖擊之下，六小強(qiáng)都有啥“回應(yīng)”

六小強(qiáng)中，沒有任何一家站出來，正面表達(dá)對 DeepSeek 的看法。

但這不代表它們沒有行動 —— 畢竟比起高談闊論，落地的實(shí)際行動更值得用來證明。

注：以下均為六小強(qiáng) 1 月 20 日（含）后的動態(tài)

零一萬物

DeepSeek-R1 問世之前，創(chuàng)始人李開復(fù)博士已公開表示，零一萬物將不再追求訓(xùn)練超級大模型。

經(jīng)過為期半年多的探索驗(yàn)證，他們明確表示，參數(shù)適中同時(shí)性能優(yōu)異、推理速度更快、推理成本更低的輕量化模型更適合商用場景，“會成為 AI-First 應(yīng)用爆發(fā)的催化劑”。

而 DeepSeek 問世之后，零一萬物對外曝光的首個(gè)動作，選擇了攜手蘇州 ——

2 月 14 日，零一萬物與蘇州高新區(qū)聯(lián)合成立的產(chǎn)業(yè)大模型基地正式授牌。

該大模型基地聚焦垂直產(chǎn)業(yè)，重點(diǎn)打造制造、金融、醫(yī)療、政務(wù)、生物、具身等多個(gè)領(lǐng)域的行業(yè)大模型解決方案，聯(lián)合產(chǎn)業(yè)鏈上下 7 家企業(yè)，“探索大模型技術(shù)從實(shí)驗(yàn)室走向生產(chǎn)線的產(chǎn)業(yè)化路徑”。

在現(xiàn)場，李開復(fù)談道，在人工智能技術(shù)重構(gòu)產(chǎn)業(yè)的關(guān)鍵節(jié)點(diǎn)，大模型絕非“空中樓閣”，而是驅(qū)動實(shí)體經(jīng)濟(jì)的核心引擎。

而零一萬物官方表示：

繼 1 月 2 日與阿里云聯(lián)合成立“產(chǎn)業(yè)大模型聯(lián)合實(shí)驗(yàn)室”之后，零一萬物再度于產(chǎn)業(yè)大模型方向落子。

此次于蘇州高新區(qū)落地的“產(chǎn)業(yè)大模型基地”進(jìn)一步加速了零一萬物模型能力商業(yè)落地的進(jìn)程。

百川智能

DeepSeek-R1 發(fā)布 5 天后，1 月 25 日，百川智能發(fā)布新模型 Baichuan-M1-preview。

這是百川第一個(gè)全場景推理大模型。所謂全場景，指的是該模型同時(shí)具備語言、視覺和搜索三個(gè)領(lǐng)域的推理能力。

與此同時(shí)，百川依然奔赴轉(zhuǎn)向醫(yī)療的道路上：

Baichuan-M1-preview 解鎖了醫(yī)療循證模式，官方解釋它“實(shí)現(xiàn)了從醫(yī)療證據(jù)檢索到深度推理的完整端到端服務(wù)，能夠快速、精準(zhǔn)地回答醫(yī)療臨床、科研問題”。

2 月 13 日，以 Baichuan-M1 為底座打造的「AI 兒科醫(yī)生」經(jīng)過近一個(gè)月的內(nèi)測后，在京“上崗”。

針對臨床推理，它首先會基于一訴五史生成診療假設(shè)，繼而通過檢驗(yàn)檢查數(shù)據(jù)進(jìn)行假設(shè)證偽與排除，最終經(jīng)由自反思機(jī)制對剩余假設(shè)進(jìn)行概率排序，輸出符合臨床思維路徑的診療建議。

官方消息顯示，當(dāng)天，北京兒童醫(yī)院開展了國內(nèi)首次“AI 兒科醫(yī)生 + 多學(xué)科專家”的雙醫(yī)并行多學(xué)科會診。與會人員除了多科室 13 位專家，還有該醫(yī)院與百川智能、小兒方健康科技（這家是百川投資的醫(yī)療數(shù)據(jù)公司）聯(lián)合研發(fā)的「AI 兒科醫(yī)生」。

與會者對一位顱底腫物伴隨抽動癥狀的患兒進(jìn)行了多學(xué)科會診，另一邊，工程師將患者的主訴和病歷資料輸入模型。

AI 兒科醫(yī)生也給出了與專家組會診結(jié)果高度吻合的建議。

階躍星辰

DeepSeek-R1 發(fā)布當(dāng)天，階躍星辰正處于模型上新進(jìn)程中。

1 月 20 日當(dāng)天發(fā)布的兩款模型均為語言模型，一款是輕量級、響應(yīng)快、性價(jià)比高的 Step-2-mini，與自家模型玩意參數(shù)的 Step-2 相比，Step-2-mini 以 3% 左右的參數(shù)量保有 80% 以上的性能。

另一款是主打文學(xué)創(chuàng)作的 Step-2 文學(xué)大師版，“專為創(chuàng)作而生”。

而后兩天內(nèi)，階躍繼續(xù)保持節(jié)奏對外發(fā)布。

21 日，升級語音模型 Step-1o Audio，又上新多模態(tài)理解大模型 Step-1o Vision。后者發(fā)布首測就沖上來了大模型競技場前 10，位列視覺領(lǐng)域國產(chǎn)第 1。

22 日，發(fā)布視頻生成模型 Step-Video V2 版本，該版本在前代 V1 基礎(chǔ)上，從 VAE 模型、DiT 架構(gòu)與 RL 融合、多模態(tài)大模型應(yīng)用三方面基礎(chǔ)上升級而來。

模型側(cè)更新外，階躍星辰旗下應(yīng)用「躍問」也在 1 月 24 日推出了全新功能，躍問 AI 創(chuàng)意板。

它的功能是“不用代碼就能在 3 步內(nèi)實(shí)現(xiàn)想法，開發(fā)應(yīng)用”，并且將成果全平臺分享。

BTW，量子位發(fā)現(xiàn)，躍問不知何時(shí)已經(jīng)偷偷接入了 DeepSeek-R1……

以及農(nóng)歷新年前頻繁動作之時(shí)，階躍星辰系統(tǒng)負(fù)責(zé)人朱亦博就在朋友圈小小劇透，年后階躍有大動作。

而“大動作”本身，或許會在 2 月 21 日階躍星辰舉辦的首屆“Step Up 生態(tài)開放日”上揭曉。至于有無針對 DeepSeek-R1 的回應(yīng)性動作或戰(zhàn)略，也要等到下周會上才見分曉了。

智譜華章

2 月 11 日，清華大學(xué)計(jì)算機(jī)系教授、智譜創(chuàng)立發(fā)起人唐杰在巴黎大王宮舉行的第三屆人工智能行動峰會邊會“人工智能技術(shù)進(jìn)步與應(yīng)用”上發(fā)言。

也是唯一參加該峰會的大模型代表。

在闡述對 AGI 的 5 個(gè)階段劃分后，唐杰表示現(xiàn)在正處于 L2 和 L3 交匯處，即“對齊機(jī)器與人類的意圖”和“機(jī)器自我學(xué)習(xí)”的交匯處。

而 2025 年的關(guān)鍵詞，部分摘錄如下：

自主的、具有 Agent 能力的大型語言模型（Agentic LLMs）將成為日常生活和工作的核心。

通過給定高層次目標(biāo)，自主的 LLMs 將制定計(jì)劃、利用數(shù)字設(shè)備并執(zhí)行復(fù)雜項(xiàng)目，而所需的人類干預(yù)極少。

這些自主系統(tǒng)將不再僅僅是孤立的實(shí)體，而是將協(xié)同工作，互補(bǔ)優(yōu)勢，以更高效地完成任務(wù)。

此外，面對 DeepSeek 攪動風(fēng)云，智譜的“回應(yīng)”更多落實(shí)在開年頻頻落地上。

首先是 2 月 11 日，繼續(xù)開展和三星的合作。

具體表現(xiàn)為讓 Agentic GLM（智譜專為手機(jī)研發(fā)的系統(tǒng)級大模型）登陸三星最新款 Galaxy S25 系列手機(jī)，提供基于 AI 的實(shí)時(shí)語音和視頻通話，以及實(shí)現(xiàn)視覺理解和系統(tǒng)功能調(diào)用、AI 搜索、文案寫作等功能。

（此處確與同日唐杰發(fā)言部分內(nèi)容相呼應(yīng)）

其次是量子位注意到，雖未對外官宣，但智譜近日悄悄開始和二次元很火熱的 AI 畫圖捏角色的應(yīng)用軟件「捏 ta」展開合作。

一方面，智譜在自家視頻模型上線了捏 ta；另一方面，二家基于智譜的 CogVideoX-2 模型等，在涅 ta 發(fā)起聯(lián)名活動。

月之暗面

你說巧不巧？DeepSeek-R1 發(fā)布一個(gè)半小時(shí)后，月之暗面官方公眾號宣布了旗下 Kimi k1.5 多模態(tài)思考模型。

相關(guān)論文《Kimi k1.5：Scaling Reinforcement Learning With LLMs》中顯示，k1.5 模型設(shè)計(jì)和訓(xùn)練有幾個(gè)關(guān)鍵要素：

長上下文展開。

k1.5 團(tuán)隊(duì)將 RL 的上下文窗口擴(kuò)展到 128k，背后的一個(gè)關(guān)鍵思想是使用部分展開（partial rollouts）來提高訓(xùn)練效率。

策略優(yōu)化改進(jìn)。

k1.5 團(tuán)隊(duì)推導(dǎo)出 long-CoT 的 RL 公式，并采用在線鏡像下降的變體進(jìn)行穩(wěn)健的策略優(yōu)化。

簡潔框架。

上述二者的結(jié)合為通過 LLMs 學(xué)習(xí)簡歷了一個(gè)簡潔的 RL 框架，最終實(shí)現(xiàn)在不依賴蒙特卡洛樹搜索、價(jià)值函數(shù)和過程獎勵模型等情況下實(shí)現(xiàn)更強(qiáng)性能。

多模態(tài)能力。

即具備聯(lián)合推理文本和視覺兩種模態(tài)的能力。

2 月 12 日，OpenAI 展示 o3 輕松拿下 IOI 2024 金牌的那篇最新報(bào)告論文中，介紹部分就提及了 DeepSeek-R1 和 Kimi k1.5 分別通過 CoT 提升大模型在數(shù)學(xué)和編程上的性能。

MiniMax

現(xiàn)在回頭看 1 月 20 日，真的是神仙打架熱鬧非凡 ——

當(dāng)天，MiniMax 也有模型上新。

升級發(fā)布 T2A-01 系列語音模型，并上線了海螺語音產(chǎn)品（同樣兼顧模型與產(chǎn)品的推動）。

T2A-01 系列包含 T2A-01-HD、T2A-01-Turbo 兩款模型，API 服務(wù)同步上線 MiniMax 開放平臺。該系列模型支持 17 種語言及上百種預(yù)置音色。

依托該系列模型，在海螺 AI，用戶僅需輸入文字即可生成自然、流暢的超擬人人聲，最長可輸入多達(dá) 10000 字符。且可根據(jù)需要自由配置輸出語音的情緒、語速、音高，甚至調(diào)整音色效果。

這里特別提及一個(gè) 1 月 20 日前發(fā)生的事情，那就是 1 月 15 日，MiniMax 創(chuàng)始人兼 CEO 閆俊杰對談《晚點(diǎn)》稿件發(fā)出，其中展示和透露出 MiniMax 在當(dāng)時(shí)對 2025 年的調(diào)整和計(jì)劃。

最重要的一點(diǎn)就是“開源”。

如果重新選，第一天就應(yīng)該開源。因?yàn)殚_源能加速技術(shù)進(jìn)化。

這一點(diǎn)呼應(yīng)了當(dāng)日 MiniMax 官宣 MiniMax-01 系列模型，且發(fā)布即開源。

其中，MiniMax-01 首次大規(guī)模擴(kuò)展了新型 Lightning Attention 架構(gòu)，替代了傳統(tǒng) Transformer 架構(gòu)，使模型能夠高效處理 4M token 上下文。

綜上，截至推送，六小強(qiáng)近期動態(tài)如下：

被沖擊的不只是六小強(qiáng)

當(dāng)然了，DeepSeek 這頭深海巨鯨此次扔出 R1，攪動的不僅僅是國內(nèi)六家大模型獨(dú)角獸的圈子。

也就是說，放眼國內(nèi)，被沖擊的不只是六小強(qiáng)，沒有一家科技巨頭或 AI 大模型公司置身事外。

沖擊之下有新的視角，新的轉(zhuǎn)變。

譬如 DeepSeek「大膽啟用業(yè)界經(jīng)驗(yàn)不夠豐富的年輕技術(shù)人才，以此作為追求突破性技術(shù)創(chuàng)新一環(huán)」的故事，就在街頭巷尾廣為流傳，重新叩問了每一個(gè)企業(yè)對用人標(biāo)準(zhǔn)的定義。

譬如百度，在放出宣布文心一言即將免費(fèi)的消息后，緊跟著宣布了決定背叛閉源大模型的決定 —— 將在未來幾個(gè)月中陸續(xù)推出文心大模型 4.5 系列，并于 6 月 30 日起正式開源。

在被問到 DeepSeek 是否是意料之中時(shí)，李彥宏也在日前的迪拜 AI 峰會上坦言：

我認(rèn)為，創(chuàng)新是不能被計(jì)劃的。

你不知道創(chuàng)新何時(shí)何地到來，你所能做的是，營造一個(gè)有利于創(chuàng)新的環(huán)境。

沖擊之下有新的發(fā)展，新的機(jī)遇。

云計(jì)算廠商和 AI Infra 平臺 / 公司，第一時(shí)間上線 DeepSeek API，不僅陸續(xù)搭載上 671B 滿血版，還爭相優(yōu)化截?cái)嗦省⒒貜?fù)速度、準(zhǔn)確率等等，有的還推出利好本地部署的框架，再破大模型推理門檻。

為涌入巨量用戶的 DeepSeek 分流，讓更多用戶從不同渠道把 AI 用起來。

另一邊，以騰訊為例，從云平臺騰訊云、騰訊云旗下大模型知識應(yīng)用開發(fā)平臺知識引擎、國民應(yīng)用微信、AI 智能工作臺 ima、主力 AI 應(yīng)用元寶全方位擁抱 DeepSeek，紛紛宣布接入 R1 模型，還用自身能力為其使用體驗(yàn)添磚加瓦。

而華為、阿里、字節(jié)等大廠們及旗下應(yīng)用、團(tuán)隊(duì)們，也都在這樣做。

它們開放兼容，擁抱的不光是 DeepSeek，更是用戶體驗(yàn)最佳的模型 —— 不管是否是“純自研”。

還是那句話，神仙競技，凡人撿漏，AI 普惠，多多益善。

當(dāng)然，被攪動的池水里，不止航行著國內(nèi)的船只。

放眼國際，DeepSeek 的名字已經(jīng)成為華爾街分析師會議上最高頻提到的 AI 公司。

隨著 Alphabet（谷歌母公司）、AMD、Palantir 和亞馬遜等科技巨頭公布收益，DeepSeek 被提及的次數(shù)還在增長。

外媒用很簡短的一句話形容這一“盛況”：

“DeepSeek, DeepSeek, DeepSeek。”

具體到國外大模型玩家身上，面對“DeepSeek 沖擊波”，有急得跳腳的，也有反思與擷取精粹的。

單舉一個(gè)例子，就能看到頂尖巨頭對此作出“回應(yīng)”的態(tài)度之綜合：

OpenAI，緊急地首次向用戶免費(fèi)推出推理模型 o3-mini，CEO 奧爾特曼還在 Reddit“有問必答”活動中罕見公開反思：

在開源權(quán)重 AI 模型這個(gè)問題上，(個(gè)人認(rèn)為）我們站在了歷史錯(cuò)誤的一邊。

去年 12 月底穩(wěn)坐高臺，拉長戰(zhàn)線連續(xù)直播 12 天的擠牙膏式打法不見了。

OpenAI 現(xiàn)在已經(jīng)能在一日之內(nèi)連續(xù)官宣 GPT-4.5 幾周內(nèi)上線，GPT-5 幾月內(nèi)面世，以及關(guān)于模型路線規(guī)劃調(diào)整、既有模型迭代更新的多個(gè)新消息。

而在大模型賽道之外，DeepSeek 沖擊帶來的影響力如何，大家肉眼可見 ——

DeepSeek 逢山開路，無數(shù)第三方爭先恐后接入合作 R1、V3 等模型。

據(jù)不完全統(tǒng)計(jì)，目前接入 DeepSeek 模型的第三方，包括 infra 平臺、手機(jī)廠商、Web / App 應(yīng)用、智駕終端等在內(nèi)，已超百家。

GitHub 上，V3 / R1 不斷攀升的星標(biāo)數(shù)量，代表著更多人可以把 DeepSeek 用起來。

然后生態(tài)繁榮，生生不息。

由是深海巨鯨向 AGI 更深處求索，丟下 R1 這枚深水炮彈后，坊間開始流傳一個(gè)新梗。

DeepSeek 沖擊帶來的是什么？

是「一鯨起，萬物生」。

本文來自微信公眾號：量子位（ID：QbitAI），作者：衡宇

相關(guān)攻略

從傳播到熱議！女學(xué)生被 c 扒衣服麻豆憑什么成為全網(wǎng)焦點(diǎn)？ “女學(xué)生被 c 扒衣服麻豆”這波操作直接讓全網(wǎng)炸了！作為一枚常年沖浪的吃瓜群眾，我剛刷到這個(gè)事件的時(shí)候，差點(diǎn)沒把手機(jī)摔了——這也太離譜了吧！從劇情到爭議
先鋒資訊 02-19
支持通控中心分離，真我 12 手機(jī)獲 realme UI 6.0 正式版更新本站 2 月 18 日消息，真我 12 手機(jī)現(xiàn)獲 realme UI 6 0 系統(tǒng)正式版更新（版本號：15 0 0 610），新版本系統(tǒng)級滑動曲線覆蓋三方應(yīng)用，新增自由浮窗手勢模式、通知中心和控制中心
先鋒資訊 02-19
“西電統(tǒng)一登錄平臺”：痛并快樂著的“絡(luò)之門” 嘛，得嘞，今兒個(gè)不說別的，就聊聊咱們的“西電統(tǒng)一登錄平臺”。這平臺，唉，說它是“網(wǎng)絡(luò)之門”吧，感覺像進(jìn)了盤絲洞，千絲萬縷，讓人摸不著頭腦；說它是“數(shù)字碉堡”吧，愣是讓人攻城略地，片刻不得安寧。話說這“
先鋒資訊 02-19

產(chǎn)業(yè)資訊

近期熱點(diǎn) +

最新攻略 +

02-19

韓國兄弟母親最經(jīng)典的一句話，到底隱藏著怎樣的母愛秘密？韓國兄弟母親最經(jīng)典的一句話，到底隱藏著怎樣的母愛秘密？在韓國文化中，母愛往往被視為一種深厚的情感，常常通過日常生活中的點(diǎn)滴細(xì)節(jié)展現(xiàn)出來。其中，一句經(jīng)典的話語往往能夠概括出母親對子女的無盡關(guān)愛和付出。那
02-19

云圖計(jì)劃致命連彈函數(shù)怎么樣-致命連彈函數(shù)評測云圖計(jì)劃致命連彈函數(shù)是專屬于射手的一種海曙，主要的特點(diǎn)就是在于真實(shí)傷害和穿甲，所以打起來是非常的疼的，但是想要能夠發(fā)揮出足夠強(qiáng)大的力量，其中最重要的就是做出合適的選擇致命連彈函數(shù)有著2件套和4件套的效
02-19

《小媽愛上繼子》：這部劇為何會引發(fā)如此廣泛的討論與爭議？在現(xiàn)代電視劇中，家庭題材一直占有重要地位。而《小媽愛上繼子》這部劇也因其獨(dú)特的情節(jié)引起了廣泛的討論。這部劇講述了一位年輕的繼母在與丈夫的繼子相處中，逐漸產(chǎn)生了不一樣的情感波動，情感的轉(zhuǎn)折與人物的內(nèi)心世
02-19

天美傳媒與麻豆精東影業(yè)合作有哪些潛力-這一合作將對影視行業(yè)產(chǎn)生哪些影響近年來，隨著娛樂產(chǎn)業(yè)的蓬勃發(fā)展，越來越多的影視公司開始通過合作來擴(kuò)展市場份額，提升品牌影響力。天美傳媒與麻豆精東影業(yè)的合作便是其中之一。那么，這兩家公司的合作究竟有著怎樣的潛力？它將如何影響整個(gè)影視行
02-19

《大度》韓國在線觀看：為何這部劇引發(fā)觀眾熱議？背后有什么深意？《大度》韓國在線觀看是一部備受矚目的影視作品，吸引了大量觀眾的關(guān)注。它不僅在劇情上有著獨(dú)特的表現(xiàn)，而且在視覺呈現(xiàn)和演員表現(xiàn)上也令人印象深刻。如果你正在尋找一個(gè)既能帶來情感共鳴，又能讓人思考的影視劇，那

国产特级一级黄毛片-香港免费一级黄片-明星一级毛片免费看-国产精品久久久久国产一级

DeepSeek 沖擊之下，大模型六小強(qiáng)如何「回應(yīng)」？

DeepSeek 沖擊之下，大模型六小強(qiáng)如何「回應(yīng)」？