今天,國產(chǎn)大模型再次迎來硬核進(jìn)階!
科大訊飛小年放出推理王炸——星火大模型X2。
什么概念呢?從星火X1.5到星火X2,僅僅間隔3個(gè)月,推理性能直接飆升50%~
不僅快,而且猛。更重要的是,完全基于國產(chǎn)算力。

一方面,模型通用能力突出,Benchmark評測穩(wěn)居行業(yè)一流水平,即使是和GPT-5.2、Gemini-3-Pro這些國際頂尖模型同臺(tái)競技也毫不遜色。
尤其是在數(shù)學(xué)計(jì)算、邏輯推理等核心能力上表現(xiàn)亮眼;同時(shí)130多種語言綜合能力依舊穩(wěn)穩(wěn)在線,繼續(xù)保持“國家隊(duì)”水準(zhǔn)。

另一方面,星火X2將升級的重點(diǎn)放在了場景落地上。
依靠深度優(yōu)化的算法、高質(zhì)量垂域數(shù)據(jù)和行業(yè)專家的參與,三位一體推動(dòng)行業(yè)大模型更進(jìn)一步,為各行各業(yè)提供更精準(zhǔn)、更具實(shí)操性的支持。
正如科大訊飛董事長劉慶峰在1024開發(fā)者節(jié)所說——做更懂你的AI,滿血?dú)w來的星火X2現(xiàn)在用通用底座+行業(yè)專才雙輪驅(qū)動(dòng),再次印證了其在國產(chǎn)大模型賽道的實(shí)踐底氣。
星火大模型作為訊飛AI架構(gòu)的底層基石,按照慣例,每一次升級,都有著顯著的能力躍遷。
這一次更甚:直接將深度推理訓(xùn)練效率再度提升50%。
眾所周知,隨著Scaling Laws邊際效益遞減,越到后期,大模型性能提升就越難。即使是1%的能力躍遷,都意味著算力和算法的指數(shù)級倍增。
而在行業(yè)普遍面臨增長瓶頸的當(dāng)下,星火X2能夠?qū)崿F(xiàn)50%的性能躍遷實(shí)屬不易。
其背后釋放的信號,比數(shù)字本身更值得深思,這透露出科大訊飛在模型核心架構(gòu)和技術(shù)上有了更深層次的突破。
具體先看核心能力對比。
橫向?qū)Ρ葋砜矗腔餢2 Thinking的各項(xiàng)評分已經(jīng)穩(wěn)居國產(chǎn)第一梯隊(duì),在多個(gè)維度上也與GPT-5.2 (xhigh)和Gemini-3-Pro非常接近。
其中,在多語言和翻譯能力上顯著優(yōu)于友商模型,在數(shù)學(xué)和邏輯推理上也緊隨GPT和Gemini其后。

再看星火X2在高難度基準(zhǔn)測試中的表現(xiàn),可以說含金量杠杠的。
比如在AIME 2025測試中,星火X2斬獲95.7分,僅次于GPT-5.2 (xhigh),展現(xiàn)出其處理競賽級數(shù)學(xué)的頂尖能力。
在MMLU Pro里,星火X2的87.3分不僅在國產(chǎn)模型中奪冠,且與GPT-5.2持平,說明其知識(shí)廣度和深度已達(dá)國際一流水準(zhǔn)。
在代表未來方向的智能體維度上,星火X2也是再度領(lǐng)跑國產(chǎn)模型,驗(yàn)證了它在理解復(fù)雜指令和調(diào)用工具方面的進(jìn)階。

總的來說,星火X2在數(shù)據(jù)上的亮眼表現(xiàn),不僅彰顯了訊飛在數(shù)學(xué)和邏輯推理領(lǐng)域的領(lǐng)先地位,更標(biāo)志著其通用智力已足以比肩國際頂尖模型。
接下來咱們還是實(shí)測見真章。
先來一道去年11月哈佛-麻省理工數(shù)學(xué)錦標(biāo)賽(HMMT)里的英文題目試試水~
之所以選擇這個(gè)題目,一則是避免數(shù)據(jù)污染,題目比較新,能夠避免模型“見”過該題目;其二是HMMT是全球難度最高的數(shù)學(xué)競賽之一,能夠更好地考驗(yàn)星火X2的即時(shí)邏輯推理能力。
A positive integer n is imbalanced if strictly more than 99 percent of the positive divisors of n are strictly less than 1 percent of n. Given that M is an imbalanced multiple of 2000, compute the minimum possible number of positive divisors of M.
果不其然非常出色,星火X2迅速給出了詳細(xì)的解答過程和正確答案。換言之,它徹底吃透了英文數(shù)學(xué)題目的底層邏輯,而非簡單依賴中文語境。

再試試西班牙語:

同樣也是流暢給出了正確結(jié)果。

那么它是如何做到的呢?
首先,星火X2在模型架構(gòu)上繼承了星火X1.5的MoE稀疏架構(gòu),參數(shù)同樣為293B。
但與之不同的是,在星火X1.5的基礎(chǔ)之上,星火X2結(jié)合權(quán)重量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分層通信進(jìn)行了針對性技術(shù)創(chuàng)新:
訓(xùn)推采樣校準(zhǔn)強(qiáng)化學(xué)習(xí)算法:
在大模型,尤其是MoE架構(gòu)中,往往存在訓(xùn)推分布不一致的問題,這會(huì)導(dǎo)致模型在訓(xùn)練階段學(xué)到的規(guī)律無法直接適用到實(shí)際推理應(yīng)用中,甚至?xí)霈F(xiàn)模型性能坍塌。
為此,星火X2提出訓(xùn)練與推理概率重采樣自適應(yīng)校準(zhǔn)算法,讓算法能夠根據(jù)訓(xùn)練的實(shí)時(shí)進(jìn)度,自動(dòng)調(diào)整校準(zhǔn)力度,確保專家模型能夠時(shí)刻保持邏輯閉環(huán)。
遞歸式高難數(shù)據(jù)合成方法:
在模型訓(xùn)練中,由于深度推理數(shù)據(jù)極度匱乏,星火X2專門設(shè)計(jì)了多輪迭代式推導(dǎo)的數(shù)據(jù)合成方案。
通過多輪迭代和遞歸修正,能夠最終形成一套從問題到正確推導(dǎo)過程的高質(zhì)量語料,完成對模型深度推理準(zhǔn)確率的提升。
多階段RL高吞吐采樣方法:
在突破國產(chǎn)算力瓶頸上,星火X2設(shè)計(jì)了P/D(Prefill/Decoder)兩階段分離的多階段推理采樣方案。
他們將大模型推理過程中物理特性完全不同的兩個(gè)階段——Prefill(預(yù)填充)和Decoding(解碼),從硬件執(zhí)行層面進(jìn)行徹底分離,直接解決了國產(chǎn)化平臺(tái)在高吞吐采樣下的效率干擾,訓(xùn)練效率提升10%。
服務(wù)高性能部署優(yōu)化算法:
這一步是讓星火X2推理性能大幅度提升的關(guān)鍵。
通過對模型進(jìn)行輕量化壓縮,可實(shí)現(xiàn)單臺(tái)服務(wù)器內(nèi)部的批量專家并行,也就是單機(jī)大EP并行部署。
充分解決了國產(chǎn)算力平臺(tái)的關(guān)鍵瓶頸——輕量化落地和高效推理,讓模型不僅能跑,還能跑得快。
除了通用能力的全面釋放,星火大模型此次升級的重中之重,在于深度場景化。
這是科大訊飛從星火大模型誕生之初,就始終強(qiáng)調(diào)的核心邏輯:要在發(fā)展技術(shù)力的同時(shí),更注重技術(shù)與用戶體驗(yàn)、場景落地的結(jié)合。
具體體現(xiàn)在醫(yī)療、教育、汽車和智能體四個(gè)方面:
依托星火X2底座的算力優(yōu)化與推理躍遷,星火醫(yī)療大模型的核心能力也得到了全面進(jìn)化,繼續(xù)保持行業(yè)翹楚。
在基于居民健康檔案的智能健康分析、智能報(bào)告解讀、運(yùn)動(dòng)飲食建議、輔助診療、智能用藥審核等高精度核心場景中,星火大模型更是顯著優(yōu)于GPT-5.2和另外兩款國產(chǎn)大模型,樹立了醫(yī)療專業(yè)大模型的新標(biāo)桿。

此外,星火醫(yī)療大模型也已率先通過上海市醫(yī)療大模型應(yīng)用檢測驗(yàn)證中心評測驗(yàn)證。
這是國內(nèi)首個(gè)專門針對醫(yī)療大模型的評測平臺(tái),代表了目前國內(nèi)最頂尖、最權(quán)威的標(biāo)準(zhǔn),說明訊飛已經(jīng)在醫(yī)療AI合規(guī)上走到了行業(yè)前列。
而在面向用戶的C端,“訊飛曉醫(yī)”APP也同步完成升級,包括多輪主動(dòng)問診、多輪咨詢問答、問用藥、檢查檢驗(yàn)單解讀、體檢報(bào)告單解讀等多任務(wù)。

可見,“訊飛曉醫(yī)”在星火X2的加持下,已經(jīng)成為了普通用戶可用的且能力業(yè)界頂尖的數(shù)字醫(yī)生。
而在教育領(lǐng)域,星火大模型也讓原先基礎(chǔ)的搜索工具,進(jìn)化為一對一特級老師。
其率先上線錯(cuò)因貫穿的個(gè)性化學(xué)習(xí)能力,能夠通過你的整張卷子、整道題的解題思路,精準(zhǔn)捕捉到你的知識(shí)點(diǎn)黑洞,比如是定理沒記牢呢,還是運(yùn)算粗心大意了。
同時(shí)它能夠像閱卷老師一樣,在錯(cuò)誤之處精準(zhǔn)批注,實(shí)現(xiàn)步驟級批改。
這種模式下,AI更符合蘇格拉底式的教學(xué)理念,也就是通過不斷提問,引導(dǎo)學(xué)生自己思考并得出結(jié)論。
它不是直接告訴學(xué)生答案,而是教會(huì)學(xué)生如何進(jìn)行思維拆解、如何自己悟出來。而這類啟發(fā)式講解,也是未來AI教育的主導(dǎo)路線。

體現(xiàn)在硬件上,就是科大訊飛的AI學(xué)習(xí)機(jī)。它在1對1精準(zhǔn)學(xué)、答疑輔導(dǎo)和互動(dòng)課等多功能上,持續(xù)領(lǐng)先同行業(yè),能夠幫助學(xué)生更精準(zhǔn)地提高學(xué)習(xí)效率,以及增強(qiáng)學(xué)習(xí)興趣。
與此同時(shí),星火大模型在多尺寸中小模型上也同步進(jìn)行了升級,并精準(zhǔn)將其應(yīng)用在汽車智能座艙交互系統(tǒng)中。
過去用戶必須說出精準(zhǔn)指令才能實(shí)現(xiàn)交互,比如調(diào)低空調(diào)至24度。但如果說“我有點(diǎn)冷”或者“風(fēng)太大”這類模糊指令,系統(tǒng)往往只會(huì)回復(fù)“對不起,我沒有聽懂”。
但現(xiàn)在這個(gè)問題隨著星火X2的到來迎刃而解。
模型在人人/人機(jī)對話判斷、模糊意圖理解、高情商回復(fù)等方面的交互體驗(yàn)顯著提升,尤其是在模糊意圖上實(shí)現(xiàn)了跨越式突破,終于具備了實(shí)際可用的語義聯(lián)想和推理能力。

另外值得關(guān)注的是,智能體的突破。
星火X2從根本上解決了智能體在工作環(huán)境中長期以來的痛點(diǎn),在長時(shí)復(fù)雜任務(wù)規(guī)劃、多工具組合調(diào)用以及長上下文等方面均實(shí)現(xiàn)了顯著提升。
其中星辰Agent平臺(tái),整合了語音識(shí)別、語音交互、圖像理解等百余種能力,集成超130萬個(gè)智能體,在星火X2幫助下,進(jìn)一步強(qiáng)化了智能體在思考和執(zhí)行上的表現(xiàn),更能支撐起復(fù)雜的企業(yè)場景。
比如面向企業(yè)采購場景的招采智能體,核心場景效率提升超3倍,還能像搭積木一樣定制專用智能體,開發(fā)時(shí)間從原先的幾天直接縮短至分鐘級。
目前訊飛開放平臺(tái)已正式上線星火X2 API,平臺(tái)新注冊開發(fā)者可直接領(lǐng)取100萬Tokens免費(fèi)額度。
在訊飛星火網(wǎng)頁版和APP均可體驗(yàn),星火APP 5.2.0新版本也同步上線~
總的來說,星火X2更像是一塊國產(chǎn)算力的試金石。
在過去幾年里,國內(nèi)AI行業(yè)發(fā)展受限的根本原因就在于算力。算力被扼住脖子后,模型性能始終無法突破國際一流水平。
而當(dāng)所有人都在質(zhì)疑國產(chǎn)算力時(shí),訊飛咬牙給它做成了。而且是國內(nèi)主流大模型中,唯一基于全國產(chǎn)算力訓(xùn)練的通用大模型。

模型實(shí)現(xiàn)了完全自主可控,一是算力自主,模型的訓(xùn)練和推理過程完全基于全國產(chǎn)算力平臺(tái);二是技術(shù)自主,整個(gè)模型框架均由訊飛自研,在此基礎(chǔ)上構(gòu)建起特有的研發(fā)生態(tài)。
核心原因就在于訊飛走了最務(wù)實(shí)的一條路:不再單純追求實(shí)驗(yàn)室里的高分,而是依據(jù)自己深耕多年的行業(yè)經(jīng)驗(yàn)一舉扎根在最難的場景應(yīng)用中。
訊飛順勢提出了“1+N”戰(zhàn)略,即1個(gè)通用底座大模型,和N個(gè)底座大模型賦能的多領(lǐng)域行業(yè)大模型,然后通過軟硬一體化,讓大模型搭載到硬件上,以看得見摸得著的方式迅速落地轉(zhuǎn)化。
簡單來說,訊飛的差異化路徑就是底座自主、硬件協(xié)同、場景為王。
而星火X2反向證明了這條路值得繼續(xù)探索,即使是在算力重壓下,單靠算法創(chuàng)新和場景優(yōu)化也能補(bǔ)足當(dāng)中的差距,換來中國AI在全行業(yè)的先發(fā)優(yōu)勢。
顯然,國產(chǎn)大模型已步入應(yīng)用紅利期,而訊飛率先摘到了果實(shí)。
特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時(shí)并不代表贊成其觀點(diǎn)或證實(shí)其描述,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。
Copyright ? 2022 上??评讜?huì)展服務(wù)有限公司 旗下「智慧醫(yī)療網(wǎng)」版權(quán)所有 ICP備案號:滬ICP備17004559號-5