阿里云團(tuán)隊(duì)近期公布了一項(xiàng)重大進(jìn)展,正式向公眾開源了其最新的推理模型——通義千問 QwQ-32B。緊隨其后,摩爾線程智能科技(北京)股份有限公司迅速宣布,在該模型發(fā)布后不久,便成功實(shí)現(xiàn)了對(duì)其的支持。
摩爾線程官方詳細(xì)介紹稱,他們利用自主研發(fā)的大語(yǔ)言模型高速推理框架 vLLM 和 MT Transformer 推理引擎,成功部署了 QwQ-32B。在實(shí)際應(yīng)用中,該模型展現(xiàn)出了出色的推理性能和高度穩(wěn)定性。這一成果不僅彰顯了摩爾線程在 AI 模型支持方面的技術(shù)實(shí)力,也進(jìn)一步驗(yàn)證了其 MUSA 架構(gòu)和全功能 GPU 在生態(tài)兼容與快速響應(yīng)方面的獨(dú)特優(yōu)勢(shì)。
為了讓更多用戶能夠體驗(yàn)到這一先進(jìn)技術(shù),摩爾線程將 QwQ-32B 模型開放上線至其模型廣場(chǎng)“夸娥工場(chǎng)”。用戶只需訪問指定網(wǎng)址,即可輕松體驗(yàn)這一高性能推理模型。這一舉措無(wú)疑將極大地推動(dòng) AI 技術(shù)在更多領(lǐng)域的應(yīng)用和發(fā)展。
據(jù)摩爾線程官方提供的體驗(yàn)地址顯示,夸娥工場(chǎng)體驗(yàn)地址為:https://playground.mthreads.com,而 QwQ-32B 的專屬體驗(yàn)地址則為:https://playground.mthreads.com:12019。通過這些平臺(tái),用戶可以深入了解并體驗(yàn) QwQ-32B 模型的強(qiáng)大功能。
早前,阿里云通義千問官方曾透露,QwQ-32B 是一款擁有 320 億參數(shù)的推理模型。盡管其參數(shù)量相對(duì)較少,但其性能卻足以與擁有 6710 億參數(shù)(其中 370 億被激活)的 DeepSeek-R1 相媲美。這一數(shù)據(jù)無(wú)疑令人驚嘆,也進(jìn)一步證明了阿里云在 AI 技術(shù)領(lǐng)域的深厚積累和創(chuàng)新能力。
隨著 QwQ-32B 模型的開源和摩爾線程的快速支持,我們有理由相信,這一高性能推理模型將在未來(lái)在更多領(lǐng)域發(fā)揮重要作用,推動(dòng) AI 技術(shù)的不斷發(fā)展和創(chuàng)新。