在人工智能的大模型技術(shù)領(lǐng)域,階躍星辰公司正逐漸嶄露頭角,其底層基礎(chǔ)模型能力備受業(yè)界認(rèn)可。盡管這種認(rèn)可主要局限于對該領(lǐng)域有深入了解的專業(yè)人士,但階躍星辰近期在LiveBench榜單上的亮眼表現(xiàn),無疑將其技術(shù)實(shí)力推向了公眾視野。
LiveBench,被譽(yù)為“世界上第一個不可玩弄的LLM基準(zhǔn)測試”,其權(quán)威性和公正性在業(yè)界享有盛譽(yù)。最新榜單顯示,階躍星辰自研的萬億參數(shù)語言大模型Step-2,在國產(chǎn)基座大模型中獨(dú)占鰲頭,成績直逼OpenAI的頂尖模型,超越了包括GPT-4在內(nèi)的多個國際主流模型。在全球排名中,階躍星辰緊隨OpenAI和Anthropic之后,位列第五,成為中國唯一進(jìn)入前十的大語言模型。
此次榜單的發(fā)布,不僅是對階躍星辰技術(shù)實(shí)力的有力證明,更是對中國大模型技術(shù)發(fā)展的一次重要肯定。在LiveBench的多項(xiàng)測評標(biāo)準(zhǔn)中,Step-2在IF Average(指令跟隨)方面的表現(xiàn)尤為突出,以86.57的高分位居榜首,超越了包括OpenAI最新模型在內(nèi)的所有國內(nèi)外語言大模型。這一成績,充分展示了Step-2在復(fù)雜指令理解和執(zhí)行方面的卓越能力。
階躍星辰的技術(shù)突破,并非一蹴而就。自2024年3月發(fā)布國內(nèi)首個由創(chuàng)業(yè)公司研發(fā)的萬億參數(shù)語言大模型預(yù)覽版Step-2以來,階躍星辰一直在全力提升自身底層實(shí)力。從在中文大模型基準(zhǔn)測評機(jī)構(gòu)SuperCLUE上登頂國內(nèi)多模態(tài)大模型榜首,到本次在LiveBench上獲得中國大模型第一,階躍星辰的技術(shù)進(jìn)步有目共睹。
Step-2的成功,離不開其背后強(qiáng)大的技術(shù)支撐。階躍星辰采用了創(chuàng)新的MoE架構(gòu),通過部分專家共享參數(shù)、異構(gòu)化專家設(shè)計(jì)等創(chuàng)新設(shè)計(jì),實(shí)現(xiàn)了對模型的高效訓(xùn)練。同時(shí),階躍星辰在系統(tǒng)能力方面也取得了顯著突破,6D并行、極致顯存管理、完全自動化運(yùn)維等關(guān)鍵技術(shù)的突破,為Step-2的高效訓(xùn)練提供了有力保障。
除了Step-2之外,階躍星辰的Step系列還包括Step-1.5V多模態(tài)大模型和Step-1X圖像生成大模型。Step-1.5V在視頻理解和感知能力方面表現(xiàn)出色,能夠準(zhǔn)確識別視頻中的物體、人物和環(huán)境,理解視頻的整體氛圍和人物情緒。而Step-1X則具備更強(qiáng)的深度語義對齊能力和細(xì)節(jié)生成能力,能夠生成與中國文化深度契合的高質(zhì)量圖像。
基于Step系列大模型的技術(shù)實(shí)力,階躍星辰的產(chǎn)品開發(fā)也取得了顯著進(jìn)展。其C端產(chǎn)品躍問,通過引入圖像交互“即拍即問”功能,解決了用戶在文字和語音交互中難以準(zhǔn)確描述的痛點(diǎn),獲得了用戶的一致好評。目前,Step-2已經(jīng)接入躍問APP和網(wǎng)頁端,開發(fā)者可以通過API接入使用Step-2,進(jìn)一步拓展了階躍星辰的技術(shù)應(yīng)用場景。
階躍星辰的崛起,不僅為中國大模型技術(shù)的發(fā)展注入了新的活力,也為全球AI領(lǐng)域帶來了新的競爭格局。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,階躍星辰正以其階躍之力,向著更加廣闊的星辰大海進(jìn)發(fā)。