在人工智能領域,一場關于技術革新與生態(tài)構建的盛宴于近日拉開帷幕。在這場備受矚目的生態(tài)開放日上,階躍星辰,一家被業(yè)界譽為“AI六小虎”的成員,以其獨特的姿態(tài)和前瞻性的布局,成為了全場焦點。
回顧2024年,階躍星辰無疑是模型層競爭中的佼佼者。這家起步較晚的公司,卻以驚人的速度發(fā)布了涵蓋語言、語音、視覺、推理等多個模態(tài)的11款模型,展現(xiàn)了其在多模態(tài)技術上的深厚積累。
階躍星辰的模型矩陣,如同一顆顆璀璨的星辰,照亮了AI探索的征途。
階躍星辰的CEO姜大昕曾透露,公司自成立之初便明確了AGI(通用人工智能)的發(fā)展路徑:從單模態(tài)到多模態(tài),再到多模態(tài)理解和生成的統(tǒng)一,最終邁向世界模型和AGI。而2024年,正是階躍星辰邁向多模態(tài)關鍵節(jié)點的一年。
然而,在階躍星辰開啟“多模態(tài)理解和生成的統(tǒng)一”探索之前,一條名為DeepSeek的“鯰魚”攪動了整個大模型賽道。DeepSeek不僅通過API價格戰(zhàn)將大模型價格拉低至1元/百萬tokens,還開源了推理模型R1,引發(fā)了業(yè)界對Scaling Law暴力美學的深刻反思。
DeepSeek的崛起,對階躍星辰等六小虎構成了不小的挑戰(zhàn)。R1等高性能模型的開源,讓閉源模型的商業(yè)化之路變得更加艱難。同時,R1采用的低投入強化學習訓練范式,也讓六小虎的高估值和燒錢模式受到了質疑。
面對DeepSeek的沖擊,階躍星辰選擇了以開源作為回應。在R1發(fā)布后不久,階躍星辰便開源了兩款多模態(tài)模型,這一舉動被視為其捍衛(wèi)技術地位的無聲宣言。這兩款模型,一款是參數(shù)量達到300億的圖生視頻模型Step-Video-T2V,另一款則是1300億參數(shù)的語音交互模型Step-Audio,它們與DeepSeek注重的文本模型形成了鮮明對比。
階躍星辰開源的多模態(tài)模型,無疑為行業(yè)注入了新的活力。
在探索AGI的征途中,階躍星辰將多模態(tài)推理視為模型發(fā)展的重要方向。這一觀點在行業(yè)內得到了廣泛認同。百度集團執(zhí)行副總裁沈抖就曾預測,行業(yè)的重心將從訓練轉移到推理,多模態(tài)將成為主流需求。
階躍星辰在多模態(tài)推理模型上的進展令人矚目。在生態(tài)開放日上,階躍星辰宣布與清華大學聯(lián)合研發(fā)的Open-Reasoner-Zero,這是首個從預訓練模型直接進行大規(guī)模強化學習的開源推理模型,其效率是DeepSeek-R1-Zero的25倍。階躍星辰還在推進一項內部項目——視覺推理模型,該模型能夠實現(xiàn)視覺空間下的慢思考,能夠理解和解答復雜的視覺問題。
階躍星辰在多模態(tài)推理模型上的突破,為AI的發(fā)展開辟了新的道路。
在模型落地方向,階躍星辰看好AI Agent的潛力。姜大昕認為,2025年將是Agent的爆發(fā)年。他提到,影響Agent發(fā)展的兩個關鍵因素——多模態(tài)和慢思考,在2024年都取得了顯著進展。階躍星辰將Agent分為垂類Agent和智能終端Agent兩大類,并積極與下游客戶進行生態(tài)共創(chuàng)。
階躍星辰的Agent合作生態(tài),展現(xiàn)了其在智能終端和垂類領域的廣泛布局。
在生態(tài)開放日的圓桌論壇上,曠視科技創(chuàng)始人印奇以自動駕駛公司“千里科技”董事長的身份亮相。他認為,目前最成功的AI產品仍是特斯拉和抖音,但大模型將為應用帶來更大的市場空間。印奇的出席,無疑為這場生態(tài)開放日增添了更多看點。