吉利汽車集團與階躍星辰攜手,向全球開發者開放兩大創新多模態大模型。這一里程碑式的合作標志著雙方在算力算法、場景訓練等領域的深度合作取得了顯著成果,共同推動了人工智能技術的邊界。
在此次開源行動中,階躍星辰的Step系列多模態大模型成為焦點。其中,階躍Step-Video-T2V作為全球參數量最大、性能最優的開源視頻生成模型,其參數量高達300億,能夠直接生成高質量的視頻,分辨率達到540P,每秒幀數高達204幀。這一突破性技術確保了生成視頻的高信息密度和一致性,為用戶提供了前所未有的視頻創作體驗。用戶現在即可通過躍問APP體驗這一先進技術。
階躍Step-Video-T2V在復雜場景、人物美感、視覺創意等方面展現出強大的生成能力,其語義理解和指令遵循能力尤為突出。為了全面評測這一模型的性能,階躍星辰還發布了針對文生視頻質量的新基準數據集Step-Video-T2V-eval,該測試集涵蓋了11個內容類別,旨在全面評估生成視頻的質量。評測結果顯示,階躍Step-Video-T2V在多個關鍵指標上均顯著超越現有開源視頻模型。
與此同時,階躍星辰還推出了行業內首款產品級開源語音交互模型——階躍Step-Audio。這款模型能夠根據不同的場景需求生成情緒、方言、語種等多樣化的語音表達,實現高質量對話。其生成的語音具有超自然、高情商等特征,能夠滿足影視娛樂、社交、游戲等多個行業的應用需求。在主流公開測試集中,階躍Step-Audio的性能均位列第一,特別是在漢語水平考試六級評測中表現尤為突出。
吉利汽車集團CEO淦家閱表示,吉利一直致力于成為智能汽車AI科技的引領者和普及者。通過構建端到端的自研體系和生態聯盟,吉利已經形成了完善的智能吉利科技生態網。此次與階躍星辰的合作,將進一步推動吉利在智能駕駛、智能座艙等方面的技術創新,為用戶提供更智能、更高階的出行體驗。
階躍星辰創始人、CEO姜大昕博士也強調了開源的重要性。他表示,階躍星辰一直以實現通用人工智能(AGI)為目標,而開源是實現這一目標的關鍵途徑。通過開源,階躍星辰希望能夠與全球開發者共同分享技術成果,推動多模態模型技術的發展,并期待與社區開發者共同拓展模型技術的邊界。