吉利汽車集團攜手階躍星辰,在技術創新領域邁出重要一步,共同宣布開源兩款領先的多模態大模型——Step-Video-T2V視頻生成模型與Step-Audio語音模型,此舉標志著兩家企業在人工智能技術研發上的深度合作。
據官方詳細介紹,Step-Video-T2V視頻生成模型在全球開源視頻生成領域內展現出了卓越的實力,無論是參數量還是模型性能均處于領先地位。該模型憑借強大的技術支撐,能夠直接生成分辨率為540P、包含204幀的高質量視頻,為用戶帶來前所未有的視覺體驗。
與此同時,階躍Step-Audio語音模型作為業內首款產品級的開源語音交互模型,其表現同樣令人矚目。該模型具備高度智能化特點,能夠根據不同的場景需求,靈活生成包含情緒、方言、語種、歌聲及個性化風格的語音表達。在與用戶的交互中,Step-Audio展現出了自然流暢、情商高的對話能力,極大地提升了用戶體驗。
階躍Step-Audio還支持不同角色的音色克隆功能,這一創新技術使得模型能夠模擬出多種角色的聲音特征,進一步豐富了語音交互的多樣性和趣味性。
在參數方面,階躍Step-Video-T2V視頻生成模型擁有高達300億的參數量,這一龐大的參數規模為其強大的視頻生成能力提供了堅實的基礎。而Step-Audio語音模型則通過精細的模型設計和優化,實現了在語音交互領域的突破和創新。
此次開源的兩款模型,不僅展示了階躍星辰與吉利汽車集團在人工智能技術研發上的雄厚實力,也為相關行業提供了寶貴的技術資源和參考。未來,隨著這兩款模型的廣泛應用和推廣,相信將在視頻生成和語音交互領域掀起新的技術浪潮。
階躍星辰與吉利汽車集團的此次合作,也預示著雙方在人工智能領域將展開更加深入和廣泛的探索與合作。未來,雙方將繼續攜手共進,共同推動人工智能技術的創新與發展,為人類社會帶來更多的便利和驚喜。