阿里通義萬相發布2.1版模型,視頻與圖像生成能力大幅提升
阿里巴巴旗下的通義萬相平臺近期推出了其2.1版本的模型升級,此次升級著重增強了視頻與圖像生成的功能,為用戶帶來了更為豐富和優質的創作體驗。
在視頻生成領域,通義萬相2.1版引入了自主研發的高效VAE和DiT架構,這一創新不僅顯著提升了時空上下文建模的能力,還成功實現了中文文字視頻生成的功能。據悉,該功能在VBench榜單中已經取得了領先地位,彰顯了通義萬相在視頻生成技術上的深厚積累。
不僅如此,通義萬相2.1版還為用戶提供了中英文視頻一鍵生成藝術字的便捷功能,并配備了多種視覺效果選項,如過渡效果、粒子效果以及模擬效果等。用戶可以根據自己的創作需求,自由選擇并添加合適的特效,從而進一步提升視頻的表現力和觀賞性。
在圖像生成方面,通義萬相2.1版同樣帶來了顯著的進步。該版本采用了IC-LoRA圖像生成訓練方法,并借助DiT架構來增強文本到圖像的上下文能力。通過這一技術,用戶可以輕松實現多張圖像的拼接與聯合描述,從而生成關聯性強且特征穩定連續的圖像組合。
此次通義萬相2.1版的模型升級,不僅提升了視頻和圖像生成的質量與效率,更為用戶提供了更為多樣化、個性化的創作選擇。無論是想要制作中文文字視頻的用戶,還是需要生成關聯圖像組合的設計師,都能在通義萬相2.1版中找到滿意的解決方案。