在2025年初,字節跳動旗下的豆包大模型迎來了全面升級,1.5版本正式在火山方舟平臺上線。此次升級中,豆包通用模型pro在多個權威測評中的表現尤為亮眼,其綜合得分超越了GPT-4o、Claude 3.5 Sonnet等業界頂尖模型,標志著豆包大模型的效果已達到全球領先水平。
豆包通用模型pro不僅在性能上實現了飛躍,同時在推理成本上也做到了極致平衡。該模型采用了高效的MoE結構,使得性能杠桿提升至7倍,配合自研的高性能推理系統,實現了10毫秒級的低延遲。豆包大模型1.5版本還建立了高度自主的數據生產體系,確保數據的獨立性和可靠性,未使用任何外部模型生成的數據。
除了通用模型pro的顯著增強,豆包大模型1.5版本還對視覺理解模型進行了大幅優化,并推出了實時語音模型。盡管功能更加全面,但豆包大模型1.5版本的價格卻保持不變,加量不加價,繼續為用戶提供高性價比的服務。
在實際測試中,豆包大模型1.5版本的綜合能力得到了充分展現。在知識、代碼、推理和中文權威測評基準上,Doubao-1.5-pro均取得了最佳成績。例如,在代碼能力測試中,針對一個創建簡單Web API的問題,Doubao-1.5-pro不僅提供了可運行的完整代碼,還詳細說明了如何在本地運行和測試,其輸出格式和代碼說明均優于GPT-4o。
在知識能力測試中,Doubao-1.5-pro同樣表現出色。針對唐代包含“過年”主題的古詩問題,Doubao-1.5-pro不僅給出了更多數量的答案,還對每個答案進行了詳細的解析,包括原文和背景介紹,使得用戶能夠更深入地了解問題。相比之下,國內某大模型產品的答案則顯得較為簡略。
在推理能力測試中,Doubao-1.5-pro同樣展現出了強大的實力。針對一個關于理財選擇的復雜問題,Doubao-1.5-pro不僅給出了針對性的建議,還條理清晰地分析了不同理財產品的收益情況,滿足了用戶的基本需求。而另一款模型則因數據庫問題,給出的回答相對空泛。
豆包大模型1.5版本還推出了更加輕量化的Doubao-1.5-lite模型。該模型具備極致的響應速度,適用于對時延有更高要求的場景。在實際測試中,Doubao-1.5-lite在處理中等難度的推理問題和專業知識題目時,均表現出了出色的性能和響應速度。
在視覺理解方面,豆包大模型1.5版本的Doubao-1.5-vision-pro同樣令人驚艷。該模型在多模態數據合成、動態分辨率、多模態對齊和混合訓練等方面進行了全面升級,進一步增強了視覺推理、文字文檔識別、細粒度信息理解和指令遵循等方面的能力。在實際測試中,Doubao-1.5-vision-pro對復雜圖表、低清晰度圖片和字跡潦草的手寫圖片等均表現出了精準的識別和理解能力。
此次豆包大模型1.5版本的升級和火山引擎在B端市場的進一步拓展,共同推動了AI技術的普惠化。字節跳動通過不斷優化推理成本、提升模型性能和技術優勢,為用戶提供了更加高性價比的服務,也為AI技術的商業化落地探索出了新的道路。