在AI大模型領域,一場關于預訓練成本的較量正悄然上演。近期,國內知名大模型公司零一萬物發布了其最新的預訓練旗艦模型——Yi-Lightning,號稱“閃電”,在國際權威榜單LMSYS上一舉超越了OpenAI今年5月發布的GPT-4o和Anthropic的Claude 3.5 Sonnet,排名世界第六,中國第一。
這一成就標志著中國大模型在全球競爭中取得了突破性進展,零一萬物緊隨OpenAI、Google之后,躋身全球前三大模型企業行列。
Yi-Lightning不僅在性能上有所提升,其推理速度也實現了質的飛躍。相比上半年發布的Yi-Large,首包時間減少了一半,最高生成速度提升了近四成,堪稱“極速”。同時,該模型的推理成本也大幅降低,每百萬token僅需0.99元,接近行業最低價。
Yi-Lightning的出色表現得益于零一萬物在多個維度上的扎實儲備,包括芯片人才、推理人才、基礎架構人才和算法人才等。這使得零一萬物在面對大模型預訓練的高門檻時,依然能夠堅持“模基共建”的戰略,不斷推動模型性能的優化和推理成本的降低。
在LMSYS Chatbot Arena總榜上,Yi-Lightning的成績同樣出眾。它超越了國內外多個優質模型,包括xAI發布的Grok-2-08-13、智譜發布的GLM-4-Plus等,在中文分榜上與世界第二名的模型并列。在多輪對話、數學能力、代碼能力等多個分榜上,Yi-Lightning也取得了世界前列的優異成績。
零一萬物之所以能夠在短時間內取得如此顯著的進步,與其獨特的混合專家模型架構(MoE)和一系列技術創新密不可分。例如,Yi-Lightning采用了混合注意力機制(Hybrid Attention),旨在平衡模型在處理長序列數據時的性能和計算資源消耗。同時,動態Top-P路由機制的引入也使得Yi-Lightning能夠更加智能地適應各種任務需求,實現“極速推理”。
隨著Yi-Lightning的發布,零一萬物在AI大模型領域的應用探索也進一步擴展。其最新推出的AI 2.0數字人產品已接入Yi-Lightning,在零售和電商等場景中展現出強大的實時互動能力和話術生成能力。某酒旅企業在接入該數字人直播后,GMV較此前上升了170%。
Yi-Lightning的推出不僅彰顯了中國在大模型領域的強大技術實力,也為中國大模型公司的發展提供了新的思路。即堅持“模型+AI Infra+應用”三位一體的全棧式布局,以國際領先的基座模型為基礎,積極探索企業級解決方案,推動整個大模型行業形成健康的生態。
目前,Yi-Lightning已上線Yi大模型開放平臺(https://platform.lingyiwanwu.com/),每百萬token僅需0.99元,支持開發者與企業客戶輕松實現SOTA大模型自由。這一舉措無疑將進一步推動大模型技術的普及和應用。
零一萬物的成功也引發了對中國大模型行業未來發展的深入思考。在算力受限的情況下,中國基座模型的研發能力如何追趕國外頂尖大模型?零一萬物的實踐表明,通過技術創新和全棧式布局,中國大模型公司有望在全球競爭中脫穎而出,打造新質生產力。
展望未來,隨著大模型技術的不斷發展和普及,其應用場景也將更加廣泛。零一萬物將繼續堅持“模基共建”的戰略,不斷探索大模型在各個領域的應用潛力,為推動人工智能技術的發展和應用貢獻自己的力量。