商湯科技近日揭曉了其2024年度的財務業績,顯示出強勁的增長勢頭。數據顯示,該公司全年總收入實現了10.8%的同比增長,總額達到37.7億元人民幣。尤為生成式AI業務成為了商湯的增長引擎,其收入飆升103.1%,達到24億元人民幣,連續兩年保持了三位數的驚人增速,并已躍升為公司最大的業務板塊。
隨著大模型技術的不斷演進,行業關注點已從最初的單純追求規模擴展,轉向了算力效率、訓練至推理的轉化速度以及實際應用落地等多個維度。這一轉變標志著大模型技術正步入一個全新的發展階段,同時也對工程技術能力和場景協同提出了更高要求。
商湯科技,作為首批“AI原生”企業,早在幾年前便前瞻性地布局了AI基礎設施,并逐步形成了“大裝置-大模型-應用”的核心戰略。這一戰略如今正展現出其在AI領域的深遠影響力和前瞻性。過去三年間,商湯成功構建了“大裝置-大模型-應用”三者緊密協同的生態系統,為各行各業提供了強大的技術支持。
商湯的技術積累在多個領域得到了驗證。在2024年5月發布的SuperCLUE榜單中,商湯的“日日新5.0”(SenseChat V5)以總分80.03分的優異成績奪得中文基準測評的桂冠,不僅在中文綜合成績上超越了GPT-4 Turbo,還刷新了國內大模型在該項測試中的最高紀錄。
這一成就的背后,是商湯在AI基礎設施上的持續投入。面對國內智算中心建設的加速推進,以及算力資源分散、標準不統一等挑戰,商湯通過布局算力運營,實現了對不同標準計算資源的有效整合和高效利用,滿足了不同客戶的多樣化需求。
商湯科技董事長兼CEO徐立表示,當前AI領域的競爭關鍵在于資源的快速整合與高效利用,而商湯提供的基礎服務更貼近AI發展的現狀。他強調,商湯不僅是最懂模型的算力服務商,也是最懂算力的模型服務商。
為了進一步提升大模型的訓練和推理效率,商湯采用了自動化多維并行策略和FP8混合精度訓練,顯著提升了訓練速度。同時,在推理方面,商湯通過低比特量化推理、雙推理引擎支持等技術手段,將推理成本大幅降低,同時保持了模型的性能。
在應用層面,商湯的日日新大模型在生產力工具和交互工具兩個方向上取得了顯著成果。生產力工具直接提升了企業辦公、金融、政務等場景的生產效率,而交互工具則通過2B2C的方式賦能業務伙伴,提升了用戶體驗,滿足了智能陪伴、智能硬件交互、智能營銷等多場景需求。
商湯還積極布局多模態大模型的研究與應用。與傳統的多模態模型不同,商湯采用了“原生融合多模態技術”,從數據層和模型架構層進行全流程融合,實現了感知、思考到輸出的完整過程。這一技術在自動駕駛、機器人等前沿領域展現出了巨大的應用潛力。
在2024年的全球CVPR大會上,商湯科技共有50篇論文入選,展示了其在視覺語言基礎模型領域的深厚積累。同時,商湯的多元化AI產品也在實際應用中取得了顯著成效。例如,“小浣熊家族”智能輔助服務已為數十萬用戶提供了數十億次服務,而絕影平臺也率先實現了原生多模態大模型的車端部署。
通過底層基礎設施和上層應用的協同優化,商湯科技成功構建了堅實的技術壁壘。在基礎設施端,商湯自建的AI數據中心和規模化研發服務使其在傳統基礎設施廠商和AI原生公司中脫穎而出;在應用端,商湯的全棧體系AI應用覆蓋了廣泛行業,大模型則聚焦于原生融合多模態發展。