近期,據Information網站報道,meta公司,即Facebook的母公司,已成立四個專項研究團隊,深入探索國產大模型DeepSeek的核心機制。此舉旨在通過分析DeepSeek的工作原理,來優化meta自家的大模型Llama。
值得注意的是,就在不久前,DeepSeek-R1推理大模型正式面世。據官方披露,DeepSeek-R1在后訓練階段大規模運用了強化學習技術,即便在標注數據極為有限的情況下,也顯著提升了模型的推理能力。在數學、代碼編寫以及自然語言推理等多項任務上,DeepSeek-R1的性能已可媲美OpenAI的GPT-1正式版。
更令人矚目的是,Deepseek應用在發布后迅速走紅,不僅在中國地區的蘋果應用商店免費下載排行榜上奪得榜首,更是在美國地區的應用商店免費下載榜上超越了ChatGPT,展現出強大的市場吸引力和用戶基礎。