近期,DeepSeek在其官方社群中發(fā)布了一則重要通知,宣布其DeepSeek-V3模型已經(jīng)順利完成了小規(guī)模的版本迭代。用戶現(xiàn)在可以通過(guò)訪問DeepSeek的官方網(wǎng)站、應(yīng)用程序以及小程序來(lái)體驗(yàn)這一新版本,不過(guò)需要注意的是,在試用期間,“深度思考”功能將暫時(shí)關(guān)閉。與此同時(shí),API接口及使用方法維持原樣,無(wú)需做出調(diào)整。
盡管官方并未詳細(xì)披露此次升級(jí)的具體改動(dòng)內(nèi)容,但據(jù)知情人士透露,DeepSeek-V3模型自去年12月面世并開放源代碼以來(lái),便以其強(qiáng)大的性能引起了業(yè)界的廣泛關(guān)注。作為一款由DeepSeek自主研發(fā)的MoE模型,DeepSeek-V3擁有高達(dá)671B的參數(shù)規(guī)模,在多項(xiàng)評(píng)測(cè)中的表現(xiàn)均超越了Qwen2.5-72B和Llama-3.1-405B等其他知名的開源模型。更為引人注目的是,DeepSeek-V3在性能上與世界領(lǐng)先的閉源模型GPT-4o以及Claude-3.5-Sonnet不相上下,展現(xiàn)出了強(qiáng)大的競(jìng)爭(zhēng)力。
DeepSeek在今年1月還推出了DeepSeek-R1推理模型,并同樣選擇了開源。這款模型在性能上與OpenAI的o1正式版相媲美,憑借其低廉的訓(xùn)練成本和高效的性能,在全球范圍內(nèi)迅速走紅,贏得了眾多開發(fā)者和用戶的青睞。