Anthropic,作為OpenAI的強勁對手,近期揭曉了Claude 3.5的重大升級,其中Claude 3.5 Sonnet模型尤為引人注目,該模型能夠模擬人類操作電腦的方式。
通過Anthropic新推出的API,Claude 3.5 Sonnet能夠感知并與計算機界面互動,包括光標(biāo)移動、屏幕點擊及虛擬鍵盤輸入,這一創(chuàng)新得益于API的集成,使開發(fā)者能將用戶指令轉(zhuǎn)換為計算機可執(zhí)行的操作。
在OSWorld基準(zhǔn)測試中,Claude 3.5 Sonnet僅憑截圖便獲得了14.9%的得分,遠超第二名的7.8%。而在允許更多步驟完成任務(wù)的情況下,其得分雖未達到人類水平,但仍以22.0%的成績實現(xiàn)了AI領(lǐng)域的一大突破。
Anthropic指出,目前該功能操作速度較慢且存在錯誤,但作為測試階段,主要目標(biāo)是收集開發(fā)者反饋,以便持續(xù)優(yōu)化。