OpenAI近日宣布,其ChatGPT聊天機器人將迎來一次重大升級,推出名為Operator的新工具,這一工具將能夠自動執(zhí)行諸如規(guī)劃假期、填寫表格、預(yù)訂餐廳和訂購雜貨等日常任務(wù)。
Operator被描述為一個可以訪問網(wǎng)絡(luò)并執(zhí)行任務(wù)的代理,它經(jīng)過訓(xùn)練可以與網(wǎng)絡(luò)上常見的按鈕、菜單和文本字段進行交互。不僅如此,Operator還能根據(jù)需求提出后續(xù)問題,以個性化完成所分配的任務(wù),例如登錄其他網(wǎng)站獲取信息。用戶在整個過程中可以實時控制屏幕,確保操作的透明性和安全性。
OpenAI在周四的一篇博客文章中表示,Operator是其首批能夠獨立工作的AI代理之一。用戶只需給出一個任務(wù),Operator就會按照指示執(zhí)行。目前,Operator僅面向美國的ChatGPT Pro用戶提供,通過Operator.ChatGPT.com即可訪問。OpenAI計劃未來將其擴展到Plus、Team和Enterprise用戶,并將Operator集成到ChatGPT中。
然而,OpenAI也承認,Operator在某些任務(wù)上仍面臨挑戰(zhàn),如管理日歷和創(chuàng)建幻燈片。為了保護用戶隱私,用戶可以選擇關(guān)閉ChatGPT中的“為所有人改進模型”設(shè)置,這意味著Operator中的數(shù)據(jù)將不會被用于訓(xùn)練其模型。用戶還可以在隱私設(shè)置中一鍵刪除所有瀏覽數(shù)據(jù)并退出所有網(wǎng)站。
值得注意的是,今年10月,另一家AI公司Anthropic推出了類似的功能,允許其AI代理像人類一樣使用計算機完成復(fù)雜任務(wù)。Anthropic的首席科學(xué)官Jared Kaplan表示,該工具可以解釋計算機屏幕上的內(nèi)容、選擇按鈕、輸入文本、瀏覽網(wǎng)站,并通過任何軟件和實時互聯(lián)網(wǎng)瀏覽執(zhí)行任務(wù)。Anthropic的AI代理能夠完成數(shù)十甚至數(shù)百步的任務(wù)。
隨著生成式人工智能市場的快速發(fā)展,包括OpenAI、Anthropic、谷歌、亞馬遜、微軟和meta在內(nèi)的多家公司都在積極布局。據(jù)預(yù)測,這一市場在未來十年內(nèi)的收入將突破1萬億美元。近期,谷歌向Anthropic投資超過10億美元,進一步推動了這一領(lǐng)域的競爭和發(fā)展。
OpenAI的這一舉措也與其致力于實現(xiàn)通用人工智能(AGI)的未來愿景相契合。盡管通用人工智能的定義相對模糊,但通常指的是在各種任務(wù)上達到或超過人類智力水平的人工智能。然而,專家們對于通用人工智能是否可行以及需要多長時間才能實現(xiàn)存在分歧。
Scale AI的首席執(zhí)行官Alexandr Wang表示,他將AGI定義為能夠像人類一樣使用計算機的強大AI系統(tǒng)。他認為,要達到這一技術(shù)水平可能需要兩到四年的時間。隨著技術(shù)的不斷進步和競爭的加劇,我們有理由期待未來AI領(lǐng)域?qū)⒊霈F(xiàn)更多創(chuàng)新和突破。