據最新消息,谷歌正籌備在12月推出其大型動作模型“Project Jarvis”。據悉,這一項目將為用戶在網頁上執行多項日常任務提供自動化支持,如研究收集、產品購買及航班預訂等。
“Jarvis”將由谷歌Gemini的未來版本驅動,并特別針對Chrome瀏覽器進行優化。該工具通過截取屏幕截圖、解析內容及自動執行點擊、輸入等操作,以實現網頁任務的自動化。值得注意的是,目前該工具在執行操作時存在數秒的間隔。
當前,各大AI公司均在研發類似功能的模型,包括微軟的Copilot Vision、蘋果的Apple Intelligence、Anthropic的Claude測試版及OpenAI的相關項目。
谷歌計劃首先向少量測試者發布“Jarvis”,以便發現并修復潛在的Bug,因此具體展示計劃可能會有所調整。