①Anthropic意在補(bǔ)齊其AI模型在視覺理解精度上存在的短板; ②Vercept產(chǎn)品Vy將于3月25日關(guān)閉; ③去年12月Anthropic收購編碼代理引擎Bun,兩筆收購指向同一方向:讓Claude不僅能寫代碼,還能像人一樣在各類軟件中實(shí)時(shí)操作。
《科創(chuàng)板日報(bào)》2月26日訊(編輯 宋子喬) 當(dāng)?shù)貢r(shí)間2月25日,Anthropic宣布收購西雅圖AI初創(chuàng)公司Vercept,為自家智能體(Agent)工具“Computer Use”補(bǔ)上視覺短板。

Computer Use是Anthropic為旗下AI大模型Claude打造的、使其直接操控電腦的核心能力,能讓Claude可以像人一樣“看屏幕、動鼠標(biāo)、敲鍵盤、操作軟件”,完成多步驟、跨應(yīng)用的復(fù)雜任務(wù),于2024年10月隨Claude 3.5 Sonnet一同發(fā)布。
可以說,Computer Use是Anthropic進(jìn)軍AI智能體領(lǐng)域的關(guān)鍵一步。
而Vercept意在打造視覺優(yōu)先(Vision first)的AI智能體,主打“像人一樣看屏幕、操控電腦”的無API自動化,與Computer Use的賣點(diǎn)類似。
Anthropic此次收購,意在補(bǔ)齊其AI模型在視覺理解精度上存在的短板。人們正用Claude處理日益復(fù)雜的工作——編寫跨整個(gè)代碼庫的代碼、整合數(shù)十個(gè)來源的研究成果、管理跨越多個(gè)工具的工作流程。借助計(jì)算機(jī),Claude能在實(shí)時(shí)應(yīng)用中完成這些操作,處理多步驟任務(wù),解決僅靠代碼無法解決的問題。
Vercept在高精度UI識別、空間推理方面的積累正好補(bǔ)上這塊拼圖。該公司脫胎于艾倫人工智能研究所(Allen Institute for AI,AI2),創(chuàng)始團(tuán)隊(duì)堪稱頂配——CEO Kiana Ehsani曾負(fù)責(zé)AI2機(jī)器人與具身智能團(tuán)隊(duì),聯(lián)合創(chuàng)始人Luca Weihs深耕AI Agent與強(qiáng)化學(xué)習(xí),Ross Girshick則是計(jì)算機(jī)視覺領(lǐng)域的先驅(qū)人物。公司成立僅一年多,累計(jì)融資5000萬美元,投資陣容包括前谷歌CEO施密特、DeepMind首席科學(xué)家杰夫?迪恩等。
在Vercept的團(tuán)隊(duì)看來,要讓AI真正有效地完成復(fù)雜任務(wù),就必須解決感知和交互難題。其產(chǎn)品Vy不走“讀代碼”路線,而是采用視覺優(yōu)先方案——通過視覺模型理解屏幕上的每一顆按鈕,再模擬鼠標(biāo)鍵盤操作,這意味著它能操控任何有屏幕的軟件。在UI元素識別基準(zhǔn)ScreenSpot v1上,其自研模型準(zhǔn)確率高達(dá)92%,而OpenAI同類模型僅為18.3%。
此次收購緊隨Anthropic新一代模型Claude Sonnet 4.6發(fā)布之后。在OSWorld評估中,Sonnet模型準(zhǔn)確率從2024年底的不足15%提升至如今的72.5%,在瀏覽復(fù)雜電子表格、跨標(biāo)簽頁填寫表單等任務(wù)上已接近人類水平。
這是Anthropic第二筆公開收購——去年12月剛收購編碼代理引擎Bun。兩筆收購指向同一方向:讓Claude不僅能寫代碼,還能像人一樣在各類軟件中實(shí)時(shí)操作。
Vercept產(chǎn)品Vy將于3月25日關(guān)閉,團(tuán)隊(duì)正式加盟Anthropic。
Anthropic由前OpenAI研究副總裁達(dá)里奧?阿莫迪兄妹于2021年創(chuàng)立,核心團(tuán)隊(duì)曾參與GPT-2和GPT-3的早期研發(fā)。因?qū)penAI的發(fā)展方向存在分歧,他們離職創(chuàng)辦了這家致力于AI安全與研究的公司。
憑借創(chuàng)始人團(tuán)隊(duì)的光鮮背景,該公司融資步伐迅猛,自成立以來累計(jì)融資額已超300億美元。2026年2月,公司剛完成300億美元G輪融資,投后估值飆升至3800億美元,使其成為全球估值第二高的AI獨(dú)角獸,僅次于OpenAI。本輪融資參與方包括光速創(chuàng)投(Lightspeed Venture Partners)、門洛風(fēng)險(xiǎn)投資(Menlo Ventures)、摩根士丹利投資(Morgan Stanley Investment)、NX1資本(NX1 Capital)及卡塔爾投資局(Qatar Investment Authority)。
Anthropic最核心的產(chǎn)品是Claude系列大語言模型,按照能力梯隊(duì)劃分為三個(gè)層級:
Claude Opus系列:旗艦級模型,代表當(dāng)前最高智能水平。
Claude Sonnet系列:性能與成本的平衡之選,也是大眾用戶接觸最多的模型。
Claude Haiku系列:輕量級模型,主打快速響應(yīng)和低成本,適用于實(shí)時(shí)交互場景。
基于上述模型,Anthropic開發(fā)了AI編程助手Claude Code和辦公場景智能體Claude Cowork。Anthropic的年化營收在2025年年底超過90億美元,其中,Claude Code的年化收入已達(dá)25億美元。

