Anthropic收購Vercept 補(bǔ)齊智能體視覺短板為Claude裝上“眼睛”

原創(chuàng)

2026-02-26 16:40 星期四

科創(chuàng)板日報(bào) 宋子喬

①Anthropic意在補(bǔ)齊其AI模型在視覺理解精度上存在的短板；
②Vercept產(chǎn)品Vy將于3月25日關(guān)閉；
③去年12月Anthropic收購編碼代理引擎Bun，兩筆收購指向同一方向：讓Claude不僅能寫代碼，還能像人一樣在各類軟件中實(shí)時(shí)操作。

《科創(chuàng)板日報(bào)》2月26日訊（編輯宋子喬） 當(dāng)?shù)貢r(shí)間2月25日，Anthropic宣布收購西雅圖AI初創(chuàng)公司Vercept，為自家智能體（Agent）工具“Computer Use”補(bǔ)上視覺短板。

Computer Use是Anthropic為旗下AI大模型Claude打造的、使其直接操控電腦的核心能力，能讓Claude可以像人一樣“看屏幕、動鼠標(biāo)、敲鍵盤、操作軟件”，完成多步驟、跨應(yīng)用的復(fù)雜任務(wù)，于2024年10月隨Claude 3.5 Sonnet一同發(fā)布。

可以說，Computer Use是Anthropic進(jìn)軍AI智能體領(lǐng)域的關(guān)鍵一步。

而Vercept意在打造視覺優(yōu)先（Vision first）的AI智能體，主打“像人一樣看屏幕、操控電腦”的無API自動化，與Computer Use的賣點(diǎn)類似。

Anthropic此次收購，意在補(bǔ)齊其AI模型在視覺理解精度上存在的短板。人們正用Claude處理日益復(fù)雜的工作——編寫跨整個(gè)代碼庫的代碼、整合數(shù)十個(gè)來源的研究成果、管理跨越多個(gè)工具的工作流程。借助計(jì)算機(jī)，Claude能在實(shí)時(shí)應(yīng)用中完成這些操作，處理多步驟任務(wù)，解決僅靠代碼無法解決的問題。

Vercept在高精度UI識別、空間推理方面的積累正好補(bǔ)上這塊拼圖。該公司脫胎于艾倫人工智能研究所（Allen Institute for AI，AI2），創(chuàng)始團(tuán)隊(duì)堪稱頂配——CEO Kiana Ehsani曾負(fù)責(zé)AI2機(jī)器人與具身智能團(tuán)隊(duì)，聯(lián)合創(chuàng)始人Luca Weihs深耕AI Agent與強(qiáng)化學(xué)習(xí)，Ross Girshick則是計(jì)算機(jī)視覺領(lǐng)域的先驅(qū)人物。公司成立僅一年多，累計(jì)融資5000萬美元，投資陣容包括前谷歌CEO施密特、DeepMind首席科學(xué)家杰夫?迪恩等。

在Vercept的團(tuán)隊(duì)看來，要讓AI真正有效地完成復(fù)雜任務(wù)，就必須解決感知和交互難題。其產(chǎn)品Vy不走“讀代碼”路線，而是采用視覺優(yōu)先方案——通過視覺模型理解屏幕上的每一顆按鈕，再模擬鼠標(biāo)鍵盤操作，這意味著它能操控任何有屏幕的軟件。在UI元素識別基準(zhǔn)ScreenSpot v1上，其自研模型準(zhǔn)確率高達(dá)92%，而OpenAI同類模型僅為18.3%。

此次收購緊隨Anthropic新一代模型Claude Sonnet 4.6發(fā)布之后。在OSWorld評估中，Sonnet模型準(zhǔn)確率從2024年底的不足15%提升至如今的72.5%，在瀏覽復(fù)雜電子表格、跨標(biāo)簽頁填寫表單等任務(wù)上已接近人類水平。

這是Anthropic第二筆公開收購——去年12月剛收購編碼代理引擎Bun。兩筆收購指向同一方向：讓Claude不僅能寫代碼，還能像人一樣在各類軟件中實(shí)時(shí)操作。

Vercept產(chǎn)品Vy將于3月25日關(guān)閉，團(tuán)隊(duì)正式加盟Anthropic。

關(guān)于Anthropic

Anthropic由前OpenAI研究副總裁達(dá)里奧?阿莫迪兄妹于2021年創(chuàng)立，核心團(tuán)隊(duì)曾參與GPT-2和GPT-3的早期研發(fā)。因?qū)penAI的發(fā)展方向存在分歧，他們離職創(chuàng)辦了這家致力于AI安全與研究的公司。

憑借創(chuàng)始人團(tuán)隊(duì)的光鮮背景，該公司融資步伐迅猛，自成立以來累計(jì)融資額已超300億美元。2026年2月，公司剛完成300億美元G輪融資，投后估值飆升至3800億美元，使其成為全球估值第二高的AI獨(dú)角獸，僅次于OpenAI。本輪融資參與方包括光速創(chuàng)投（Lightspeed Venture Partners）、門洛風(fēng)險(xiǎn)投資（Menlo Ventures）、摩根士丹利投資（Morgan Stanley Investment）、NX1資本（NX1 Capital）及卡塔爾投資局（Qatar Investment Authority）。

Anthropic最核心的產(chǎn)品是Claude系列大語言模型，按照能力梯隊(duì)劃分為三個(gè)層級：