幸运彩app官方最新版下载 AI手机的终局,“读屏”照旧“对话”?

发布日期:2026-02-19 20:30    点击次数:130

幸运彩app官方最新版下载 AI手机的终局,“读屏”照旧“对话”?

文 | 定焦One,作家 | 金玙璠,剪辑 | 阮梅

最近科技圈的两场“AI秀”先后刷屏。

在大洋此岸,当地时候1月12日,苹果和谷歌文告合作,要给Siri用上谷歌的Gemini。但苹果的作念法,不是平直让Gemini操作手机上的App,而是用户说什么,Siri先相识意图,然后去调用相应的诳骗。换句话说,AI仅仅个“休养员”。这套操作,很苹果。

{jz:field.toptypename/}

另一边,国内的情况就淆乱得多。字节朝上的豆包AI手机一度刷屏,AI不错帮你打车、购物、订票,就像一个确实的“全能助理”。这套打发,很互联网。

你看,相同是AI手机,终了的方式澈底不同。这背后,其实是两条技能阶梯:

一条阶梯,是让AI和App学会“对话”,通过圭臬接口平直调用诳骗才略,被称为A2A(Agent-to-Agent)。这条路需要所有这个词东说念主坐下来一王人制定例则,走得慢,但更得当。

另一条阶梯,是给AI一把“全能钥匙”,通过系统权限“读屏”并模拟操作APP,被称为GUI(图形用户界面)。这条路浅近平直,走得快,但可能存在风险。

这背后不仅仅技能选拔,实质上,是不同公司基于自身利益与生态位,对改日主导权的一次押注。谁的模式能赢得用户,很可能将决定:下一个十年,咱们如何与手中的蛊卦共处。

两种解法,两种逻辑

要看懂这场牌局,咱们先得看清这两条阶梯背后的逻辑。

GUI阶梯,主打一个“快”字。

它的终了方式,最初是AI助手借助安卓系统中一个名为“无扼制处事”的功能。这项权限最初是为有眼力扼制的东说念主士遐想的,好让他们能通过语音请示来操作手机。当今,AI通过这项权限不错“读懂”屏幕上的翰墨和图标,然后模拟东说念主的手指去点击、滑动,从而操作种种App。之后不久,阛阓上出现了比调用无扼制权限更“率先”的阶梯,也即是AI助手拿到了手机厂商给我方的系统签名权限,从而通过程度注入,更丝滑、无感地模拟操作。

这样作念的刚正了然于目——它绕开了所有这个词App厂商,平直把AI才略遮盖到了现存的诳骗生态中。关于急于在AI波涛中霸占身位的厂商来说,这是最快的考据旅途。

“当用户习尚了通过一个AI助手来操作所有这个词App时,这个助手就成了新的流量进口,这背后的交易价值,相等有眩惑力。”关切互联网公司的投资东说念主林亮默示。

不外,关于用户来说,体验现阶段的GUI可能“时灵时不灵”。

“GUI很依赖诳骗界面的踏实性”,诳骗开发者陈刚默示,“要是App更新了界面遐想,比如一个按钮的位置变了,都可能让AI‘点错’位置,通盘任务经过就会卡住。”

陈刚指出,当任务链路变永劫,这种不踏实性会被放大。特殊据自大,一个包含5个门径的操作,即便每一步的成遵循都高达90%,通盘任务的最终成遵循也可能骤降至59%。

 

除了体验上的不驯服性,好多用户挂牵的是安全和秘籍风险。GUI模式下,AI需要通过“读屏”来相识屏幕内容,进而决定下一步操作,就意味着,它需要及时获取屏幕信息。尽管厂商们首肯数据会加密或不上传,但用户心中不免会有疑虑:用户的数据在什么情况下被相聚、如何被使用、谁来崇敬?

A2A则是澈底不同的想路。它不让AI“看”屏幕,而是为AI和各个诳骗建立一套通用的“对话说话”——也即是圭臬的API接口。

这听起来有点空洞,你不错设想这样的场景:你敌手机说“帮我打车去机场”,系统Agent相识后,平直告诉相应的Agent:“用户要去机场,请提供打车处事。”出行App的Agent收到肯求后,在我方的权限范围内完成任务。

A2A的中枢,是“合作”。这一齐线中有个要津遐想叫“双重授权”:同期得到用户和诳骗方的授权。

这样一来,权责变得领略了。用户不错对不同的App设立不同的权限等第。比如,允许AI读取外卖App来比价,但退却读取银行App;关于转账这样的高风险操作,每次履行都需要你的特殊阐述。由于数据流动是通过明确的接口进行的,是班班可考的,即便出了问题也不错追忆。

那为什么不是所有这个词厂商都选拔A2A呢?

因为调解资本很高。A2A需要操作系统厂商、诳骗开发者共同鞭策一套圭臬化的公约。莫得饱和多的诳骗相沿,A2A的价值就暴露不出来;莫得明确的价值,开发者就枯竭适配的能源。

是以,A2A阶梯注定是一场“耐久战”,它“慢”在生态共鸣的达成与基础依次的成立。

当今,两条阶梯的逻辑就昭彰了:GUI虽有一定风险但高效,能让厂商用最小代价快速考据AI手机的可能性。A2A得当但渐渐,需要更多调解节进入,不外一朝成效,就能建立一套更安全的体系。

有东说念主可能会问,GUI阶梯就不可通过技能技巧终了分级授权吗?表面上不错,但这样作念也就失去了相干于A2A的“快速部署”上风,同期还要承受更高的技能资本。

咫尺行业内相对公认的旅途是,GUI探路尚可,因为它会把智能体的便利和风险都充分呈现出来,最终照旧要看A2A,因为只好霸道了安全和便利两个条款,材干走得远。要是跳出中国阛阓,民众的科技巨头们是如何选拔的呢?

不同阶梯背后,巨头们的算盘

在手机端,外洋巨头险些都选了A2A,推动API(接口)集成。

苹果最平直。它升级了“App Intents”框架,要求所有这个词想接入AI功能的诳骗,都必须按照苹果制定的圭臬提供API接口。

谷歌的路更复杂。它一边推“AppFunctions API”来归并智能体交互圭臬,一边鼎力推行种种诳骗适配,这是个渐渐的过程。

微软自研了“AutoGen”这样的多智能体对话框架,探索不同AI智能体怎样更好地协同。

OpenAI和Anthropic固然不屈直作念手机,但它们推动的“函数调用”和“用具使用”功能,试验上即是A2A的技能前身。左证Anthropic公布的数据,从2025年3月的2000多个活跃MCP处事,到12月也曾卓越1万个——这个增速相等惊东说念主。

为什么无论是苹果、谷歌这样的操作系统霸主,照旧微软、OpenAI这样的AI领头羊,都选了渐渐的接口阶梯?

因为它们是现存治安的建立者和最大受益者。

苹果、谷歌的中枢利益是爱护平台、踏实开发者。未经三方授权就浅近使用GUI,这种“外挂式”的阶梯,实质上是在挑战它们的总揽地位。是以它们势必会选A2A这种“可控”的决策,把AI才略紧紧掌抓在我方手中,当作强化生态欺压力的新用具。

微软手抓Windows和Office两大王牌,其AI政策的中枢是训导坐蓐力,处事企业客户。关于这些客户来说,幸运彩app安全和踏实是第一需求,无法汲取GUI的不驯服性和安全风险。

OpenAI当作AI技能的“军火商”,接洽是让我方的模子被尽可能多的诳骗“调用”。是以它必须提供踏实、可靠的API接口,而不是无法确保结尾的GUI用具。

外洋巨头是不是澈底覆没GUI了?并非如斯。

谷歌的Gemini和微软的Copilot,在手机上推出了“屏幕分享”功能——让用户不错把屏幕分享给AI,AI不错“看”并回应问题,但自身不会去操作。

外洋巨头的GUI尝试,主要在PC端,而且,严格规矩在受控环境(如浏览器、沙盒、虚构机)内。

OpenAI把具备GUI操作才略的Agent规矩在Atlas浏览器内,明确退却它起先代码、下载文献或走访腹地诳骗。Anthropic在2024年底就发布了Computer Use API,但相干功能于今仅供开发者在虚构环境中测试。

微软的作念法最具代表性。在其Recall功能因高频截屏激勉秘籍争议后,它平直把“看”和“作念”两个动作拆分了——Copilot Vision只可“看”用户分享的诳骗并提供无情,不可操作;有操作才略的Copilot Actions必须在单独的沙盒桌面中进行。

是以,外洋巨头出于“爱护现存治安”的计议,顽强地走A2A阶梯,GUI尝试只停留在“测试版”,并未向闲居用户大范畴推行。

比较之下,国内阛阓形貌更复杂,巨头中既有“挑战者”也有“守成者”,选拔也因此更种种。

字节朝上走的是高权限GUI阶梯。它通过豆包大模子与中兴努比亚深度合作,推出集成系统级AI助手的“AI手机”,但愿绕开现存的生态壁垒,争夺下一代流量进口。

阿里、华为、OPPO,都布局了A2A阶梯。

阿里的动作很平直,即是通过自建的、可控的API体系,将“通义千问”这个超等大脑,深度集成到淘宝、支付宝、高德等中枢业务中。

华为则在2025年底发布的HarmonyOS 6中,通过“意图框架”,终明晰“小艺”智能体与十余款鸿蒙原生诳骗的A2A合作。

OPPO也聚拢了支付宝等头部诳骗,共同探索A2A的行业圭臬。

但这些看似调换的选拔背后,是各自的交易考量。

对阿里来说,这套打发“攻守兼备”。一方面,当作中国头部电商平台,中枢利益是用可控的API保护渊博的交往生态。但另一方面,它又不啻于提神,而是通过通义千问打造一个进口,让用户在阿里生态内完成更多交往和处事。

华为和OPPO天然不想只作念硬件制造商,容易被“管说念化”,是以,在A2A阶梯之上,它们还在走一条以自家操作系统或AI大模子为中枢的“搀杂生态”的阶梯。在这套体系里,既有圭臬的API调用,也有更底层的系统级智能体,最终方针都是为了掌抓生态主导权,从一个“蛊卦提供商”,升级为改日生态的“章程制定者”之一。

简言之,国表里厂商多数都选了A2A。仅仅区分在于,外洋巨头用它来强化现存欺压;国内厂商则用它来争取话语权,一边参与A2A的圭臬制定,一边通过自身的OS、大模子或生态上风,建立以我方为中枢的搀杂生态。

为什么主流厂商更倾向A2A?

选拔背后,是不同玩家在牌桌上的位置使然。不外,从这些主流厂商的选拔中,咱们不错得出一个论断:GUI阶梯固然能快速考据AI手机的可能性,但A2A正得到越来越多主流厂商的醉心。

是因为A2A更安全、更踏实吗?不全是。它之是以被看作是改日,不错从技能演进、监管合规和交易资本三个维度来看。

从技能角度看,A2A更顺应AI单干合作的实质。

GUI阶梯要求大模子同期承担“感知屏幕(眼)、筹谋任务(脑)、模拟操作(手)”的责任,职守重、成果低且易出错。A2A阶梯,则是让AI追思到它最擅长的“大脑”扮装,专注于相识与任务休养,具体的履行交给各垂直范畴优化的诳骗智能体。这种“各司其职”的模式,不仅更高效可靠,也为改日更复杂的智能体合作打下了基础。

从监管角度看,A2A是更安全、更合规的选拔。

GUI的“读屏”行径在民众范围内都面对越来越严格的秘籍监管。2025年12月,好意思国德州告状了包括三星在内的多家智能电视制造商,指控它们通过高频截屏犯警相聚用户数据。这为所有这个词给与雷同技能的厂商敲响了警钟。

{jz:field.toptypename/} 

而A2A由于数据流动通过明确的接口进行,而且有“双重授权”机制保险,为厂商建立了一说念合规“防火墙”。

终末,亦然最要津的,从交易资本角度看,A2A是更经济的选拔。GUI决策看似“快”,但遥远运营资本高。

陈刚作念了个类比:

GUI模式就像雇了一个需要24小时盯着监控屏幕的保安,要束缚地看、束缚地分析图像。这消费的是多半的“脑力”(云霄计较资源)。

A2A模式是建立了一个高效的里面通信系统。当需要某个部门配合时,发送一条结构化的浅近请示即可。这消费的仅仅“通信费”(API调用用度)。

关于手机厂商来说,要是几亿用户每天都在用AI读屏,算力与带宽开支将是一笔巨大的开支。这种交易模式,在范畴化商用的出路下,险些是不可赓续的。

是以无论从技能、监管照旧交易资原来看,A2A都是更优的选拔。更紧迫的是,一朝这个生态建立起来,它将带来全新的交易契机。这亦然最让行业东说念主士兴盛的原因。

起初,公约层与中间件将成为中枢。PC期间有Windows,转移互联网期间有iOS和安卓。在AI期间,A2A、MCP等公约圭臬,就像是新期间的“操作系统”和“开发说话”。谁能掌抓圭臬,谁就可能成为下一个平台级的巨头。

其次,“智能体工场”与垂直Agent处事商将迎来爆发。基于圭臬公约,为金融、医疗、物流等特定行业开发专属智能体,将成为一个巨大的阛阓。改日,可能会有挑升的“智能体商店”,你不错像下载App一样,为你的手机雇佣一个“私东说念主答理参谋人”或“专属旅行筹谋师”。这为无数中小开发者,提供了全新的创业契机。

终末,现存公司也将在更生态中再行找到我方的位置。云厂商将成为智能体的“查科场”,手机厂商则成为智能体的承载末端。它们都将得到新的增长。

关于中国的科技公司而言,这是一个在底层公约和基础依次上,与民众巨头同台竞技的绝佳契机。

结语

聊了这样多技能和交易,咱们不妨回到一个最根蒂的问题:AI,到底应该如何处事于东说念主?

AI手机的发展,正从功能炫技的“倡导期”,进入生态构建期。GUI和A2A,从不同维度给出了各自的回应。

GUI用一种最直不雅的方式,完成了初步的阛阓发蒙。它让咱们提前看到了AI手机改日的形状——一个能听懂、会操作的伙伴。这种“快”的上风,匡助厂商们快速考据了AI手机的可能性。但安全性存疑、经济性不高,决定了它更可能是一种过渡决策。

A2A阶梯尽管起步渐渐、调解粗重,但它在作念一件更基础的事——为AI和诳骗之间建立一套领略的“章程”。这些章程看起来很复杂,但实质上是在回应一个问题:AI应该在哪些方位有权柄,在哪些方位莫得。一朝这套章程被庸俗汲取和诳骗,就能变成一个更踏实、更可控的生态。这势必是一场耐久战。

这场阶梯之争,往深了想,其实是咱们但愿与机器建立何种关系的想考。

AI手机的改日,大致并不在于让手机变得无所不可,去替代咱们作念所有这个词事。而在于,它能否成为一个更机灵的“副驾驶”,在咱们作念决策时,提供更精确的信息、更周到的无情,最终把选拔权交还给咱们我方。说到底,技能终究是为东说念垄断事的。

*应受访者要求,文中陈刚、林亮为假名。