
在博鳌亚洲论坛举办前夜,OpenClaw 激励了一场全球养虾狂欢,AI 在屏幕那端自主奉行辅导的画面,让不少东谈主在此前莫得斗争过 AI 的用户认为科幻照进了履行。
在这个布景下,vivo 总裁、首席运营官兼中央究诘院院长胡柏山提倡了一个不太雷同的问题:AI 现在颖悟许多事,但它对真实宇宙的感知,简直为零。他在演讲里用了一个比方:"莫得感知智商,AI 就像是困在黑房子里的内行,算力再强,也看不见目下以外的宇宙。"

vivo 总裁、首席运营官兼中央究诘院院长胡柏山 图源:vivo
这句话是此次博鳌 vivo 传递的核心信号的起始,亦然相识 vivo 接下来统共动作的前提。
演唱会神器、旅拍神器——但这仅仅运转
在很长一段时辰里,vivo 给外界留住的热烈印象有几个枢纽场景:在演唱会上结合增距镜应付拍到台上歌手了了的心情;旅行途中的唾手拍,神态和光影齐知足得像胶片。这些标签不是莫得深嗜,vivo 在影像上栽培了许多年,这是真实的家具辘集换来的口碑。
但在本届博鳌论坛期间,胡柏山聊的东西,一经超越了"出片好不好"的畛域。
他在演讲里放了两个故事。
一个是宝哥,九年前有时失明,旧年带着导盲犬阿尔法,靠一台 vivo 手机环游中国。vivo 的 AI 功能帮他"看见"了每一个东谈主的款式。在南澳的渔船上,手机告诉他:"眼前是你的一又友章喜德,他双臂交叉,面带含笑,衣服一件深色长袖。"
另一个是诺子,因视觉神经毁伤失明的好意思院学生,最大的愿望是去冰岛感受宇宙的尽头。旧年她遂愿了,站在冰河湖旁,手机帮她描述:"湖面泛动着冰块,搭客在拍照,辽阔有海鸟飞过。"
要是这两个故事放在发布会 PPT 里,很容易被当有益情包装。但放在胡柏山对影像的全体判断里,它们指向的是团结件事:影像技能确凿的上限,不是把相片拍得更顺眼,而是让机器粗略确凿"读懂"它所看到的物理宇宙。
这种落差本人即是个故真谛的信号:一家耐久凭"影像手机"圈粉的公司,现在想用"影像"讲一个统统不同的故事。
AI 有一个没东谈主自得承认的短板
往日这两年,AI 的阐述快得有点让东谈主应接不暇。写稿、代码、绘制、视频,一个接一个地被攻克,而最近爆火的"龙虾"甚而不错领受你的电脑帮你完成一些复杂繁琐的责任,于是用户迟缓酿成了一种印象:AI 好像什么齐会了。
但有一件事,目前的 AI 其实作念得很差:那即是感知真实宇宙。
不是"看不见",现在的大模子基本齐有视觉智商,你把一张相片发给它,它能告诉你图里有什么。但"读懂一张图"和"感知物理宇宙"之间,差着一个内容的台阶。前者是被迫经受,后者是主动相识——相识清明、空间、位置关系,甚而相识一个东谈主当下的景色和心情。
用胡柏山的说法来相识这个差距,会更直白一些:现在的 AI 是"数字宇宙里的内行",它在阿谁宇宙里能创作、能推理、能给东谈主提建议。但它莫得看法径直作用于物理宇宙,更莫得看法改造它。它就像一个博览群书、足不逾户的东谈主——学问量惊东谈主,但莫得确凿"出过门"。
这个短板,目前莫得哪家公司统统处理了。但它是一谈必须过的关:要是 AI 永远只活在屏幕里,所谓的"通用东谈主工智能"就遥远是一句空论。
让 AI 确凿走进物理宇宙,需要一套感知系统。而感知系统的核心,是影像。
影像在作念的事,kaiyun不只单"纪录",更是"感知"
在会上,胡柏山提到了一件里面的事:vivo 本年持重建造了一个新的一条"长技能赛谈":感知赛谈。

vivo 总裁、首席运营官兼中央究诘院院长胡柏山 图源:vivo
这个措辞值得停留一下。在 vivo 的里面说话里,"长赛谈"通常意味着天花板豪阔高、值得握续十年干预的场地。比如影像即是一条一经被考据的长赛谈。现在感知被提高到同等第别,证实 vivo 的判断是:这条路至少要走十年,而且它的真谛不啻于手机。
影像技能在往日几年里一直是手机厂商的核心战场,但简直统共东谈主的叙事框架齐停在团结个层面:主摄传感器更大、进光量更多、长焦对焦更快速、夜景更亮。这些跨越是真实的,仅仅它们的目标地一直是"拍出更好的相片"。
vivo 现在想改造的,是这个目标地本人。
感知系统作念的事情不是"拍下来",而是"读显然":读懂光影,读懂空间,读懂场景里发生了什么,甚而读懂东谈主的心情景色。
这件事的遑急性在于:这恰巧是 AI 走出数字宇宙、落地物理宇宙所穷乏的那一环。图像感知加上声息感知,组成了 AI 相识物理宇宙的基本智商。莫得这套感知智商,AI 再贤慧,也仅仅屏幕背面阿谁很会打字的助手。
胡柏山默示:畴昔模子会越来越同质化,开源的速率越来越快,人人之间的差距越来越小。但感知系统不雷同,因为它收集的是真什物理宇宙的场景数据,而每个品牌的用户群体不同、使用场景不同,辘集下来的场景数据就会不同,这个各别是不成复制的。
他举了特斯拉 FSD 的例子:特斯拉的扶直驾驶模子不错公开,但它的谈路数据不会公开。模子有可能被追上,而场景数据才是确凿的护城河。
把影像从"纪录用具"升级为"感知系统",这也让 vivo 在影像上的耐久干预,有了一个新的分解框架——不仅仅为了让相片更顺眼,滚球app(中国)官网下载而是在为 AI 打地基。
手机下一步变成什么?一个有追想、懂你的 Agent
相识了 vivo 为什么把影像当成感知的枢纽智商,再来看 vivo 敌手机下一阶段的判断,就不会合计突兀了。
vivo 的判断是:手机从 Smartphone 进化为 Agent Phone,是细目性的趋势,仅仅现阶段受制于端侧算力和带宽,阐述需要一步一步来。
Agent Phone 这个词现在许多公司齐在说,但人人的相识浅深不一。vivo 对它的界说,落脚点在"个性"和"学问图谱"这两件事上——每一个用户的 Agent,应该是专属的,而不是把团结个基准模板套在统共效户身上。
这不是一个崭新的空想,但已毕旅途有认真。vivo 的方式是从影像出手:第一批是相机 Agent 和相册 Agent。拍照的时候用,整理相片的时候用,它不需要一直在后台握续运行,是以对硬件的压力在可控范围内。
相机 Agent 在 X300s 和 X300 Ultra 上一经有了初步落地。具体来说,往日用户拍照需要手动切换东谈主像模式、长焦模式、微距模式,大部分东谈主其实并不知谈什么时候该用哪个。现在相契机左证拍摄对象的清明、距离、类型,自动识别场景,弹出它认为最适应的成像建议。
这更像是一个起始的声明,而不是尽头的请托。
往后看,vivo 的决策里还有更多种类的 Agent:不管是办公的、出行的、游戏的,其实逻辑齐雷同——通过模子把往日需要用户手动确立或者压根作念不到的事情,交给手机自动完成。
不外 vivo 对这个阶段的预期是克制的。胡柏山认为:2026 年能作念好的,即是这些对算力条目相对可控的 Agent,确凿作念到对附进环境及时感知的智商,需要系统架构作念更大的养息,这是 2026 年之后的事。
Agent Phone 是短期旅途,是把手机从用具升级成"伙伴"的第一步。
耐久的谜底:影像 × AI,升级为感知核心
vivo 这两年推出或者晓谕的新场地不少:旧年咱们见到了 vivo Vision MR 头显的发布,外传顶用来"抗击"大疆 Pocket 的云台相机也有望在本年底到来,而具身机器东谈主实验室也一经建造。vivo 的这些动作,让外界有一种很当然的疑问:这家公司是不是摊子铺得太大了?
胡柏山对这个问题的酬谢,分了三个线索:纪录宇宙、感知宇宙、改造宇宙。
"纪录是被迫的,它恭候你的辅导;感知是主动的,它替你不雅察环境的亮度、空间的纵深,甚而东谈主际的距离;行径则是终极的,它基于相识,替你处理问题。"
现在的手机大部分还在"纪录"阶段,往"感知"升级是近期的场地,而"行径"才智确凿自主地作用于物理宇宙,这是 vivo 押注的远期方针。
为了走到那一步,vivo 的决策是以手机为起始,向外蔓延出一整套以影像感知为核心的开发生态:手机当作感知泉源和个东谈主化数据的辘集中心;vivo Vision MR 头显当作空间野心的试验场,相识空间结构和几何关系;云台相机、穿戴开发等生态结尾当作出动触角;家庭机器东谈主当作感知智商的最终落点:让 AI 确凿进入物理宇宙,进入家里。

图源:vivo
旧年 8 月,vivo 发布了 vivo Vision 探索版 MR 头显,一经在国内 20 多家体验店和东南亚部分商场落地,用户体验卓绝 5 万东谈主。这款家具的定位是"探索",有了实体载体,才智确凿辘集数据,考据泄露。
胡柏山默示:vivo Vision 下一代要鼓励交易化,方针是 2027 年底或 2028 年头持重商用。
机器东谈主场地则更早期。
vivo 旧年建造了机器东谈主 Lab,目前仍在实验室阶段,莫得原型机,莫得发布时辰表。但胡柏山对这件事的念念路很了了:不作念"全场景通用机器东谈主",而是聚焦年青用户的生计场景,从单一高可行性的任务启程:比如宠物喂食,比如衣物收纳;先把一个场景作念到能用,再缓缓泛化。他用的词是"沿路下蛋"。
他还专门分解了手机和机器东谈主的关系:手机是最了解用户的随身助手,知谈你的生计俗例、饮食偏好、宠物信息,况兼这些数据全部在土产货,不上云。
当机器东谈主智商还不够的阶段,用户不错通过手机而已检察、遥控操作;跟着数据辘集,机器东谈主会越来越自主。这个旅途和自动驾驶的演进逻辑雷同——从扶直奉行到自主决策。
这套逻辑说通了之后,再看 vivo 的家具布局,会发现它比看起来要更有结构:影像技能是那根主轴,其他家具是主轴蔓延出去的不同分支。
临了
在此次采访里,有一个细节让我印象深远。
当胡柏山被问到:AI 时期,到底是 AI 唱主角,如故影像唱主角?
他的酬谢是:在存量商场里,影像是拉长板的逻辑,延续把有高卷入度的用户留住。但要把存量商场变成增量商场,靠的是 Agent,让换机周期缩小,让更多东谈主合计旧手机不够用了。"影像 +AI 两者其实并不破裂,唯有东西好,手机就能成为出产力用具,用户就会合计值。"
这个酬谢里有一种求实的底色。
vivo 讲的故事很大:感知系统、数字 DNA、机器东谈主;但在落到家具层面时一直很具体:本年作念好相机和相册 Agent、27 年后 MR 商用,更远的是机器东谈主。
vivo 并莫得喊出"咱们要改造宇宙"的宣言,仅仅交出了一张分阶段的时辰表滚球app,这条路究竟能走到哪,最终如故要依靠家具来交卷。
天博体育(TBSports)官方网站