近期,Meta 可穿戴部门副总裁Alex Himel做客播客节目Big Technology Podcast,发表了多个重磅观点。
Alex Himel于2009年加入Facebook,已效力超过17年,早期负责企业的AR与软件平台,后面负责Meta的硬件与人工智能融合战略落地。此外,他也是第二代Ray-Ban Meta全面引入AI的重要推手。
这里需要补充一个背景,初代Meta与Ray-Ban合作眼镜发布于2021年,它并不支持任何AI功能,销量也相对一般。2022年,随着ChatGPT发布,AI行业迎来爆发。当时第二代Ray-Ban Meta正在开发中,某个周六Alex Himel接到了扎克伯格发来的一长段WhatsApp信息:“我觉得这些眼镜会成为非常棒的AI设备。”很快,到了周一,Meta直接调动了大约200人的团队投入智能眼镜AI项目。第二代Ray-Ban Meta发布于2023年,销量持续飙升,它的AI能力以及综合体验目前依旧是市场的标杆,截至2025年,该系列产品已经卖出了超过700万副。
播客节目中,Alex Himel围绕AI眼镜的使用场景、未来产品规划、外部竞争等发表了多个重磅意见,干货满满。以下是【新硬见】对这次播客的重要内容整理摘录。
左侧是主持人Alex Kantrowitz,右侧是Alex Himel
自动扶梯坏了以后,它仍然是一段楼梯
主持:您戴着AI眼镜度过一天的典型用例是什么样的?
Alex Himel:我起床后的第一件事通常是跑步。我会戴上Oakley Meta眼镜,同时佩戴Garmin运动手表。跑步过程中,眼镜会自动拍摄一些视频片段,并将它们整理成完整内容。我还可以直接询问眼镜:“我跑了多远?”“训练计划进行到哪一步了?”这些数据会实时更新。
跑完步回家后,我开始给孩子准备午餐。如果发现某样东西快用完了,比如家里的食品包装袋,我可以直接让眼镜帮我下单补货。随后我开车送孩子上学,他们会问:“今天放学后有什么安排?”“训练几点开始?”“今天比赛对手是谁?”过去我需要拿出手机查看日历或搜索信息,现在眼镜可以直接回答这些问题。
到了公司以后,我会参加很多会议。AI能够自动记录会议内容、整理行动项,并把结果发送给参会人员,方便后续跟进。甚至在和别人聊天时,如果突然想不起某个人的名字,也可以直接向眼镜求助。所以对我来说,它更像一个伙伴。它一直陪伴在身边,让我正在做的事情变得更容易一些。
主持:这是个很具体的例子。作为跑步爱好者,我非常能理解其中一些场景。我一直不喜欢跑步时低头看手表,那种动作很不自然。但我还是想提出一个问题:为什么一定是眼镜?你刚才提到的很多功能,似乎也可以通过耳机完成。在家时,智能音箱也能处理其中一些任务。
Alex Himel:这是个好问题。我最喜欢的一个比喻是:自动扶梯坏了以后,它仍然是一段楼梯。眼镜也是一样。即便电池没电了,即便所有智能功能都关闭了,如果它是一副太阳镜或近视眼镜,它依然有价值。
而这正是我们和很多其他公司思路上的区别。Ray-Ban本身就是全球最受欢迎的眼镜品牌之一。人们佩戴它,是因为它舒适、好看、实用。我们提供各种颜色、款式和配置,用户可以找到真正适合自己的产品。换句话说,即使没有AI,它仍然是一副值得佩戴的眼镜,而AI只是不断增加它的价值。
当然,我也可以戴耳机跑步。但Oakley Meta不仅是一副太阳镜,同时也是耳机。如果我想听音乐,它能做到;如果我需要AI帮助,它也能做到。它在同一个设备里叠加了多重价值。
相比之下,像智能音箱这样的产品,是额外增加的一台设备。而眼镜本来就是许多人每天都会佩戴的东西。我并不认为眼镜会是唯一的AI硬件形态,但我认为它会成为最普遍的一种。
当我观察身边的人,包括孩子在内,几乎所有人都会佩戴太阳镜、运动眼镜或其他形式的眼镜。相反,那些现实生活中几乎没人佩戴的设备形态——比如某些夹式设备——我很难相信它们的AI版本能够真正普及。
如果一种产品的非AI版本本身就不受欢迎,那么它的AI版本大概率也不会成功。反过来,如果一个产品在AI出现之前就已经有价值,那么随着AI不断进步,它的价值只会越来越大。
AI像一张白纸,但很多人不知道如何作画
主持:Meta最近一直在谈“个人超级智能(Personal Superintelligence)”。很多人会认为,这种超级智能最终会通过眼镜呈现出来。你怎么看待这件事?
Alex Himel:在可穿戴设备领域,我们更愿意把它理解为AI帮助每个人成为最好的自己。我们并不希望设备让人脱离现实世界。真正重要的仍然是你身边的人、你所经历的事情,以及你和现实世界之间的连接。
举个例子,当我去学校看孩子演出时,我不再需要举着手机,通过手机屏幕观看整个过程。我可以直接看着孩子,而眼镜负责记录。这样我能够更加专注于当下,而不是为了拍摄而抽离出来。
主持:我完全理解这种体验。有一次我在泰国看到一场特别漂亮的日落,我本来下意识想掏出手机,但后来意识到自己戴着眼镜。于是我直接记录下了那个瞬间。我既保留了回忆,又没有通过屏幕去观看它,而是真正身处其中,那种感觉非常棒。
Alex Himel:这正是我们希望实现的方向。未来AI还会进一步优化这种体验。比如我们正在探索“自动捕捉”功能。设想一下同样的场景:孩子的生日派对、一个灿烂的笑容、蛋糕被端上来的瞬间。你不需要一直想着什么时候按下录制键,也不用不断摆弄设备。眼镜可以识别那些值得记录的时刻,并帮助你完成捕捉。当然一切都必须是用户主动开启的。你需要明确进入一个录制会话,明确告诉设备开始记录。
主持:Ray-Ban Meta的产品核心用例都有哪些?
Alex Himel:我认为目前最主要的使用场景其实是音频。打电话和听音乐,是眼镜最常见的使用方式。
我经常告诉别人,如果你准备出去散步,而散步本身就是一件对健康有益的事情,那么眼镜会是一个非常自然的伴侣。你可以晒太阳、活动身体,同时接电话或者听音乐。我们的扬声器表现非常出色,佩戴体验也很舒适。麦克风系统同样如此。我们配备了五个麦克风,并拥有非常优秀的降噪能力。
举个例子,我前段时间去滑雪。当时我正以每小时40英里左右的速度从山坡上滑下来,朋友突然打电话给我。我通过Oakley Meta接听了电话,一边滑雪一边和他聊天。聊天过程中我还问对方:“你能听出来我正在滑雪吗?”结果他们完全没有察觉。所以无论是滑雪、海边玩飞盘,还是其他户外活动,这种开放式音频体验都非常自然,也非常适合这些场景。
除了音频之外,第二大使用场景就是照片和视频。我们看到大量原本不会被记录下来的内容,通过眼镜被捕捉下来并分享到Instagram。比如巴黎奥运会期间,一些运动员训练过程中的第一视角视频就非常精彩。还有一位消防员朋友前几天给我发来一段视频,是他驾驶消防车赶往事故现场的过程,能听到警报声,也能看到整个现场环境。这些都是传统情况下很难记录到的内容。
而在我看来,AI将是下一条重要增长曲线。未来人们会逐渐发现,自己能够借助AI完成许多以前从未想过的事情,而且整个过程会非常自然。我认为AI的长期潜力远远超过今天的任何功能。只要看看整个行业过去两年的进展速度,就会发现它的发展令人难以置信。
但问题在于,对很多人来说,AI仍然像一张白纸。就好像我递给你一张纸和一支笔,然后告诉你:“画点了不起的东西出来。”很多人其实不知道该从哪里开始。
因此,我们正在尝试通过一些更容易理解的功能,让用户逐渐熟悉AI。比如自动捕捉功能,或者未来即将推出的一些其他功能。这些都是贴近生活、容易理解的应用方式。随着时间推移,人们会逐渐开始尝试更复杂、更高级的任务,真正发挥AI底层能力的价值。
事实上,我认为整个社会仍然在学习如何使用AI。最初,人们把它当作写作工具。现在你已经看到越来越多人用它来编程。接下来又出现了Agent和自主执行任务的能力。你只需要告诉AI一个目标,它就能够主动完成许多事情,而不需要你不断输入指令。
所以我认为,我们正处于一个快速演进的阶段。而我们相信,可穿戴设备最终会成为AI最理想的载体,因为它始终陪伴着你。它能够看到你看到的东西,听到你听到的声音,并且随时可以与你交流。未来,它甚至能够主动提供帮助,而不是等待你的指令。
透明镜片以及变色镜片使用频率最高
主持:这很有意思。我们似乎正在走向一个AI具备自主能力、能够替人完成任务的世界。
而回顾Ray-Ban Meta的发展历程,它最初其实是一款非常偏向户外场景的产品。我曾经和Google Glass项目负责人聊过,他最大的遗憾之一就是Google Glass最开始定位为室内设备,因为在户外环境下,人们对于佩戴这类设备的接受度其实更高。
这也引出了你们最新发布的产品。你们新款Meta Optical系列将于本月正式上市。它更轻、更小,续航更长,也明显更适合室内环境。您对于这款产品是怎么看的?(注:Optical系列硬件与Ray-Ban Meta一致,不过在产品形态特别为近视用户做了优化,比如它能安装更高度数的镜片)
Alex Himel:我们对Meta Optical系列非常兴奋。从工程角度来说,太阳镜通常拥有更大的镜框空间,更容易容纳电子元件。毕竟我们是在一个非常有限的空间里塞进摄像头、电池、扬声器、麦克风和各种计算模块。
相比之下,光学眼镜往往更轻、更薄,而且用户会全天佩戴,因此对重量和舒适度要求更高。过去几年里,我们在电子元件小型化方面取得了很大进展,因此现在终于能够推出更轻、更薄的新产品,也就是马上发布的Meta Optical系列。
不过,更重要的是用户行为数据。我们持续跟踪用户的活跃度和留存情况,观察他们多久使用一次眼镜,以及在购买一段时间之后是否仍然保持使用习惯。
结果发现,透明镜片和变色镜片用户的使用频率最高。这意味着很多用户已经开始在室内环境中佩戴智能眼镜,或者在室内外场景之间持续使用它。
比如你在户外打电话,然后走进室内。变色镜片自动变透明,而你可以无缝继续刚才正在做的事情。这种体验非常自然。因此,我们决定进一步优化这一方向。
Meta Optical不仅更轻、更薄,镜腿也更纤细,整体轮廓更加接近传统眼镜。它对近视用户更加友好,配备可更换鼻托,不同尺寸的鼻托能够适配不同鼻型。镜腿也支持调整,验光师可以根据用户需求进行定制,让眼镜更加贴合面部。
此外,我们还采用了新的铰链设计,使得佩戴体验更加舒适。这些改进看起来只是硬件细节,但对于一副每天佩戴十几个小时的眼镜来说,它们至关重要。最近我们已经向大量验光师和眼镜渠道合作伙伴展示了这款产品。未来用户可以像购买普通处方眼镜一样购买Meta Optical,在熟悉的眼镜店完成验光和配镜。因为我们的目标非常明确——让智能眼镜不再是一件科技产品,而是一副真正意义上的日常眼镜。
AI正从回答问题转向完成目标
主持:我们现在正处在一个关键时刻。越来越多的人开始考虑让AI参与自己的工作和生活,让它主动帮自己完成任务。我在想,如果我整天坐在电脑前工作,同时佩戴一副带度数的智能眼镜,那么是否会出现一些新的使用场景?
Alex Himel:当你观察AI的发展方向时,会发现它正在从“回答问题”逐渐转向“完成目标”。过去,我们会对AI说:“帮我写一段代码”“帮我完成这个任务”。但未来,你只需要告诉它目标,它就会自己想办法实现。
举个例子,我有软件工程背景,所以用程序员的案例来说明。假设我发现某个设备在低电量状态下的提示逻辑不太合理。我只需要告诉AI:“我希望它在低电量时表现成这样,而不是现在这样。”随后,AI可以自行查找相关代码的位置,理解逻辑,修改代码,生成差异文件(diff),最后交给工程师审核和提交。
再往前走一步,你会看到更多Agent能力出现。比如程序员常说的Cron Job(定时任务)。未来你可以安排AI定期帮你完成某些事情。举个例子,每周日晚上,我都会让AI自动整理下一周孩子们的日程安排,然后生成一份计划发给保姆。整个流程已经自动化了,我甚至不需要再主动参与。
除此之外,AI还会开始解决那些它过去不会解决的问题。它能够通过推理学习新的能力,并不断扩展自己的技能边界。我认为这会给可穿戴设备带来很多新的可能性。
比如我每天都会遇到很多“以后记得做”的事情。刚刚我们聊天时就提到,你推荐了一家纽约的披萨店。正常情况下,我可能需要把店名记下来,然后提醒自己之后去尝试。未来我只需要直接对AI说:“帮我记住这件事,并在合适的时候提醒我。” 它就会替我处理。
又比如这个周末,我准备带孩子去看纽约巨人队的比赛。我是纽约长大的球迷,所以几个月前就买好了票。我还邀请了一大群朋友,大概有二十个人。过去我可能会在待办事项里写一句:“记得把门票信息发给大家。”
但未来我只需要对AI说:“帮我给这四个人发邮件,把比赛门票和相关信息整理好发过去。”甚至不用告诉它邮箱地址,它可以自己从我的邮件记录和通讯录中找到相关信息,然后完成这件事。这就是它应该做到的事情。
主持:所以在你的设想里,眼镜其实是一个入口。你对它说话,而后端的智能系统会帮你完成这些任务。它跟很多人通过WhatsApp与AI交互有哪些区别?
Alex Himel:没错。虽然大家会使用不同的聊天工具,但很多人确实是在WhatsApp里完成这些事情。从我的角度来看,这个问题有两个层面。首先,我们每天都会遇到大量“差点忘记”的事情。
科技行业里有很多创业公司都在做任务管理软件,本质上都是想帮助人们记住自己该做什么。比如:“糟了,我忘记发比赛信息了。”“糟了,我忘记发孩子生日派对邀请函了。”这些事情每天都在发生。未来你只需要说一句:“帮我记住这件事。”然后AI负责后续执行。
还有另一个方向,我喜欢这样描述:假设有一个完全了解你的人,始终坐在你身边,并且总能在正确的时机提醒你。我妻子其实就很擅长这件事。如果我马上要说一句自己之后会后悔的话,她通常会在旁边轻轻碰我一下,让我意识到自己即将犯错。
现在很多人都觉得通知太多了。手机在震动,手表在震动,到处都是通知。所以人们完全有理由担心:如果再增加一个可穿戴设备,会不会只是多了一个打扰自己的渠道?但我认为,可穿戴设备真正的价值恰恰相反。
如果它理解上下文,知道你正在和别人说话,知道你现在是不是忙,知道你正在讨论什么,那么它就能判断:现在是不是提醒你的最佳时机?什么时候应该保持安静?什么时候才应该介入?这才是真正智能的通知系统。
主持:很多人谈论AI的时候,会把它描述成一种革命性的技术。但有时候我会怀疑:这些能力真的足以称得上革命吗?还是说它们只是帮我们提高一点效率、节省一点时间?也许是我要求太高了,我很好奇你怎么看。
Alex Himel:如果只是讨论通知本身,那确实只是一个小改进。但如果讨论的是能够理解你、主动帮助你完成任务的AI,我认为它会非常具有变革性。
当然,其中很多变化单独看都不算惊人。每一件事可能都只是:“哦,不错,方便了一点。”但如果你把这些改进叠加到一天、一周、一个月的时间尺度上,它们产生的影响就会变得非常巨大。与此同时,我也相信AI会做到一些真正令人震惊的事情。
未来它会完成一些你从未想过机器能够完成的任务,而那部分体验将会是真正革命性的。举个简单的例子。以前我跑步时一定会带手机,因为我要保持联络状态。作为一个父亲,我不能完全失联。后来有了支持蜂窝网络的智能手表,我终于可以不带手机出门跑步了。对于很多人来说,这似乎不是什么大事。但对我而言,这是一个非常重要的改变。
它看起来只是一个小功能,但却实实在在改变了我的行为方式。我认为Agent AI也会经历类似的过程。它会通过无数个看似微小的改进,逐渐改变人们的生活方式。而最终,人们会发现自己已经无法离开它了。
AI眼镜的竞争涉及多个维度
主持:除了Meta,现在谷歌、亚马逊、OpenAI、苹果都准备入军AI可穿戴市场,究竟什么因素会决定谁能赢得AI可穿戴设备这场竞争?是外形设计?是硬件体验?还是设备背后的AI助手?
Alex Himel:我认为最终不会只有一个因素决定胜负,而是多个因素共同作用。
首先,对于可穿戴设备来说,人们必须愿意佩戴它。如果用户不喜欢它的外观,不喜欢它佩戴在身上的感觉,不喜欢它所传达出的个人形象,那么即便它的功能比竞争对手强20%,很多人依然不会选择它。尤其是眼镜、手表这类产品,它们本质上也是个人饰品。舒适、时尚、美观,这些都不是附加条件,而是基础条件。
与此同时,软件也必须足够优秀。未来市场上一定会出现很多强有力的竞争者。无论是OpenAI、谷歌还是其他公司,他们都会推出高质量的产品。因此,对Meta来说,仅仅做好硬件远远不够。我们的AI必须足够出色。
这一点并不是什么秘密。Meta正在大规模投资AI,也组建了非常强大的团队,在模型训练和基础设施上投入了巨额资源。未来的竞争会非常激烈,所以我们的设备必须可靠、优秀,而AI则必须令人惊艳。目前我们已经在内部测试很多新的模型,对取得的进展感到相当满意。今年上半年,大家会看到一些非常有意思的新功能开始上线,包括手机端和可穿戴设备端的新能力。
主持:AI助手似乎比过去任何一种计算平台都更接近“赢家通吃”的格局。如果你真的信任一个智能代理,你大概率只会选择一个。这有点像电子邮箱——没人愿意同时维护很多个收件箱。对此您怎么看?
Alex Himel:我同意这种趋势。首先,大部分AI服务都是需要付费的。如果可以少付一份钱,很多人不会愿意同时订阅多个助手。其次,一个助手对你的了解越深,它的表现就会越好。它了解你的习惯、偏好、联系人以及你的工作方式,因此随着使用时间增加,它会越来越有价值。所以我确实认为,大多数人最终会主要依赖一个助手。
当然,也可能会出现不同助手擅长不同任务的情况。我自己可能算是个特殊案例,因为身处科技行业核心,我每天会同时使用很多不同的AI工具,并根据任务性质选择最适合的那个。未来是否会进一步整合,现在还很难判断。
但对于Meta来说,我们非常专注于两件事:第一,提供尽可能丰富的品牌和产品选择,让人们真正愿意佩戴这些设备;第二,把软件和AI能力做到最好。
事实上,我们一直都是这样思考的。今天大家看到市场越来越热闹,好像很多公司突然开始做智能眼镜了。但实际上,Meta一直认为这个领域迟早会迎来激烈竞争。过去很多公司都尝试过智能眼镜,但后来陆续退出了市场。而在别人退出的时候,我们反而选择持续加码投资。
这些年我们不断扩大投入规模,也持续推进产品开发。现在大家看到我们几乎每年都在推出新的硬件产品,但实际上,这些成果是多年持续投入积累出来的结果。如今大家开始看到这些投资逐渐转化为真正的产品和市场表现。
记住名字是一项实用功能
主持:关于AI设备,你觉得它会成为一个全新的设备类别,与手机等传统设备长期共存;还是最终会成为手机的替代品?Meta的野心是什么?是取代手机吗?
Alex Himel:我认为两者会共存。回顾历史,手机刚出现时,很多人认为它最终会取代台式机和笔记本电脑。但事实证明,这些设备并没有消失。实际上,在AI时代,我发现自己使用电脑的频率反而越来越高。手机获得了巨大的成功,成为最普及的计算设备之一。我认为可穿戴设备未来也会如此。
我们预计它们会拥有庞大的用户规模,被广泛使用,并创造巨大的价值。但这并不意味着手机会消失。未来你会看到,一部分今天在手机上完成的事情转移到可穿戴设备上,同时也会出现许多今天根本不会通过手机完成的新场景。
举个例子。AI设备能够识别你正在看的东西,这项技术其实在手机上已经存在很多年了。但绝大多数人不会举起手机,对着眼前的世界不断扫描和识别,因为那种行为本身显得有些奇怪。但对于可穿戴设备来说,这却是一种非常自然的行为。事实上,这是我们在智能眼镜上看到的最常见AI使用场景之一。
“我正在看什么?”“这栋建筑是什么?”“这个地标是什么?”“这是什么植物?”“这个蘑菇能吃吗?”
主持:最近《纽约时报》有篇文章报道Ray-Ban Meta在开发一个叫“Name Tags(姓名标签)”的功能。报道称,佩戴Meta智能眼镜的人未来可能通过AI识别他人身份并获得相关信息。对此你是怎么看的?
Alex Himel:首先需要说明的是,我们目前并没有推出这样的功能,也没有发布任何名为“Name Tags”的产品。但这确实是用户最常提出的需求之一。
例如,来自盲人和低视力群体的反馈。他们希望知道面前是谁,或者刚刚从身边经过的人是谁。参加会议和活动的人也经常提出类似需求。他们希望能够更容易认出以前见过的人。还有很多人只是单纯地希望记住别人名字。
我相信任何人都有过这样的经历:你见过这个人,也知道自己认识他,但就是想不起名字。
事实上,我们肯定不是唯一听到这种需求的公司。我相信很多公司都曾经做过类似功能的原型。但如果要真正推出这样的产品,就必须极其谨慎。
你必须确保隐私优先。必须确保它不会让人感到毛骨悚然。必须确保它在创造价值的同时,不会让周围的人感到不舒服。因为归根结底,如果我戴着这样的设备,而周围的人因此感到不适,那他们最终可能也不会接受这种产品。
因此,我们在设计任何功能的时候,都必须不断考虑这个问题。这里面不仅有隐私问题,还有用户体验问题,甚至法律问题。所以这绝不是一个可以草率推进的功能。市场上确实已经存在一些类似方案。盲人辅助领域里有不少相关应用,我记得微软以前也推出过类似产品。但对于Meta来说,我们目前还没有准备好推出这样的功能,也没有发布任何相关产品。这只是我们持续研究的方向之一。
新硬见·6月活动
更新:路演项目、嘉宾招募中、资本朋友+2
背靠深圳市物联网产业协会,【新硬见】关注前沿AI硬件,包括但不限于具身智能、AI眼镜、智能可穿戴、AI玩具。平台并试图给行业从业者构建更高密度、更具价值的圈子。【新硬见】正在组建四大群聊,欢迎扫码加入。
1️⃣ 机器人交流群
2️⃣ AI眼镜&可穿戴交流群
3️⃣ AI潮玩、教育硬件交流群
4️⃣ AI+智能硬件群