AI中国网 https://www.cnaiplus.com
导读:深度对话Ray-Ban Meta产品经理与界环AI眼镜创始人 无论是在硅谷还是中国,智能眼镜市场的竞争正逐渐升温。点燃这把火的正是Meta与Ray-Ban(雷朋)在去年9月联合发布的Ray-Ban Meta智能眼镜,这款产品在不到一年的时间内销量便突破了百万大关,成为智能硬件市...深度对话Ray-Ban Meta产品经理与界环AI眼镜创始人
无论是在硅谷还是中国,智能眼镜市场的竞争正逐渐升温。点燃这把火的正是Meta与Ray-Ban(雷朋)在去年9月联合发布的Ray-Ban Meta智能眼镜,这款产品在不到一年的时间内销量便突破了百万大关,成为智能硬件市场的一大黑马。
9月5日,高通CEO安蒙在接受外媒专访时提到,正在和三星、谷歌联合研发一款可与手机连接的混合现实智能眼镜,理想的形态是“外观与普通眼镜或太阳镜没有任何区别。”他认为“生成式AI将会弥补推广混合现实技术缺失的部分”。安蒙说,给他信心的正是Ray-Ban Meta 智能眼镜的成功。
事实上,该眼镜已经是Meta与Ray-Ban合作的第二款智能眼镜。根据金融时报的报道,Meta 正计划斥资数十亿美元收购 EssilorLuxottica (依视路陆逊梯卡,Ray-Ban的母公司)约 5% 的股份,该项投资的谈判已经入尾声。而谷歌最近也与EssilorLuxottica 的领导层接洽,商讨将其 Gemini AI 助手纳入未来的智能眼镜中。
根据晚点LatePost的报道,字节跳动也在探索如何将大模型与硬件结合。除了自己开发AI硬件,同时也会与外部硬件公司合作,包括智能耳机和AI眼镜等产品形态。随着这些国内外巨头躬身入场,“百镜大战”即将到来的说法并不夸张。
Ray-Ban Meta智能眼镜,图片源自官网
本期节目中,硅谷101邀请到了Ray-Ban Meta的产品经理可南,从第一视角还原了该款智能眼镜的设计理念与背后的故事。而在节目的后半段,我们与两位硬件领域的从业者,蜂巢科技创始人兼CEO夏勇峰和Hey Revia创始人卫骁对话,探讨了各类智能眼镜的实际体验以及他们对即将到来的百镜大战的看法。
本期节目嘉宾
以下是部分访谈精选
01 Ray-Ban Meta:先是一副好眼镜,再是一个智能产品
《硅谷101》:先请可南给跟大家介绍一下你在Ray-Ban Meta的这个项目中参与的工作。
可南:我目前负责的是下一代产品的开发。Ray-Ban Meta实际上是第二代产品,第一代产品是Ray-Ban Stories。
我们一开始在做产品定位时,就希望能给大家一款产品,让大家既能在生活中随手记录,不需要再掏出手机来,同时又能Live in the Moment。因此,我们将“拍照的相机”作为主要功能点来定义这款产品。
Ray-Ban Stories和Ray-Ban Meta对比,图片源自官网
我们第一代产品发布时有拍照功能和音乐功能,那个时候是没有AI功能的。第二代产品是在2023年底发售,我们在第一代产品发售之后,就知道还有更多的发展空间可以提升。
最大的一个趋势是AI在2023年刚好起来,而眼镜又是一个非常好的一个产品形态来承载AI,尤其是在外出时使用多模态的AI。
我们产品的开发周期通常在1到2年。当我们开始定义第二代产品的时候,主要考虑去突破第一代产品的局限,把它做得更好。但同时随着AI功能的出现,我们也在这一方面做了非常大的提升。
《硅谷101》:你刚刚有提到第一代的产品有拍照跟音乐的功能,音乐功能是指可以使用这款眼镜来听歌吗?
可南:对,很多人在第一次戴的时候很惊讶,说怎么音乐的效果这么好。实际上是有两个开放式的扬声器,很多人都以为是骨传导的。我们的音频团队做了很多工程,是直接导向于佩戴者的耳朵。但其他人,比如我站在旁边,是听不到它的声音。所以这个方向上是希望能有更好的音乐播放体验。
我们的产品在音频上有两个主要功能:一个就是听音乐,所以比起第一代的时候,我们第二代产品音量做大了50%,在低音部分做了很多提升。
另外一个比较大的提升是麦克风,第二代产品有5个麦克风,而第一代产品只有3个麦克风。比如你在打电话或者是在线上交流的时候,是需要去说话的。那5个麦克风就可以捕捉到更多的空间音频。
Ray-Ban Meta声音设计,图片源自官网
比如说我们戴眼镜的时候,这边有音乐播放的声音,然后那边有人说话的声音,如果有捕捉到空间音频,你重新去听你录的,无论是视频还是音频,都会有这个空间音频的效果。所以这两点实际上是这个眼镜很大的一个提升,尤其是比起第一代。
《硅谷101》:所以其实第一代产品在定义的时候,你就会把听音乐跟拍照放到一个非常核心的位置。
可南:是的,这是这个产品最大的两个功能。因为市场上实际上是有专门的音频眼镜,同时也是有一些比如说Snap的只带相机的眼镜。那么到底哪个功能是最重要的?
Ray-Ban Meta最大的一个优势是它是一个集成产品。作为一个用户,每天出门再带另外一个产品,那么我的心理负担就会很大。所以这款产品能取代我更多的工作流,能让我更方便的做更多事情,实际上对用户的价值是非常大的。很多人买我们这个眼镜的时候,可能想着,我出去旅游或者是运动时候会去用这个拍照功能,但买完之后,他们每天用耳机的功能其实更多,比如打电话或者听音乐。
而且他不用再频繁地去把耳机戴上摘下,比如我就戴着墨镜出去,或者现在可以配近视镜或者是渐变的眼镜,它可以一直就在你的脸上。所以就是这一两个很小的、省去用户再去使用其他产品的功能,使它的便捷程度给产品的价值会加成许多。
《硅谷101》:你自己在使用Ray-Ban Meta的时候,使用最多的功能是哪些?
可南:我使用最多的还是拍照功能,它能解放双手,在很多手想去做别的事情的时候,不用再把手机举到眼前。比如我之前去加州的迪士尼玩,坐过山车的时候,不可能是拿着手机在拍。
现在我可以全程佩戴着它,还有比较好玩的一些游乐设施我都用这个眼镜记录下来。我之前还有去看在旧金山一个演唱会,我觉得就特别好地证明了“Live in the moment,活在当下”。
因为平时我们去看演唱会的时候,你就很想录下来,但当你去录的时候你就得一直盯着这个小屏。你一方面想记录下来,但一方面又想沉浸式体验。我去看那个演唱会的时候,基本上全程只用这个眼镜在录制,结束之后就直接导入到我的手机里面。
然后我个人用来做运动视角录制也挺多,我之前打网球,第一视角的这个视频有很多时候是不方便拍摄的,那就可以现在使用这个眼镜。我们用户群体里面用它做运动记录的人非常多,有人滑雪,有人去打球,甚至有人跟小朋友、或者跟他的宠物玩的时候,都可以录制。这种用它去拍照记录,让你沉浸在其中的用户非常多。
《硅谷101》:它现在的整个拍照跟录像的镜头表现表现怎么样?比如拿最新一代的苹果手机或者是安卓手机对比的话,你觉得它的像素跟画质能达到一个什么样的水准?
可南:这个问题特别好。首先我觉得大家去想这个产品定义的时候,肯定会想说我们要把怎么样把这个像素做到最好,怎么样能让它跟手机持平。但是它其实最难的是,因为大家都希望这个眼镜更轻,更方便携带,电池时间的使用时间更长;但同时对像素和其他的组件会有更多的要求,希望它做得更好。所以在这个“既要又要”的时候,怎么样找到中这个平衡点就比较重要。
两代产品拍摄画面对比,图片源自官网
我们现在第二代这个产品实际上是1200万像素。我们用户在去用的时候,可能不是说这边录完直接就发到社交媒体上面去给所有人看,他可能是就是随手一拍的一个记录,所以他其实需要的是一个足够好,足够方便,让拍照需求来的时候,能抓住这个瞬间的时候的功能。
如果跟iPhone Pro后面三个摄像头来去比的话,像素肯定是会低一些的。但是它足够好到用在像比如我日常拍摄小的瞬间分享给我的朋友,或者是分享到比较短的视频平台,它的像素是大家比较满意的。
我们第一代产品其实是500万像素,第二代的时候我们觉得提到1200万像素,这样实际上是能够达到大家的预期。既稍逊于手机的后置摄像头同样的标准,但同时又能满足其他大部分拍摄短视频的一些需求。
《硅谷101》:为什么是第二代产品火?而且第二代产品也不是刚刚发售就火了,我注意到其实它是在今年开始起量的。那为什么第一代产品没有火?
可南:我觉得这个问题很好。其实它有很多的因素,比如从硬件、软件以及市场营销方面,还有一个更大的因素,就像你说的,每一个产品新的品类,其实是需要一定时间建立用户心智的,我可以从这三个角度都来聊一聊:
我们现在的这个产品,它的像素更好、音质更好。同时我们做了很多的尝试,怎么样能把这个眼镜做得更轻、更校所以我们在一些很细节的地方,比如眼镜腿可能只薄了一点,短了一点。但实际在佩戴的舒适度以及视觉的重量上,都会轻很多。在软件方面我们也做了很多提升,除了一些新的功能之外,我们还增加了比如直播和AI功能。还有一些很细节的,比如我们这个产品软件的完成度高不高,是否有一些bug,可能第一代有一些问题,我们没有完全解决就发布了。
那这个产品在用户体验上,如果蓝牙经常断,或者用户导出他的视频的时候出现问题,那么用户实际的体验感会非常沮丧的,他不一定会找到Meta,但用户可能使用过两次就放弃使用了。所以我们第二次团队内部对于这个软件的完成度、还有细节上的把控提出了非常多的要求。同时又增添了新的功能,这个我觉得也是很大一个改善。
第三个就是市场营销这方面,我们第一代产品发布的时候实际上是在2021年新冠时期,所以非常困难。第二代发布的时候是大家都听说了有这个智能眼镜,然后有一部分人使用过了,那么用户的心智和了解的程度也就更高。第二代发布的时候,我们去了更多的门店,包括在门店里面怎么去尝试使用这个产品,能看到一些demo,许多方面都有很多新的提升。
《硅谷101》:我发现第二代的充电盒比第一代的要小很多。
两代产品充电盒对比,图片源自官网
可南:对,这是很直观的一个感受。第二代用了雷朋很经典的一个款式叫Wayfarer,还有另外一个叫Headliner,你可以看出比如方形的眼镜和圆形的眼镜,喜爱的人群可能就很不同。所以实际上也回答你刚刚那个问题,就是怎么样能让更多人接触到这个眼镜?实际上眼镜是一个特别时尚的单品,就是你要戴到脸上,它一定是要么你特别喜欢,要么它特别有价值,你才愿意长时间在脸上佩戴。
《硅谷101》:这些眼镜的外观,是你们设计的还是Ray-Ban设计的?还是你们在Ray-Ban的经典款式里面选择的?
可南:我们和Ray-Ban一起设计的。我们希望从它很经典的这些款式里面能去挑一个能应用于智能眼镜的一个设计,然后再去把智能硬件的这些部分都做到眼镜腿里。
《硅谷101》:智能硬件主要都在眼镜腿里面,前面的镜框里面会有智能硬件的设备吗?可南:其实是有的,有走一些线,包括我们说5个麦克风,有1个是在鼻托的位置。
比如我现在脸上佩戴的近视镜,它可能很轻薄,但是它的眼镜腿很细。但是Wayfarer或者是其他的太阳镜,大家就能够接受它更大一点或者是更明显一点、镜腿更宽。
我们一开始在选择的时候,选了一个大家非常喜欢的经典的款式,而且刚好可以容纳这些智能硬件部件的设计。其实眼镜还有很多其他的人体工学的维度,比如这个鼻托,我们亚洲人可能低鼻梁多一些。而我们第一代做的时候是没有做低鼻梁的设计,很多用户戴上去之后发现不太合适。所以第二代又做了一个鼻梁稍微高一点的这样的一个款式。
《硅谷101》:这系列里的墨镜,还有近视镜,你自己平时都有使用吗?
可南:我个人两个都有使用。这款智能眼镜虽然已经很轻便了,即使它本身只有49克的重量,但再加上你配的镜片的厚度,那它就会更重一些。还有它这些松紧程度,比如我的鼻梁不是最高的那种,那我戴起来的时候,它是不是一直都是适合佩戴的高度,或者在佩戴时间很长的基础上,可能就没有办法完全去跟这种能够调整鼻托的日常的近视镜去比较。还有去跟比如可能二三十克,甚至更轻的眼镜来比较。
个人来讲,我觉得目前还没有到达可以长时间、每天都佩戴。但是说真正彻底替换,我觉得这个产品还有要改进的地方。但这个墨镜我就带的会更多一些。
《硅谷101》:你最长戴了多久的时间?
可南:我最长连续戴几天都没有问题,我其实婚礼的时候有戴这个墨镜入场,所以有记录第一视角的,现场所有人欢呼的视频。宾客其实一开始都没有看出来,大家回头去看的时候就觉得好棒。因为一开始大家以为你只是戴了一个很酷的眼镜,后来发现其实记录了一些特别有意思的瞬间。
这个我觉得是智能眼镜很重要的一点。大家不想戴上去感觉就像一个怪人,他希望说我很时尚,或者希望它能融入到我日常的生活中的穿搭。
《硅谷101》:你觉得好看,在消费者对一款眼镜的选择上,占比有多大?
可南:我认为非常重要。从消费端来看,现在市场上有很多智能眼镜,甚至有很多AR眼镜,然后带显示屏的,我觉得这点肯定是最被忽视的,就是它设计时选择的材料以及佩戴的舒适度,大家要非常非常喜欢。
《硅谷101》:刚刚我们聊过它的拍照功能,你有提到第一代产品是500万像素,第二代是1200万像素。我相信如果你要让眼镜和手机完全去“卷”这个拍照,它可能是能“卷”得出来的。但是它的缺点就是会变得很重,我很想知道你们在设计硬件的时候,怎么样去平衡它的功能性跟重量?
可南:所有的消费电子产品实际上都是一个复杂系统,它有很多需要权衡的地方,包括有功能、重量、大孝发热以及续航,所以怎么样能找到这个平衡点,是做一个产品最难的地方。刚刚你提到的一点,是我们没有办法去跟手机去“卷”,我觉得可能不用直接去跟它“卷”,因为它最大的价值实际上是,让我可以在想记录这个瞬间的时候,就可以马上记录下来,而且不让我从美好的时刻中脱离出去。这一点我觉得它实际上是在代替手机,记录一些“瞬间”的价值。
然后回答你刚刚那个问题,就是重量,我们其实一直在思考很重要的一个点就是50克。因为Ray-Ban那个传统的Wayfarer眼镜是45克,所以我们最后就想把它压到50克以下,能让大家更舒适的长时间佩戴,尤其是作为太阳镜的形式。
所以我们团队做了很多工作,怎么样把续航时间加上来,然后又加这些新的功能,同时产品又想做的更小,最后我们的产品实际上是49克,所以只比普通的Wayfarer重了不到5克,但是所有的智能的功能都有。
《硅谷101》:续航时间是多久?
可南:目前是5个小时。我们说续航时间的时候,其实根据不同的使用场景,是不一样的。这5个小时是按照我们发现的,用户会拍多少视频以及听多少音乐,我们取了一个中间值。用户最大的一个反馈就是希望续航时间更长,我觉得这就是最难的一个点,要么就是更多优化的软件,要么电池就更大。但与此同时我们还希望它做的更轻、更小,所以这是我们每一次去权衡的时候都要考虑的问题。
《硅谷101》:你们为什么会选择Ray-Ban作为你们的合作伙伴?
可南:Ray-Ban(雷朋)的母公司是司EssilorLuxottic,是Essilor(依视路)和 Luxottica (陆逊梯卡),这两家公司合并在一起,现在是眼镜行业里面的领头羊、最大的公司之一。
依视路本来是做镜片的一个公司,陆逊梯卡是做传统眼镜的镜架以及各种不同的子品牌。各种品牌不同的眼镜设计以及镜片是非常重要的,比如近视镜片上面不同的涂层,反蓝光的涂层,或者是渐变颜色的镜片,这些的技术也是很重要的一个部分。
还有线下渠道,除了这些品牌的渠道,比如在美国购买眼镜,有一些是需要有保险的,或者验光的渠道,EssilorLuxottica这个公司在这些方面的渠道也是有非常多的布局,所以是一个非常大的从端到端的一个公司,细节大家都可以在网上查到。
眼镜市场实际上是一个特别长尾的市场,它既有一些非常大的品牌,比如像雷朋或者是这些时尚品牌。但与此同时,无论是在中国还是美国,有非常多传统的渠道,包括专卖眼镜的渠道,甚至一些很小的品牌,它可能就只做很少的眼镜批次,再有一个验光师,也就可以售卖眼镜了。
回到我们讨论的主题,如果现在去做的这个产品,可以有最经典的一些设计,但是否能满足到大家这么长尾的,对设计和渠道的一些需求?这个还是眼镜市场比较难做的一个地方。的确是有最大的几个品牌,同时又有很多长尾的小公司来满足大家对眼镜的需求的选择,还有购买渠道的选择。
《硅谷101》:你觉得做好一款眼镜,最重要核心点是什么?
可南:我其实做了这个产品之后,学到了很多。让我比较惊讶的一个地方是,我一开始可能会觉得,它是一款智能眼镜,那么肯定是对科技感兴趣、对拍照以及音乐功能感兴趣的人,他们可能会从传统的电子消费渠道过来看一看。
但我们发售之后发现,实际上很多人会去雷朋的渠道体验,大家会想,该怎么样去配镜验光?这个能不能走我的保险?我在哪里的线下店能体验到?如果你去一个Best Buy的线下店,它对眼镜产品的试用体验,以及店里的员工能给到你的支持,肯定是跟雷朋以及传统眼镜的这些渠道是很不一样的。
所以实际上是我觉得以后眼镜发展的越来越智能的情况下,不同的品牌、不同的公司怎么样去想好全链路的给客户的体验和服务,这一点是非常重要的。
《硅谷101》:你在日常佩戴的时候有用到哪些AI的功能?
可南:我之前去洛杉矶的Getty Museum,比如当时有一个雕塑家的介绍,写了一个超级长的介绍,我就先让Meta AI帮我简化了一下,因为我其实不需要那么多信息。
植物的识别我也用得很多,翻译其实也用得很多。比如我之前在国际旅行的时候,比如有一个西班牙语的菜单的时候,它就直接会给我翻译成英文,然后读到我的耳朵里面。
《硅谷101》:它是可以直接“看”着那张图片读的吗?你问雕塑的时候,你是需要拍照,然后再交互,还是不用拍照,就直接可以交互了?
可南:你说:Hey Meta,look and translate this,它就会拍一张照,再加上你提出的问题,然后提供多模态的反馈,拍照这一步是肯定需要的,不然是没有视觉输入这一步的。
但我们想做的是以后怎么样能更自然,怎么样能在用户的确是需要拍照等多模态的输入的时候才去做,这个也是我们研究的一个方向。
Meta AI使用示意,图片源自官网
《硅谷101》:你觉得大家在用这款产品跟AI做交互的时候,现在的交互水平达到你们的理想水平了吗?它现在可以多轮对话吗?
可南:现在是可以做到的。比如你问完一个问题,会有一个声音告诉你它在听。这个交互比较有意思的一点就是眼镜的这个形态,刚好是在第一视角,有麦克风和扬声器,所以它就是“所见即所得”。
《硅谷101》:它相当于有人类的视觉、听觉和语言能力。可南:对,其实就相当于以前大家做智能音箱和语音助手时想要实现的功能。现在大模型发展得很快,技术的发展让用户直接就可以获得更多的价值提升。
我觉得眼镜这个形态已经能让大家很自然的交互了,接下来就是这个模型的能力怎么样能够提到更高,同时延迟怎么样能做的更短,怎么样能做到多轮交互,然后使用更长时间的一个优化。
《硅谷101》:你觉得在做这个产品的过程中,解决的最大的一个难点是什么?
可南:我们刚才提到了音频问题,我们有5个麦克风。其中一个麦克风在鼻托上,进行音频录制时,只有将麦克风放置在这里才能获得最佳的环绕捕捉效果。
但是我们发布这个产品的时候就发现了一个问题,就是不同的人鼻子的形状以及佩戴时候的接触点是不一样的。
我们一开始在做测试的时候,麦克风放到鼻托上并不会被挡住的。但实际上发布之后就发现,不同的人佩戴的方式以及高度不太一样,有的时候会对音频捕捉有一些影响。有的时候声音不是很清晰。或者是用Meta AI的时候,它没有被唤醒。
这个问题我们一开始发布后很快就发现了,我们内部的产品和工程团队就全员参与,大家一起来解决这个问题。我们其实提了很多种方案,因为硬件要做改动是非常困难的。后来我们就发现可以去检测麦克风是否有被挡到,然后再去用一些算法的方式把它转移到其他的麦克风。
这个就是我觉得很细节的一个设计,这是一个穿戴式的设备,而且是戴在大家的脸上,每个人的佩戴习惯以及的脸型都不同,所以要做到不只是适合舒适地佩戴,还需要考虑不同的人在使用功能性的时候会不会有一些影响,所以是一个很细节的问题。
《硅谷101》:现在Ray-Ban Meta的这款眼镜火了以后,市场上做智能眼镜的公司变得好多,找Ray-Ban这家公司合作的公司也很多。
可南:是的,智能眼镜这个概念出来已经不是一天了,但我觉得在当下这个时刻,Ray-Ban Meta实际上是验证了Camera和Audio Glasses以及AI Glasses的定义,它已经找到了Product Market Fit(产品市场契合度)。
然后我们需要有更多的用户能用上这个产品,肯定有不同的很多品牌想去做,无论是在设计上或者功能上的一些突破。
遇到一个全新的品类出来,尤其是消费电子类,是很难的。过去这些年可能比较大的产品除了手机、平板之外,可能就是智能音箱、智能屏,和智能手表。所以我觉得这个浪潮如果能有更多的品牌、公司进来,都去尝试不同的功能,会让它发展得更快。
《硅谷101》:我有看到扎克伯格在他的采访中也提到了一些辅助类的AI产品,比如他其实有提到带神经接口的智能腕带,我知道你之前也设计过。那是一个什么样的产品?
可南:这个产品有出一些Demo,就是通过手部的神经元,可以有一个腕带,上面会有一些电极,然后来达到操控目的。它的原理是我们去动手指的时候,在手指本身已经做出来的这个动作之前,你的神经信号就会传到边。所以你现在直接去做一些手势,或者是做一些微手势,这些信号都可以被捕捉到,然后信号可以直接操控系统里,或者APP方面的执行。
Meta Reality Labs的智能腕带产品原型图,图片源自官网
目前VR、MR Headset和智能眼镜的在显示方面的光学模组是不一样的,同时产品的使用场景以及大小也是完全不同的,但它们都会有一类很大的问题,就是交互模式是怎么样的。具体落地到不同的产品上又有不同的权衡,所以选的技术路线不一样,UX的丰富程度也不一样。
02 传统硬件+轻度智能:Ray-Ban Meta提供的新解法
《硅谷101》:先请夏勇峰和卫骁分别跟大家分享一下你们的使用体验,它是一款什么样的产品?你们觉得它吸引你的点是什么?
夏勇峰:它最吸引我的点就是,它在传统墨镜的部分做得挺好的。首先它外观相对比较时尚,其次传统墨镜需要有的佩戴的舒适度,它基本上也能够满足,额外的就是它的充电盒做的很漂亮,会给我一些新的感性上的一些好感。其他的功能我觉得就续航稍微有点短。
到目前为止它的AI的功能,虽然它还没有订阅费,但是对我个人来说不是特别的有用。希望未来它的AI功能可以再增加一些。
《硅谷101》:如果你不是一个智能眼镜产品的创始人或者狂热粉丝,你只是一个普通用户,你会购买这款产品吗?为什么?
夏勇峰:我不会。因为对我来说墨镜不是每天的刚需,所以一个墨镜它再好,在我的使用场景里相对是比较有限的。只有在开车,或者在户外跑步的时候会使用,再加上它的续航的时间很短,我要在特定的时间不停地注意它的充电问题。所以这个时候,我更愿意选择在车里随便放一副墨镜就好了。而且它还没有特别独特的功能,让我愿意去购买它。
卫骁:现在的Ray-Ban Meta基本上平替掉了我的墨镜。除了墨镜之外,它还平替掉了我的AirPods。我使用墨镜的频率非常的高,基本上我的车上肯定会放一两副墨镜,同时也会把AirPods随时带在身上,因为我经常会要开会,Ray-Ban Meta很好的解决了这两个问题。
另外一个我在Ray-Ban Meta里边用的AI功能可能不是很多,但最基本的AI功能,比如它能够帮我查一个天气,帮我拍一个照片,或者查看一些信息,比如股票怎么样了,它还是能够相对比较稳定的帮我解决这个问题。
《硅谷101》:你们有用过Ray-Ban Meta一代的产品吗?
夏勇峰:第一代产品我很熟,叫Ray-Ban Stories,这个其实是没有达到预期的,这里面有很多的原因,是最核心的可能还是第一视角的摄像头,当时的画质还不够好,所以它很难进行真正的正向传播,这是我觉得核心的原因。
还有就是大家对这种创新产品的第一代产品,大家的预期会拉的比较高一些,但实际使用了之后,可能觉得没有达到自己最开始想像的那个样子,这可能是另外一个原因。
《硅谷101》:我还听说过几种市场的观点,认为第二代火了的原因是它可以直接与Instagram和Facebook等社交账号打通,还可以在不用手持的情况下进行录像,录完像后它是可以直接把发布到社交媒体的,甚至可以拿着这个眼镜去做直播。
夏勇峰:这个其实也跟画质有关,如果画质不够好,或者录制时间比较短,在短时间内如果不能产出比较有效的视频内容,它其实就没有后面那部分了。
主要是高通终于有了一个叫AR 1的芯片,有AR 1和AR 2。因为我们之前也做眼镜相机类似的产品,AR 1也问过我们是否要使用。但后来我们犹豫了一下,觉得功耗可能扛不住,所以我们没有做产品的迭代。这个芯片其实是他们画质提升非常重要的一个原因。
《硅谷101》:你们自己的产品会配置高清的摄像头吗?
夏勇峰:我们自己的产品目前不带摄像头。我个人观点是,我们坚决不把摄像头放到目前的眼镜上,因为我们目前做的是更适合中国市尝能够兼容和替代全天佩戴的传统眼镜,这种眼镜如果带摄像头,它反而给用户带来了使用体验的下降。
比如很多的场合其实是不适合戴一个有摄像头的眼镜去的。不管是在开会,还是去上洗手间,还是一些其他的场合,反而是需要把眼镜摘下来的。一个带摄像头的近视镜,很难全天使用,这个是我们目前没有加摄像头的原因。
如果未来我们也做墨镜,可能会考虑加摄像头。我们现在做的是全天候佩戴的带耳机功能的,能够替代传统框架眼镜的眼镜。
《硅谷101》:目前Ray-Ban Meta的眼镜在整个智能眼镜的赛道上,它是一个什么样的定位,它有哪些功能?大家在提到智能眼镜的时候,通常指的是什么?我们怎么样去划分智能眼镜的品类?
夏勇峰:Ray-Ban Meta其实是智能眼镜一个新的赛道,之前它不在智能眼镜的范畴里面。经典的智能眼镜其实是以XR为主,XR就是AR和VR的统称。以前的Quest系列,它就是属于典型的VR眼镜。
AR的眼镜指的增强现实,它可以在现实中叠加一层数字的内容,这层数字的内容可以帮助到你的日常生活和全天候的场景,这个是AR眼镜的定义。但是因为技术还不够成熟,现在还没有特别成型的产品出来。
所以有人在VR的基础上想出了一种迭代的路线,叫MR混合现实,它是用摄像头去拍摄现实的景象,然后把它实时的,就像你拍照的时候预览画面那样,把它呈现在全封闭的一个显示器上,在这个基础上再去叠加内容,我们管它叫MR混合现实。
之前智能眼镜大概就这三种,但是到目前为止还没有特别成功的产品出现,有很多有影响力的产品,但是最后都没有实现一个合理的商业闭环,就是没有赚到钱。所以智能眼镜它是一个投入巨大的赛道,但是到目前为止产出非常的有限。
到Ray-Ban Meta其实是在AI时代提供了一个新的思路,就是做好一个更好的传统眼镜的基础上,叠加一些相对轻度的智能,这些智能的功能是围绕着AI来建立的。它也是一个新赛道的开始吧。
《硅谷101》:我知道Bose,就是做耳机的公司,也做过智能眼镜。你有了解过这款产品吗?
夏勇峰:那款产品的销量其实挺高的,售卖超过了100万副。我们周围的朋友调研和分析发现,它的问题是可能出在良率上。产品质量的问题会导致大家需要反复地去维修,也会给带来很高的成本。
Bose音频眼镜,图片源自官网
我有好几个朋友是以前Bose音频镜的用户,最多的是在一年内拿去返修了五次,虽然每次都是免费的。它的问题主要出在硬件架构上面,它是一个连线的方案,但同时它的镜腿又需要折叠,在反复折叠中,连线就会变得不稳定甚至坏掉,这是一个物理原因。
《硅谷101》:你们是怎么去考虑智能眼镜的定价的?
夏勇峰:首先我们肯定不会根据成本定价,其次我们定价的核心的锚定其实是传统眼镜,包括如果我们要做墨镜,是要根据传统墨镜行业的调研报告,以及实际用户的访谈来定价的。我们的定价其实是接近于传统眼镜,略微要高一些,大概是这样的一个策略。
卫骁:我可以作为一个在美国的消费者来考虑这个问题。一方面我自己的眼镜也是普通的Ray-Ban Glass。Ray-Ban Meta其实是在我现有的眼镜上加入了AI和耳机的功能,那我就会考虑到,多加的AI的功能和价值是不是超过了我现在的眼镜。
在湾区这个地方,基本都是要戴太阳镜的。Ray-Ban本来跟一些眼镜店也有合作,你的医疗保险是可以覆盖一部分眼镜的费用的。尤其是一些比较好的公司,它可以覆盖的医疗成本就会更高一点。
在这个角度来说,它的做工和质量有保证,同时医保又能够覆盖一部分。那多加出来的AI和耳机的功能,只要能够平替其他的任何一个功能,对于大部分人来说,其实不是一个很难的选择。
《硅谷101》:其实这个就印证了刚刚讲到的,在传统眼镜跟用户的接受度上的一个定价。
夏勇峰:一直以来Meta的定价策略都不是比较高的,Ray-Ban Meta的毛利比Quest高的,但是也没有高到能让它很快就可以盈利的程度。
而且它其实还有一个新的问题,Meta其实是可以进一步的降低它的价格来获取销量,它整体的盈利因为销量的增加也不会造成比较大的影响。
但它是一个商业的选择,因为它不能那么强势地去取代Ray-Ban的传统墨镜。如果它的定价已经接近一个更低的临界点,就会出现一个虹吸效应,会把美国现在的传统墨镜的用户全部给吸过去。哪怕它的智能功能目前还没有办法提供特别高的附加值,也会出现这样的情况。所以它的定价也有一些商业上的影响需要去考虑。
《硅谷101》:而且在定价上,Ray-Ban也是合作方,Meta跟Ray-Ban是有一个分成的。
夏勇峰:对,这一块其实也是Ray-Ban很重要的一个成本的构成。为什么最近Ray-Ban出现了跟Meta竞购股份的事情,也就是为了确保他们未来持续的合作,不能让传统的智能墨镜品牌觉得他们在蹭、甚至在收割自己。
《硅谷101》:我看现在很多其他的科技公司,已经有新闻曝出来的都在找Ray-Ban合作。
夏勇峰:对于Meta来说,Ray-Ban带来的核心主要是品牌和用户心智长时间的建立,以及它基于墨镜的分销渠道。这两个是Ray-Ban非常核心的价值。工厂包括供应链上游这些其实影响不大。
卫骁:未来肯定是智能眼镜到最后会向可穿戴设备的方向去发展,也就是往AR和VR的方向去发展,因为我是觉得智能眼镜和AR之间是没有特别明确的鸿沟。我感觉可能这些厂商会做像Google当时那样做一个智能眼镜,它当时并没有思考过要跟某个公司去合作。
03 “百镜大战”?越靠近传统眼镜越安全
《硅谷101》:我问过很多人,大家都觉得Meta的这款智能眼镜,它其实不是一个特别创新的产品,因为它核心的功能点,它有耳机很方便、可以拍照等,这些其实不是那么新的技术。
卫骁:我其实正好有幸见到扎克伯格几次。其实他讲过很多遍,他觉得在手机时代,Meta其实是吃亏的,因为它不控制某个硬件平台。所以当比如iOS或者Android告诉它说,你的广告不能再在系统上分发的时候,有很多功能其实就没办法继续做了。
扎克伯格展示Ray-Ban Meta的佩戴体验,图片源自Instagram
所以站在Meta的角度,我相信它们肯定是想做一个硬件平台,能够取代掉所有的手机,以及其他的硬件。它想做一个渠道的完整地打通,包括小屏、大屏、全面屏,想把整个生态系统做出来,所以它希望在未来的可穿戴设备上面,不单单是只是一个玩家,它是希望能够占领很大的一块市常
夏勇峰:我们和很多人,都有一个定论就是,AI会比AR会更早到来。真正能够推进智能眼镜发展的,在目前比较短的两三年的时间里来看,AI可以发挥比AR更大的作用。
在过去的一年,我作为相关的从业者其实是有一些被打击的。有两件事情:第一件就是Vision Pro发布之后,销量没有达到大部分人的预期;第二个其实是字节的Pico在资源下降了之后,它的销量下滑得非常快,我们在后台是可以看见的。
这两个事情,会让我们去思考这条路,不能光靠硬怼,把一个过于创新的眼镜产品直接投放到大众的消费市场,它的难度其实是超过了所有人的预期。
我们之前也统计了一下,在过去的20年全世界在XR上的投入,这个投入有人说的很夸张,说这个投入足够奥本海默做十次原子弹了。但是到目前为止,XR领域还是没有足够好的产品出来。
所以现在我们会做一些看起来不那么创新的产品,因为那么创新的产品作为一个头部的硬件设备,大家是真的不用,这是一个非常现实的问题,哪怕你的技术已经足够成熟了,能够非常稳定的交付给用户。但是用户把它跟传统眼镜去做对比的时候,还是会觉得它不够舒服。同时它自己的价值其实没有那么大,尤其是跟手机和笔记本电脑相比,所以就会出现一个天然的、巨大的鸿沟。
《硅谷101》:为什么字节把Pico的权重下降了以后,它的销量会急速的下滑呢?
夏勇峰:不管是Pico还是同类型的其他的产品,你的品牌和产品已经推送给这么多的人了,但是留不下来,不会变成新的购买,核心就是用户流通和持续购买的意愿偏低。
《硅谷101》:要把XR推广开来,最大的难点在哪?
夏勇峰:最大的难点还是大部分的人对于这类产品是没有概念的,所以他们会把这类产品的佩戴体验锚定在了传统眼镜的佩戴体验上。
如果跟传统眼镜的佩戴体验去比,这类产品就会出现非常明显的不达预期的地方,比如重量、佩戴不舒服、甚至眼睛疼、耳朵疼。因为五感很敏感,特别是有一些高敏感的人群,包括什么鼻梁疼,自己的头都承受不了、不适合自己的发型、颈椎疼等等。
卫骁:我自己是每天使用Vision Pro的,用Vision Pro的时候其实是非常方便的,就是基本上可以把任何一个地方变成一个办公场所,同时因为它是一个沉浸式的体验,完全就可以忽视掉周围环境对你的影响,我个人觉得这个效果非常好。
但确实最大的问题是,你在里面很难找到一个平衡点,就比如在我的场景里面就是屏幕,屏幕非常重要,但对于大部分人来说,可能它不是一个常用的场景。
夏勇峰:其实我也是每天使用Vision Pro的,但是我主要就是使用它的正念,让我冥想或者是放空会非常的舒服,比其他任何设备都要舒服。
《硅谷101》:刚刚两位都有讲到这个眼镜的AI功能对你们的吸引力并不大。夏勇峰:对,其实大部分人购买它的原因并不是AI。我之前看到一个报告提到,用户购买它的原因,这能够第一视角的拍摄占到了42%。但其实Meta AI在过去的六七个月,比我想象的进展要慢一些。
卫骁:我觉得Meta的AI能够火的另一个原因,是之前的AI Pin和Rabbit做得实在是太烂了,造成大家对于一个AI硬件的预期已经非常低了。突然发现有一个可以查天气而且都查得很准的这样一个AI,就觉得这个AI太完美了。
夏勇峰:查天气,其实并不属于大模型具有的能力,有些大模型可以支持查天气以及当天的一些新闻和信息,有一些大模型它主要是情感陪伴和音色做得比较好,但是它并不支持查天气。查询天气虽然很实用,但包括我用语音控制一些设置的功能、拍照的功能,它们都属于传统AI或者传统语音的功能。
也反映了另外一个问题,就是用户根本不知道自己要用AI来干什么,或者用大模型来干什么。对于大众来说,它的自由度过大了。然后要让你用对话框或者用语音来问,一张嘴都不知道要说什么,这个是一个非常普遍的现象。
卫骁:最早的时候Google Search查天气占到可能有30%的使用量,大部分人拿到的第一个反应就是先查个天气。当用户觉得最基本的功能都没有办法满足,作为一个简单的AI都没有办法给我提供一个准确的信息的时候,用户对你这个东西的预期会快速下降。
所以我确实同意,大语言模型不是做查天气最好的,但是终端用户并不会关心到底是大语言模型AI还是普通的AI,只知道我现在需要做一件简单的事情,它能帮我做了。
《硅谷101》:现在有很多创业公司都在做智能眼镜,你们怎么看这股智能眼镜的创业潮?
夏勇峰:我先说一下中国市场,目前我们已经知道的应该是超过50家在做了。因为最近有很多朋友在我们发布会之后来跟我们沟通过,甚至也有人说达到了80多家。因为他们每天会收到各种各样的BP,包括供应链上游的解决方案商,他们会收到各种各样的问询,他们要做各种各样的报价,非常热闹。
但是对我来说,我觉得它只是一种“卷”的缩影。大部分创业公司可能还是没有想清楚,但是先干了,因为干这个方向能融到钱。
但我觉得不会那么热闹,也不会那么地持续,它可能会是一场快速的战斗。因为Ray-Ban Meta这样的产品,它是全方位的,其实对一个团队,特别是一个资源没有那么多的中小团队,我觉得几乎是无法完成的一件事情。
他们可以把这个产品做出来,但是不管是从他们的认知上,还是从他们的更高维的一些资源的获取上,比如有一个核心的要素是品牌,他们自己的品牌肯定是不够的,而他们自己的品牌可能不足以支持全方位的需求。比如泳池清洁机器人、摄像头、行车记录仪,这都是之前发生过的中国公司在美国“卷”过的一些品类。
Ray-Ban Meta的整个门槛会高非常多,它不是做了一个眼镜然后号称去接了OpenAI就能解决的问题。这不是一个性价比的产品,它不是比Ray-Ban Meta卖的便宜一半,就能获得一个更大的销量。
要做得足够好,上限其实是很难做出长板来的,还需要除了硬件之外,在软件上要做非常多的事情,需要有全栈的一个软件团队,因为没有人能把所有的事情都做好。比如需要有眼镜固件的工程师、需要有手机APP工程师、手机系统工程师、服务器工程师、AI训练工程师,这一切是非常高的一个成本,也未必能够组建出这样的团队,组建出来之后也未必会有比较好的AI应用出现。
到最后就变成了只能连接大模型、依赖于大模型的迭代,目前我们看到的大部分创业公司,可能未来都会面临这样的情况。
《硅谷101》:所以你们要做对什么事情才能长期留在这个赛道?
夏勇峰:我们需要走得更快一些,我们需要把AI想得更清楚一些,不要抱侥幸心理依赖解决方案商去做,硬件和软件都需要我们自己做。
同时我们离传统眼镜越近,未来就越安全,因为传统眼镜在过去100年中已经证明了很多特点,而这些特点对于大公司来说很难去做。
《硅谷101》:你是指比如镜片为什么能做到那么雹戴的舒适度很好,包括它的渠道,就是类似于这些特点吗?
夏勇峰:比如传统眼镜已经证明了这类产品它需要极大的多样性,就是它的SKU需要足够丰富。但是对消费电子厂商来说,它需要减少自己的SKU数量,单个的SKU它需要有足够大的量,把所有人全部标准化,才能够有更高的效率,这是消费电子厂商他们刻在骨子里的事情。
以前小米手环做到8种腕带的颜色就已经非常极限。而现在一个眼镜,要带镜头,同时是一个连线的方案,要做超过10种框,这件事情在任何的大厂应该都是不被接受的。因为你整体的库存管理体量太大了,整体的生产线的管理、后台会变得极其的复杂,会带来很多的效率方面的问题,比如有些缺货,有些又库存过大,就是很多风控方面的问题。
如果大厂也去做镜片服务,就会变成一件更加复杂的事情,因为每一个人眼睛的状况都是完全不一样的,没有办法完全兼容,和用标准化的方法去解决。但这是传统眼镜有的东西。
《硅谷101》:如果做定制化的镜片,成本会很高吗?
夏勇峰:这个成本还好,因为传统眼镜行业镜片的毛利是很高的。镜片的定制其实对Ray-Ban Meta来说是比较容易的。
只是如果以我的个人观点来看,是觉得带镜片使用的Ray-Ban Meta,它其实没有办法长时间的使用,如果需要长时间使用,要么随身携带另外一副眼镜,在一些场景下可以替换;要么就是有某一些功能,在它的使用场景里没有办法被替代,只有这两种可能性。但是对大众而言配近视镜来使用,我其实是表示怀疑的。
《硅谷101》:如果没电了,那就作为一款普通的眼镜使用就可以了。
夏勇峰:那要看它在有电的时候能给带来多高的价值了。如果没电了之后要把一个40多克的一个产品戴在头上,对很多人,特别是亚洲人来说是很有压力的事情。消费者能接受的重量基本上是在20到40克以内。
《硅谷101》:在智能眼镜中加入芯片和耳机功能后,会增加多少重量?
夏勇峰:要看你的技术水平、堆叠水平以及核心器件能力。加相机和只有音频是完全不同的两件事。只有音频可以理解为TWS耳机的一个方案,只需要麦克风和音响,需要更大的体积和音腔,因此重量会稍微重一些。在不考虑电池的情况下,大约只有几克的重量。
电池的大小取决于产品的续航时间,续航时间越长,需要的电池就越大。电池本身也有几克的重量,如果想要相对满意的续航时间,那么整个产品的重量大约在十几克左右。
对于加摄像头的产品来说,由于它是百分之百的连线方案,所以不能使用TWS分体方案。这种方案的好处是只需要一块电池,但缺点是需要更大的电路板和新的摄像头芯片。此外,如果需要更好的录音效果,还需要更多的麦克风等设备。因此,极限重量应该在20克以上。
我们自己的产品在电池方面投入了大量精力,甚至已经接近了在电池基础材料和封装技术方面的现有极限。未来我们希望电池保持相同的容量,但更轻、更校这也是未来我们需要逐渐接近传统眼镜最大瓶颈之一。
《硅谷101》:如果现在我们把智能眼镜放在一个终极的视角来看,你们觉得未来它有没有可能取代手机,或者是类似于“第二部手机”的这样的一个产品?
卫骁:我其实仔细研究过,当时乔布斯第一次发布iPhone的时候,在发布会上展示了三个功能:第一个是浏览网页的功能、第二个听音乐的功能、第三个是打电话的功能。我认为如果要取代手机,这三个能力是必须要做的。
乔布斯和第一代iPhone, 图源:Wikipedia
夏勇峰:我出来创业之前是小米手机部的部门总经理。我们公司长期的愿景,就是希望在我们下半辈子的时间里看到这种可能性,并且我们是推进了进程的公司之一。
所以说未来它有没有可能,我是觉得它是必然会发生的,但是它跟当下的技术是没有关系的。人好不容易学会直立行走,手部非常灵活,可以做各种各样的事情,不是为了拿手机的。
从直观上来讲,未来跟数字世界还有真实世界去做交互,去做各种各样的交流,你直接通过头上的设备去完成一切,会更加自然,然后把手留给其他该做的事情。所以这个是我们觉得必然未来头戴的某一个产品或者某一组智能设备,必然会取代手机的原因。
但是在现阶段还离得很远,非常远。除了刚才提到的AR还不行之外,虽然Ray-Ban Meta是一个积极的信号,但所有的一切才刚刚开始。AI可能会给这个进程带来一个推力,这个推力会使得智能眼镜替代传统眼镜,传统的墨镜的路径能够开始。但这个开始能不能在这一波就完成革命性的替代,可能还需要3到5年的时间才能够检验。
《硅谷101》:那这个产品是否可以是智能戒指或智能手表等等?
夏勇峰:每天会使用它5个小时以上才有机会。
《硅谷101》:手表我可以一直戴着它,也不会嫌它重;戒指也是,它还可以监测我的睡眠。
夏勇峰:它可以监测,但是它没有办法跟你交互,或者说它跟你交互的能力非常弱。
《硅谷101》:可以用声音来交互,它还有屏幕,可以直接语音唤醒。
夏勇峰:你没有办法给它发指令,让它去完成一些工作,或者获取一些你想要的信息,对戒指来说是比较难的,但是我是觉得对手表来说是可以的。
卫骁:按照现在湾区的技术推演,可以看到无论是Google Gemini到Apple Intelligence,大家都在重新思考,人和一个应用或者未来科技怎么去交互,大家觉得这个语音是最简单的交互方式,你可以通过语音快速的获取一些信息,就会大量的降低人和技术的交互的成本。
从这个角度来说,所有的应用都会退化成一个语音交互、或者快速通过自然语言或者自然图形识别这样的方式交互。
一个人每天获取的信息是非常有限的,因为你也就只能看那么多和听那么多,还有说那么多东西。当你把信息推向到你的手表上,或推到了穿戴设备的时候,这些设备其实是比你的手机会获得更多你周围的信息。
所以它更懂你,一个懂你的AI,它会更容易融入你的生活。所以我是觉得要站在能够替代手机的角度来说,大部分的穿戴设备其实还有很长的路要走,所以得在各个方面上都能够比手机做的更多一些。
听说苹果计划要发布一个带摄像头的耳机,就是AirPods加上一个镜头那种感觉。
夏勇峰:据我所知苹果要带的不是一个完整的摄像头,可以理解为是Face ID的那套系统,有输出端和接收端,但它的输出端不在耳机上面,可能在其他的地方,比如手表上面。相当于把一个摄像头拆开了,一半放在其他地方,一半放在耳机上面。
《硅谷101》:而且这个又涉及到用户隐私的问题了,尤其是在美国、欧洲这些比较注重个人隐私的国家。
夏勇峰:那个镜头应该是不具备摄像的能力,只是通过摄像头来判断所处的空间,从而增强耳机的空间音频的效果。
相关报道:https://www.latepost.com/news/dj_detail?id=2493https://www.theverge.com/2024/9/5/24236545/qualcomm-mixed-reality-smart-glasses-google-samsunghttps://www.theverge.com/2024/7/19/24202244/google-meta-ray-ban-essilorluxottica-partnership
AI中国网 https://www.cnaiplus.com
本文网址: