文章转载来源:AIcore

原文来源:硅基立场

图片[1] - 火爆出圈的AIPin,就是ChatGPT别在你胸口的一个插件

OpenAI CEO Sam Altman投资的人类历史上第一款真正的AI硬件——AI Pin,是这两天全世界最火爆的硬件产品。如果你还不清楚这个产品,可以看这个视频了解一下。

它背后的公司Humane,由前苹果功勋设计师Imran Chaudhri和苹果前系统负责人Bethany Bongiorno创办,Chaudhri曾参与初代iPhone的开发,甚至那个被乔布斯在iPhone第一次发布时嘲笑的带着滚轮的原型机也是他参与设计的。他离开苹果时非常不愉快,在决定离职前发全员邮件并写了首诗:“可悲的是河流干涸了,这时你就会寻找新的河流”。然后,苹果就开除了他。

Humane背后最大股东就是Sam Altman,而作为一款硬件的AI Pin,它的“软件”就是GPT-4。它的发布跟OpenAI那场屠杀了一众AI初创公司的开发者大会几乎是前后脚,Sam Altman又是它的金主爹,关于它的讨论立刻围绕“是否是新的iPhone”展开。

然而仔细看看AI Pin,会发现它的意义不是非黑即白——要么iPhone杀手,要么完全就是炒作,并不是这样。它其实是AI时代“新硬件”思路的第一批试验品。用我的同事骆轶航的话说,它是“ChatGPT的硬插件”。

乔布斯的门徒深知乔布斯的密码:交互方式上极致激进改造,用户体验上极致保守克制,一如当年iPhone的样子。

图片[2] - 火爆出圈的AIPin,就是ChatGPT别在你胸口的一个插件

AI Pin最大的噱头是没有了屏幕,因而一举改变了交互方式。你只能大部分时间通过自然语言,小部分时候通过手势操控来使用它。这完全是基于ChatGPT的能力定制的,因为LLM(大语言模型)最大的革命之一就是推动了LUI(语言用户界面)的普及,而这个AI Pin几乎就是一个要把LUI用到极致的玩法。

这也决定了它是个实验品。最近国内一款数亿用户的国民级应用产品负责人对我说,他们已经是用LUI改造产品很彻底的产品,很多底层代码都重写了,但他认为LUI并不是一个单纯的替代升级,而是一个带来新可能性并行选择。LUI最终会结合GUI(手势用户界面)一起,创造属于AI时代的硬件产品。

AI Pin就是这么干的。有的功能用自然语言调用,有的则用简单的手势,这也是让外界惊呼酷炫的点,看完它的Demo,我觉得这其实就是AI Agent的“硬件化”。一个大模型有了一个Pin的实体,把它别在你的胸口,bling-bling地闪瞎眼,或者干脆像另一家AI硬件创业公司Rewind那样,把它变成一个吊坠。这可能会变成一个潮流。

可是AI Pin,无论从长相到功能,听上去是不是有点儿像10年前有一家做“智能胸针”的Misfit?那会儿有很多这种鸡肋式的“可穿戴设备”,还有风靡得快消失得更快的Google Glass。AI Pin的终局会不会跟它们一样?

回答它得回到对“智能”的理解上。10年前的Google Glass也好,Misfit也罢,还有五花八门的智能手环和智能手表,难道本质上不都是“智障硬件”吗?至少有一点你得相信,有了GPT-4当“软件”,AI Pin确实开启了“智能”硬件的新阶段。它的核心能力,在于用语言交互和动作交互,调用AI Agent。或者干脆,你就直接把AI Pin当成挂在胸口bling-bling闪瞎旁人眼的一个AI Agent。

AI Agent本质是基于个人或组织定制需求的,以大语言模型为核心能力的AI应用和功能的组合,它具有高度的个性化和场景化导向:敲一下胸口的Pin,跟它低声说两句话,展开手掌,看到一串亮色的字符,告诉你对一个问题的建议处理方式,一个关键的要告诉对方的数据,或者直接替你点好了你另一只手拿的一份餐厅菜单。这可比那些手表手环聪明多了。当然这也说明,与传统意义上的硬件不同,AI Pin本身不会是一个通用的硬件,而是实现定制化AI的“硬插件”。

既然是“硬插件”,背后自然是一整个新的体系。这个新体系不再是以某个硬件为出发点,出发点变成了大语言模型。回顾一下iPhone——当年是先有的iPhone再有的App Store,以至于苹果今天在营收上仍然是一个硬件公司。那么如果是先有了一个强大的“App Store”呢?OpenAI和AI Pin拿的就是这么一个反过来的剧本。

谁都知道人们关注AI Pin,是因为它背后的OpenAI和ChatGPT,AI Pin的创始人自己也知道。就像软件开发者的收入依赖苹果的硬件所以甘愿被苹果收税一样,AI Pin第一天就把硬件收入让位于订阅收入——Humane的定价方式:是固定的硬件价格和每个月的“订阅费”——调用GPT-4的能力向OpenAI缴的“税”。这和ChatGPT的插件们逻辑有任何的不同么?

OpenAI相信,大语言模型的本质就是个世界知识的最棒的压缩器。但压缩器不能直接解决每个人每个具体问题,所以需要插件,AI Agent的思路因此出现。今天,新一代硬件在追逐“AI原生”时也在被这种思路塑造:以基础大语言模型为底,以一个能压缩基础模型并用个人数据训练的“大脑”为中心,再辅佐上各种硬插件——最终每个人都有个性化的AI Agent。

AI Pin是想激进地一步到位做到这一点的。只不过早期实验越想一步到位,也越容易成炮灰。它直接把插件接底座,带来很多问题。最多的诟病之一是隐私。而如果有一个本地的且计算能力更强的中间“保险箱”,插件可以更集中在自己的任务,后面的基础模型可以更通用,那就可以解决更多问题。

前不久我在硅谷遇到与Humane相似的当红创业公司——Rewind的CEO Dan Siroker,他展示了把Rewind做到电脑上离线使用的功能,这会更安全更个人化(Rewind也比Humane更激进,它的产品要全天候记录用户的一举一动,对隐私问题更敏感),而在他看来基础模型和插件之间的那个“大脑”,依然需要由手机和电脑承担,只不过需要的是全新的用模大语言型能力来定义的新手机新电脑。从这个意义上,我们还是挺期待英伟达和联想把电脑变成“AIPC”,以及高通帮助vivo和小米们把大模型塞到手机里的。

结论基本有了:AI Pin是一个把ChatGPT别在你胸口的,消灭了触摸屏幕的,让语言交互界面与手势交互界面组合操作的“硬插件”。它是一个随身携带的AI Agent,一个硬件底座直接与云连接,相当激进,比当年的Google Glass还激进,这意味着它更像是一个实验品,但人们需要这样的实验品。

只有激进的尝试才能激发想象力。这是人们对AI Pin如此兴奋的原因。人们把它当成了“奥特曼的插件”,也就是ChatGPT在硬件世界的延伸,一个可能的新的硬件时代的开启。这倒让我想起了15年前的一段往事。

2008年6月,旧金山,苹果WWDC ,App Store在那一刻正式发布。乔布斯在台上说:“你们也可以像Apple自己一样来开发和发布应用”。接着,几名最早期的苹果开发者上台了。其中一个穿粉衣服的男孩引起乔布斯注意。乔布斯把这个粉衣男生叫到他阴暗的房间里聊天,这名24岁的斯坦福辍学生紧张而兴奋,后来回忆称“只看得到他(指乔布斯)反着光的两个圆圆的镜片”。当时,他在台上展示自己的App的,表达对苹果的感谢:“这是新的移动时代的开始”。

图片[3] - 火爆出圈的AIPin,就是ChatGPT别在你胸口的一个插件

这名粉衣男生就是Sam Altman。