正如这些论文所说那样,引发人工智能革命的论文有个朗朗上口的标题:注意力就是你的全部所需(AttentionisAllYouNeed.)。
这篇论文的作者是GoogleBrain的一支团队,发表于2017年,里面介绍了现在已经十分出名的Transformer架构,也就是OpenAI的GPT-4等大型语言模型的基础。
正如Chroma联合创始人AntonTroynikov在《AntonTeachesPackyAI》的第一集向我解释的那样,Transformers只需注意有效的“输入”就可以做很多事情。它们不需要其他类型的神经网络层,比如用于卷积或环式连接(recurrentconnections)的神经网络层,就可以表现得很出色。它们所需要的,就只有注意力而已。
同年,BenThompson在写了那篇经典的聚合理论之后,又写了一篇《定义聚合者》(DefiningAggregators),对通过控制对充裕资源的需求来捕捉价值的企业进行了分类。聚合者具有三个定义特征:
OpenAI是在2015年12月创立的,成立之初是一家非营利组织。埃隆·马斯克、PeterThiel、SamAltman、JessicaLivingston、ReidHoffman、IlyaSutskever等人投入了超过10亿美元,这家组织没有赚钱的计划。它不需要自给自足。
一位早期曾考虑过投资的知名风险投资人表示,他喜欢他们的想法和团队,但由于没有收入,也没有任何计划,他无法证明将有限合伙人的资金投资于这家初创企业的合理性。就在去年夏天,当DALLE2让OpenAI站在了聚光灯下时,一位团队成员告诉我,虽然他们的技术非常出色,但他们也不太确定怎么才能货币化。
然后,到了去年12月,OpenAI发布了ChatGPT。这支团队本来并没有抱太大希望——这只是一个“研究预览版”——但几乎在一夜之间,它就火了。对于我们这些喜欢这个东西的人来说,去年12月ChatGPT的发布是那种“我记得自己当时在哪里”的时刻之一(那时候我在洛杉矶的酒店大堂,并在第一次体验过后发了这条推文)。
ChatGPT火爆无比。两个月后,它的用户达到了1亿。YCW23训练营有将近一半的团队用OpenAI的API来开发应用。GPT-4成为自披头士上一张专辑以来最受期待的发布,而且它如期交付了。然后到了上周,OpenAI又发布了ChatGPT插件。他们对此有先见之明,但做出了淡化处理。他们解释道:“自从我们推出ChatGPT以来,用户就一直在要求插件。”
说起将令人兴奋的技术变成同样令人兴奋的商业机会时,事实证明,你猜对了:注意力就是你的全部所需。
按照目前的情况,如果OpenAI选择这样做,它可以通过建立行动引擎(ActionEngine)来成为顶级聚合者(ApexAggregator)。ActionEngine包含搜索以及任意数量的可让用户执行操作的产品,并且替用户执行这些操作只需要一个简单的提示。如果聚合者控制了需求与商品化的供应,则这个极致的聚合者ApexAggregator就可以控制多方面的需求,将注意力转化为行动,分解为其提供服务的任何供应商,甚至将聚合者聚合到自己这里。它可以让苹果、谷歌和Facebook的模式显得温柔可爱……直到他们奋起反击。
我将解释是什么让我对OpenAI这个意外的商业模式如此兴奋,但首先,我们需要快速回顾一下当今科技界的商业模式之王。
如果你正在阅读本文,我想你对谷歌和Facebook的商业模式(人类已知的最伟大的赚钱机器)的运作方式有很多了解,所以这里的介绍会尽量简要。
OpenAI的潜在商业模式很难找到直接的比较对象,因为它同时包含了很多东西:聚合者、API,以及平台。
想象一下,有一堆以谷歌搜索为核心功能的app,谷歌是找到这些app的主要场所,当你通过谷歌对这些应用的使用进行协调时,它们会工作得更好,而这个跟OpenAI也许可以做到的也比较接近了。
OpenAI可以全方位地影响它的合作伙伴:
但上述要点是基于迄今为止已宣布的内容。目前我会持保留态度,等待有更多信息或证据后再进行判断。现在,我们先进一步展开讨论一下上述要点。
注意力就是你的全部所需。ChatGPT是吸引注意力的黑洞。
推出仅两个月后,它就达到了1亿用户,创造了达到这一数量级的历史最快记录。虽然OpenAI没有更新这方面的数字,也没有公布日活用户数,但不难想象,在一年内,每天都会有数亿人从ChatGPT开始访问互联网。
在《DefiningAggregators》中,Thompson写道,“聚合者的关键特征是他们拥有用户关系。”如果人们访问你网站是为了在互联网上查找什么东西的话,你可以告诉他们该去哪里。如果人们打开你的app是想打车,你可以告诉他们要上谁的车。拥有客户关系可以让聚合者将其供应商商品化,并从每笔交易攫取更多的价值。
在这方面,ChatGPT(以及更广泛的GPT)更进了一步,完全摆脱了它的“供应商”。谷歌可以向你展示它的算法想呈现的任何网站,它可以在搜索结果顶部突出位置给出网站摘要,但它的工作仍然是把人们送到对方网站。而ChatGPT则浏览互联网大部分的可用内容,并在聊天中针对任何提示吐出完整的答案。它不仅仅只是一个起点,还是用户可能希望在线完成的越来越多的事情的目的地。
当ChatGPT面世时,AI的老学究发出了诸多抱怨,说这并不是真正的技术进步,只是用新瓶(聊天界面)装旧酒(模型)。这种看法没有抓住其产品方面的要点——界面至关重要——但这种观点尤其忽视了其在商业模式上的关键。ChatGPT的界面是注意力黑洞,一旦你抓住了注意力,你就可以用选择的任何方式来引导这些注意力。
ChatGPT不仅吸引了消费者的注意力,还吸引了开发者的想象力。
虽然GPT-3已经可以通过API获得,并且部分开发者已经在用它来进行开发,但大家对ChatGPT的热议似乎促使每一位开发者思考如何将GPT整合到他们的产品之中。目前这批入驻YC训练营的初创企业当中大约有一半是基于OpenAI的API做开发的。
大家嘲笑这些公司是“GPT封装器”,很多人怀疑其作为风险规模企业的可行性。我担心的是这些企业要把多少东西交给一个API。
在《APIsAllWayDown》里,我指出API优先的公司似乎存在一个甜点:
强大的API优先企业处在甜点位置:它们为客户提供关键性任务但非核心的功能,比方说接受付款、提供云安全或给客户发讯息。
当API提供的是云托管或支付或短信或任何每家公司都需要做但不具备竞争优势的东西时,植入API就很有意义了。
但是,当API提供的是智能时会发生什么情况?
OpenAI的API本质上是智能API。写几行代码,你的产品就可以做很多非常聪明的人能会做的事情,比如当客服或发现药物配方或辅导学生。当然,除了在不同的界面提供ChatGPT以外,大多数使用OpenAI的API的产品还做其他事情,而且当然还要做一些微调以更好地满足客户的特定需求,但对于这些产品的大多数来说,确实感觉它们打破了API的那条基本规则:不要把让你的啤酒味道更好的东西外包出去。
易事的难处正在于此:如果人人都能做某事,那这件事做起来就没有任何优势,但无论如何你还得做,否则就会被落下。
在短短几个月内,我们就到了使用OpenAI的智能API也不会获得真正的竞争优势,但不用就会处于劣势的地步。
直到一周前,对于GPT封装器来说的情况还算可以。对于特定的事情只用ChatGPT,然后只能获得大约80%的体验,比如让ChatGPT提供旅游行程推荐,但自己去预订,很多人也是可以接受的,但其他一些人会很乐意每月支付10美元,换取一个更有针对性的推荐,并省去自己预订行程的麻烦。
然后,OpenAI发布了ChatGPT插件。
上个星期四,当我坐在一架能收发短信但没有WiFi的飞机上时,在Ben发了一条我没法打开的Twitter链接之后后,我与BenRollert以及DrorPoleg之间的PBD聊天就开始了:
Ben:[我无法打开的Twitter链接]
Ben:难以置信
Ben:这是新的平台变革
Ben:上一次我感觉如此兴奋还是小时候用28k调制解调器玩互联网的时候
Packy:我在飞机上,只能收发短信,那条Twitter链接是什么东西?
Dror:来自其他app的ChatGPT插件
我们不是唯一对此感到兴奋的人。当我的WiFi终于能用时,我发现Twitter上到处都是各种敬畏和恐惧。
如果你错过了公告,OpenAI将直接给ChatGPT引入插件,包括:
浏览:“一个知道何时以及如何浏览互联网的实验模型。”
代码解释器:“一个可以用Python处理上传和下载的实验性ChatGPT模型。”
检索:“这款开源检索插件可让ChatGPT访问个人或组织信息源(经许可)。”
第三方插件:“一个知道何时以及如何使用插件的实验模型。”
如果说智能API可以让公司将OpenAI的智能引入他们的产品的话,那么插件就可以让公司把自己变成为OpenAI的智能提供服务的API。任何产品,不管是大公司还是小公司的产品,本质上都变成了OpenAI的用户可以自动将其连接到他们的个人行动引擎(ActionEngine)之中的API。
突然之间,在有了合适的插件之后,ChatGPT就可以完成GPT封装器可以做的许多事情了。灭霸打了个响指。
但现在还为时尚早。OpenAI目前只是跟11家通过了预审的合作伙伴发布了插件:
需要注意的是,这只是一个公告,距离我要写的内容还有很长的路要走,这是一次大规模的升级,原因有几个。
首先,它填补了GPT迄今为止的空白。也就是说,它提供了对最新信息的访问,令其成为搜索大量查询更可行的替代方案,而且与Wolfram的集成为ChatGPT提供了“计算的超能力”。几周前,ChatGPT甚至连加法都不会;有了Wolfram之后,它可以执行复杂的数学函数、运行算法、函数绘图,甚至画家谱。
其次,就像很多人指出的那样,OpenAI正在成为一个平台并建立起自己的应用商店。
但是拿平台和应用商店来类比是不够的,因为应用商店本身并不是目的地,它只是人们寻找应用的地方,然后他们还要单独使用这些应用。
OpenAI正在开发的是另一个东西,第三样东西。
最重要的是,插件会将ChatGPT变成几乎所有东西的目的地:搜索、发现、旅行计划、餐厅预订、礼品购物、撰写初稿、研究等等。重要的是,与用户可以找到和下载应用的传统平台不同,ChatGPT使用插件并将其功能吸收到主要产品之中。它既可以是一个独立的产品,也可以是一个开放的平台。
通过浏览,它将完成搜索所做的一切,还可以自定义。借助第三方插件,它会变成一个平台,所有供应商都可以在该平台上向平台本身添加更多功能,并在此过程中将他们的需求发送给OpenAI的注意力黑洞。
你是打算去Kayak.com预订航班,还是让ChatGPT替你规划行程,并让它与Kayak打交道,为你预订最好的航班?你是打算去OpenTable.com预订晚餐,还是让ChatGPT替你下周三在一个很棒的地方预订一张8人的餐桌,让让它跟OpenTable打交道?我想当大家有些非常具体的想法时,他们可能还会访问旧版网站,但在大多数情况下,我们对自己想要的东西只是有个粗略了解,这种情况下ChatGPT的效果最好。即便输入了最后一句话,如果我确切地知道自己想要什么的话,为什么不让ChatGPT去帮我做呢?
谷歌拥有GoogleFlights和GoogleShopping,与传统搜索推荐最佳航班和产品相比,它们走得更近利了一步,也减少点击次数,但还是要点击、浏览以及分心。此外,当人们已经在与ChatGPT互动时,从研究演示文稿切换到要求它替你预订参加会议的旅程会很容易。就目前版本而言,通过Kayak插件预订旅程只是稍微容易一些,还需点击几下鼠标。但在不久的将来,如果你足够信任ChatGPT的话,预订可能就像发消息一样简单。
插件将需要大量搜索和点击才能完成的手动操作变得易如反掌,就像与了解你的目的的聪明人交谈一样简单,哪怕连你自己都不是完全清楚都没问题。去掉点击是在线商务的命脉,这是插件谜题的重要组成部分,但能够灵活地输入(通过语音输入也快了)任何愿望,并让它变成现实,这确实是游戏改变者。
再说一次,现在还为时尚早。一小部分用户可以访问少量插件。尽管很容易想象,但OpenAI没有说明自己打算如何通过集成赚钱。
如果说谷歌通过向公司提供高意愿的用户建立起全球史上令人惊叹的业务的话,OpenAI可以通过将这种意图转化为行动来做出至少同样好的东西。它应该能够从它推动的交易中收取佣金,并且在很多情况下,随着使用其智能API的合作伙伴交易量的提升,他们还可以对另一方收取更高的API费用。你甚至可以想象OpenAI将插件功能开放到IntelligenceAPI上,将插件带到在它之上开发的所有应用里面,将自己变成平台的智能平台。
这对插件合作伙伴有好处——被内置到更多产品之中会增加需求——对OpenAI也有好处——更多的用户将吸引更多的插件开发者。即便这意味着会从ChatGPT吸走一些注意力,但尽早发展生态体系是值得的。多赢的局面。
所有这一切都取决于OpenAI决定与合作伙伴友好相处。
不过,如果OpenAI为ChatGPT用户进行优化的话,将会让大量企业去居间化,并迫使他们改变运营方式。
以前,分销商是靠排他的供应商关系进行竞争,把消费者/用户放在第二位。但现在供应商可以被商品化,消费者/用户变成第一要务。推而广之,这意味着决定成功的最重要因素是用户体验:最好的分销商/聚合者/做市商通过提供最好的体验而获胜,这为他们赢得最多的消费者/用户,吸引最多的供应商,从而在一个良性循环中增强了用户体验。——BenThompson,聚合理论
对OpenAI插件的早期一瞥看起来很相似,但更加强大。第三方插件演示视频展示了一个Instacart交易的示例:请求提供一份素食食谱被转换为预加载的Instacart购物车,用户可以点击、浏览和购买购物车上的东西。
虽然这个演示令人印象深刻,并且在做同一件事情上超越了谷歌,但我止不住觉得它仍处在拟物化阶段,或者说在合作伙伴方面处在“吸引”阶段(借用ChrisDixon的两个想法)。而且它还只是在学习中——也许我不喜欢它推荐的食谱,或者我喜欢但我想购物车里面的东西我想改一下。在当前的实例化中,我能够做到这一点。
不过,不难想象,一旦经过了足够的RLHF(带人类反馈的强化学习),ChatGPT就可以减少大量点击,优化用户体验。
“嘿,星期天我想在吃餐素的,豆腐餐什么的,上午我都在家。”
“好的,你的食材会在周日上午10点到11点之间送达。那时候我会发份食谱给你。”
你能看出问题出在哪里。我问ChatGPT,像BookingHoldings这样的聚合者的存在对旅游和酒店业价值链的其他公司的利润有何影响:
对于植入ChatGPT的每一个行业即将发生的事情而言,ChatGPT总结得相当好:竞争加剧、利润压力、消费者行为的转变,以及在这个新范式中对重要事物进行创新的压力。
ChatGPT是顶级聚合者(ApexAggregator)——它将聚合聚合者。而且因为它拥有客户关系,因为它拥有注意力,所以它不必像BookingHoldings那样每年花费78亿美元!
今天,在这个早期阶段,这里面得一些事情就可以通过Kayak(BookingHoldings旗下公司)进行了,目前用户还需要自己点击预订旅行,还得有Kayak帐户,同时还得输入他们的信用卡信息。这个开始阶段对于插件合作伙伴来说是个福音——Kayak无需向谷歌付费即可获得订单,而且可能还可以减少品牌营销支出。只需植入到ChatGPT,然后就可以坐等订单滚滚而来。
但是,如果OpenAI选择火力全开——而且我认为他们会出于改善客户体验而这么做,即便他们不想干掉中介——则Kayak将只是众多潜在途径之一。一旦用户不必指定做什么事情要用什么插件,一旦这些插件都是开箱即用,并且ChatGPT会在所有这些插件当中搜索最适合用户需求的产品,Kayak的空间就会被挤压,就像Kayak挤压掉自己价值链当中的那些中介的生存空间一样。
另一方面,这些事情对于ChatGPT来说毫无难度,它可以很愉快地浏览一百万个选项,并对各种对用户很重要的维度进行权衡。ChatGPT可以让世界上所有的酒店、航空公司和餐馆开发自己的插件,而不是靠聚合者来降低复杂性。鉴于这些酒店、航空公司与餐馆是直接访问ChatGPT,所以无需向聚合者支付费用,说不定他们就可以给通过ChatGPT预订的人提供更低的价格或更好的福利。也许,当他们对基于所提供的产品而不是简单粗暴的最低价格来匹配到自己更有信心时,他们就会专注于让自己的产品差异化成都更高,从而吸引到那些正在寻找他们可以提供的东西的人。
这样我们就能得出一个合乎逻辑的结论,ChatGPT插件将提供无限的选择,但又不会出现选择悖论。
这不仅仅只是旅行和住宿。打车就是一个非常明显的例子。我是用Uber还是Lyft打到车的,我根本就不在乎这个问题。“我要晚上7点之前到达机场,价格尽量便宜。但关键是我不能迟到。”那么,ChatGPT会寻找最优惠的价格,而且它会仔细检查所选的服务实际上是不是一般都能按期送达,而且对于最近预订了乘车服务的所有ChatGPT用户都是如此,然后它就会会帮用户预订那家公司的服务。这可能是Uber,也可能是Lyft,或者是本地的另一项打车服务,尽管它不怎么出名,但非常擅长以低廉的价格准时将乘客送抵机场。
这种情况会扩展到软件产品、电子商务、教育以及其他方方面面。
比方说对品牌护城河的影响会如何?RexWoodbury最近在推特上说,“品牌是比以往任何时候都要强大的护城河”:
按照Thompson的说法,这就是克莱顿·克里斯滕森(ClaytonChristensen)的错误之处:
这就是问题所在:消费者不购买飞机、软件或医疗设备。但企业买。克里斯滕森的理论基于企业而不是消费者做出的购买决策得出的例子。为什么说这很重要?原因在于低端颠覆理论的假设:
买家是理性的
每一个重要的属性都可以记录和衡量
在对购买者重要的所有属性上,模块化供应商都可以变得“足够好”。
所这三个假设在消费者市场都失效了,这最终也是克里斯滕森的理论失效的原因。
不过,请等一下!如果有了ChatGPT的话:
在这个世界里,我想我其实得出了与Rex和Ben相反的结论:品牌不像以前那么重要了。其实差异化反而更重要。
我最近多次写道,由于API以及Replit等产品的丰富,我们将看到创建的小型应用数量出现激增,这会让人们比以往任何时候都更容易创建出软件产品。我忽视了最大的催化剂。ChatGPT既可以让人们更轻松地开发出小型应用——它可以根据一张草图创建出一个简陋的网站,或者引导用户完成写出网站代码——并且可以让这些小型应用更容易找到客户,只要它们在某些特性上足够突出的话。
这在软件当中最为明显。开发者可以瞄准人们想要的某个特定东西开发出真正出色的产品,植入到ChatGPT上面即可,产品营销或树立品牌的事情不用他们操心。他们可以降低收费,为他们真正擅长做的东西捕获更多需求,至于与其他产品的编排协调,就让ChatGPT操心即可。如此一来,每以个产品在特定功能上都能做得非常拔尖(目前也许可以通过Zapier插件来做到)。
但随着ChatGPT连接到物理世界,它也可能开始重塑其他类型的业务。
有一个著名的现象,很多餐馆刚开始的时候看起来都是一个样——霓虹灯标志、绿色墙壁、诱人的菜肴——因为Instagram。在《MayaMillennial高品质的平庸生活》里,VGR很好地捕捉到这一点:“高品质的平庸是Instagram上的食物看起来比品尝起来更好。”如果我是对的,ChatGPT插件可能会在相反的方向产生更大的影响。
如果有足够多的人写提示说“帮我预订纽约一家有最好的法式洋葱汤的餐厅”,那么餐厅就会有动力专注于制作非常棒的法式洋葱汤。如果人们写提示说,“我要去墨西哥城玩7天,我想去吃当地的特色美食,每天都不重样。”那些在这件事情上做得很好的餐厅会取胜。
在我看来,要点在于,如果OpenAI选择走这条道路,那么很多行业和价值链都会被撼动,而赢家将是专注于差异化、专注于把某一件事情做得非常非常好的公司,而不是在很多事情上都做得相当好,然后拼命往品牌砸钱的公司。
当然,并不是每一个品类都如此。奢侈时尚业作为身份的象征机制仍然很有价值。为公司组织复杂工作流程的软件产品仍将保有大量客户,并可能通过ChatGPT找到大量的新客户。比方说,我认为Zapier的地位要比Kayak强得多,因为它在后台管理着大量的复杂性,而ChatGPT则为其提供更流畅、更直观的界面。
当然了,既有者会努力反击。没有人喜欢被去居间化。但是,你能怎么办呢?不做ChatGPT插件?不打磨产品以便更好地响应提示?
以它的增长速度,ChatGPT可能很快就会成为需求的源泉。网站被迫为了取悦谷歌的搜索引擎优化而扭曲自己,品牌别无选择,只能迁就ChatGPT的推荐改造自己的产品。
有些也许能行得通!复杂的自适应系统的有趣之处在于,我在这里只是往前推演练几步,但大量的企业主和开发者会想出你想不到的办法来发展业务和产品,目的就是比别人领先一步。
不过,有一点似乎几乎可以肯定,那就是对消费者来说是好事:商品价格更低,产品差异化程度更高,发现很容易。这也可能会导致通货紧缩,因为各家公司都在竞相以最低的价格提供最好的产品,甚至比资本主义迫使他们达到这一点的程度还要极端。
我的希望已经很清楚了,如果OpenAI选择追求这条道路的话,它已经误打误撞出一个互联网最好的商业模式。
有趣的是,这家以非营利组织起家的公司面前摆着一条可能通往全世界最赚钱公司的大道。
作为顶级聚合者,它可以吸引大量注意力,可以将这种注意力直接转化为与最适合其用户需求的插件的交易,并从每笔交易中抽取佣金。
如果它愿意,它还可以干掉任意数量的供应商,压低价格,并推动差异化以及质量提升。它可以瓜分搜索和聚合者的蛋糕,而且除了这些公司的股东以外,没人会为此掉泪。它可以了解用户喜欢什么,甚至可以为开发者提供RFP(请求建议书,一定程度上)以填补空白,通常可以用OpenAI的产品来做到这一点。
问题是:会吗?
答案是:我认为它别无选择。
OpenAI的使命是“创造和推广友好的人工智能,以便造福人类。”按照Thompson的说法,聚合者通过“提供最佳体验,赢得最多的消费者/用户,吸引最多的供应商,从而在良性循环中增强用户体验”来获胜。这些想法是对齐的。对用户来说,最好的体验是让他们尽可能顺畅的得到他们想要的东西。如果最后要为在插件供应商与用户之间做出选择的话,我认为OpenAI会站在用户这边。
其他因素也会掺和进来,会出现新的问题:
最后一个问题特别有趣,我认为这是个速度和适应意愿的问题。谷歌、苹果、Meta以及微软都能让ChatGPT的用户群相形见绌。他们也控制着注意力。他们都有强大的AI/ML团队,有自己的LLM(内部或合作)以及攻击媒介(谷歌:搜索栏,苹果:iPhone/Siri,Meta:更多的个人数据与社交,亚马逊:Alexa与推荐,微软:企业端的优势以及新必应)。
ChatGPT能不能在其更大的竞争对手适应之前成为默认的行动引擎(ActionEngine)?它能否建立起一个插件生态体系,在其他人改变模式,利用自身优势和关系发动正面交锋之前,让自己的智能变得更加智能?就像第三次浏览器大战一样,巨头的优势也可能是其致命弱点。唯一可以肯定的是,数万亿美元都已危在旦夕,没人会不战而降。
综上所述,我确实认为OpenAI处在主导地位,如果它一路上能采用最新可用的最佳商业模式的话,就有可能做出一家非常大的企业。
但在开发出AGI的道路上,OpenAI已经把大家的注意力都集中在了一个地方,未来几个月以及今后几年发生的一切都将从那里开始。
注意力就是你的全部所需,这一点现在也许比以往任何时候都更是如此。