章鹏:大模型只是少数人的机会,小模型才是大多数人的机会
" 现如今在硅谷进行融资,如果你的业务与 AI 全然无关,投资人根本就不会理你。"
" 训练一次 ChatGPT 的价格及其昂贵,大约为 1200 万美金。之所以花费如此之高,首先是因为人才的紧缺——据说,全球能够训练大模型的技术人员,目前不超过 100 位。"
(资料图片仅供参考)
" 大模型创新一般是一些美国的大公司,这些公司之间几乎已经形成了壁垒,所以对于创业者来说根本看不到机会。" 北京神州飞思信息科技有限公司创始人章鹏说。
AI 带来惊喜的同时,也伴随着一种越来越强烈的恐慌:人类是否正逐渐沦为无体力价值、无脑力价值、无情感价值的无用阶层?既然对于创业和择业人员来说,AI 是无法绕过的课题,那我们只有接受现实,及时考虑在此趋势下的创业机会、发展路径。
但是,AI 大模型下的创业机会到底是什么?中小企业如何借助这波 AI 的东风?
前不久,混沌创新院 23 级 1 班学员章鹏作客混沌直播间,带来混沌创新院 AI 系列直播栏目第三期内容。他从 AI 的第一性原理为起点,为我们讲解 AI 的底层逻辑、AI 的创业机会和中美在 AI 领域还存在的差异。
以下内容来自直播:
分享嘉宾 | 章鹏 混沌创新院 17 级、23 级同学 北京神州飞思信息科技有限公司创始人
在网上,最近总是出现一些 "AI 正在觉醒,人类即将成为奴隶 " 的言论。这样的消息难免会让人产生焦虑,至于为何会引发广泛的焦虑,接下来我想要详细分析一下。
三年前,OPenAI 的创始人萨姆 · 奥特曼做了一个名为 WorldCoin 的项目。当时,ChatGPT 横空出世,很多人担忧它的存在会取代人类,于是 OpenAI 决定启动这个工程,让 AI 的劳动创造的财务通过区块链的形式空投给一些没有工作的人。到目前为止,该项目已有 170 万用户注册,为了保证注册人为真实存在的人,OpenAI 特意设定为眼球虹膜注册的形式。到今天,WorldCoin 的融资金额已达 1 亿美金,最近一轮的融资估值为 30 亿美金。
在中国学术界,清华大学元宇宙实验室的沈教授与萨姆 · 奥特曼秉持着同一观点:自然人逐渐沦为无体力、无价值、无情感的无用阶层。
这个话对我的震动很大,同时我对此感到怀疑,但转念一想,AI 行业里的领军人物有这样的观点,应该自有几分道理。所以我开始思考 " 人类的未来是 AIGC",就算不是百分之百的概率,也是极大的概念。
立足于这份焦虑情绪,这次我的讲解会分为三个章节。分别为 "AI 大模型的逻辑 "、"AI 大模型下的创业逻辑 " 和 " 中美 AIGC 赚钱机会的差异 "。
AI 大模型的逻辑
首先表明我的结论:AI 大模型的底层逻辑是一个数据概率的逻辑。RLHF ( Reinforcement Learning from Human Feedback ) 让大模型更擅长与人沟通了。
在 1956 的的达特茅斯会议上,"AI" 这个概念首次被提出。此后,AI 经历了几次高高低低的发展,以前的算力和数据比较落后,现在几乎已经走向成熟,涌现出巨大的能力。正如 OpenAI 所言,作为开发者,现在 ChatGPT 也已经远远超出了他们的预期。
以前,神经网络领域也曾致力于发展 AI,制作出类似 AlphaGo 这种人工智能,但远未达到 ChatGPT 这代 AI 的理解能力。
现在的 AI 大模型它可以像人类一样思考吗?我想,如果把人类比作老鹰,AI 就是飞机。其实,AI 能做到现在这个程度是通过算力达到的,它的思考只是超大数据概率的延伸,无法做到像人一样思考。大模型只是把整个互联网里所有的数据知识学习了一遍,它吸收知识和运用知识的方式与人类完全不同。
如果不太恰当地把 AI 的参数与人类的神经元等同起来的话,ChatGPT3.5 集结了两千亿个参数,而人类的神经元却有百万亿。根据 ChatGPT 的数据来看,它们大概能理解十亿字,而人一生大概学习 1 亿字。当然,AI 和人都需要不断发展,ChatGPT 靠算力靠训练和电力,人类靠学习沟通和食物。
训练一次 ChatGPT 的价格及其昂贵,大约为 1200 万美金。之所以花费如此之高,首先是因为人才的紧缺——据说,全球能够训练大模型的技术人员,目前不超过 100 位。训练 ChatGPT 类似于炼丹,需要用大数据不断地修炼,并得加入一些调优的算法和算力,然后,经过漫长的等待后才能算完成。在这个过程中,确认炉子里的东西被炼到哪种程度的人员就是工程师,他们每训练一次就会出现新的算法。
这些工程师的厉害之处在于不需要等待大模型训练完毕后才能发现它的问题。如果工程师发现了大模型出现了一些偏差,可以先把它停掉,在调优后重新进行训练,直到确定它训练的方向是合理的。
从一开始,OpenAI 定位的并不是一个商业项目,而是一个开源组织。从中我们可以看到,大模型的发展需要持续不断迭代和尝试,大模型的底层核心逻辑是大数据的算法涌现。
AI 是大势所趋是业内公认的。在硅谷进行融资,如果你的业务与 AI 全然无关,投资人根本就不会理你。未来,几乎所有的行业都是在大模型的基础之上运行和发展的。我们可以将它理解为下一代的操作系统。
此前,美国三院院士在内的 100 多位学者联合发表长达 160 页的文章,文章提出,超大规模预训练模型将是实现 " 通用人工智能 " 的基础模型。包括 ChatGPT、Gato、DALLE 等在内的大模型也在努力逐步接通。或许,这个操作系统会每两年迭代一次,然后逐步完善,但是未来的互联网或者说整个世界都会建立在大模型的基石之上。它们就像日常生活里的水和电。
我问过 ChatGPT,大模型人工智能的第一性原理是什么?
它回答道:" 是通过数据和计算能力进行端到端学习,无需显式设计特征。它依赖于大规模训练数据和强大计算资源,通过自适应学习提取模式和规律。核心思想包括数据驱动、端到端学习。可拓展性和自适应性。这一原理推动了人工智能的突破,但无需考虑资源使用和伦理问题。"
之后我又问它,它不能做什么?
它列出了一些无法做到的事情。其中大概包括 " 不能推理和逻辑判断 "、" 不能长期记忆和持续学习 "、" 不具备真正的情感 "、" 不能进行道德和伦理的判断 " 等。
在未来,ChatGPT 提到的局限之处会一一得到解决,但是在情感和道德的能力可能仍然无法解决。
综合上述内容,我们可以总结一下大模型的底层逻辑:
1、大模型人工智能是用数据喂大的,能力取决于计算能力和算法。
2、大模型人工智能更好地解决类似编程这种高度确定性的任务。
3、大模型生成图片的创造性是组合创新,不是发明创新。
4、大模型没有创造性思维,不会由一个苹果想到万有引力,所以它无法成为下一个 " 牛顿 "。
以上几点总结只是一些代表性的内容,并不完全。另外我还想强调的一点是,从当前的技术边界来看,我们大致可以推导出大模型的能力,但技术的变化往往是超出人的预期的, 所以下一代模型是什么样子,我无法告诉你答案。
AI 大模型下的创业机会
在此,我想先列出几个个人观点:
第一点,目前人类和机器的互动方式是屏幕模式,未来可能会逐步转为对话模式。人际交流的对话模式在科技领域会是一个很大的突破。
第二点,有核心私密数据的行业可以训练小模型。AI 的大变革对于很多行业来说是有利可图的,各个行业都有自己的核心秘密数据,AI 的存在可以加固这些数据的安全度。只要这些秘密数据不泄露,就可以使得他们的业务范围更广、效率更高。
第三点,Agent 是大模型操作系统上的核心应用。因为 Agent 是一个可信赖的服务,比如说以往我们会在美团上订餐,而现在我们可能就需要用来订餐的小模型,你告诉它你想定的食物后,它便会把食物送到你手里。这个过程可以视为小模型能够独立完成的事情,而大模型却做不到。
第四点,AI 和区块链的关系是生产力和生产关系之间的关系。其实,不管是制作何种类型的大模型公司,都非常重视区块链。区块链与 AI 看似是互斥的关系,一个是极度中心化,一个是去中心,但是两者在 Agent 的模型之下是一个绝妙组合。
第五点,我认为 AR 时代即将到来。一旦我们进入到 AR 时代,大模型将会成为它的基石,同时反向影响大模型的发展。因为 AR 本就基于各种语言模型的理解才能完成与操作系统的对话,所以它的发展对 AI 的发展的影响是显而易见的。
接下来,我们一起来看看 AIGC 的产业图谱。
最下面的算力层几乎被英伟达、高通等公司垄断了。因此,这一块几乎没有什么机会,所以为了稳妥起见,创业的方向需要避开这一块。
模型层一般是一些美国的大公司在创建,这些公司之间几乎已经形成了闭环,所以对于创业者来说根本看不到机会。
再往上是我们需要重点关注的功能层。这一层有很多种类和方向,比较瞩目的是文本生产、音频生成、图像生成和视频生成。美国的创业公司们一般都在功能层探索新大陆,如果有很妙的点子和过硬的技术,这一层对我们来说也会存在着一些可以攻略的领地。
还有就是应用层和场景层。应用层包括文本分析、问答系统、视频和音频系统等领域;场景层是 AIGC 与不同行业的结合,包括医疗、教育、娱乐、金融等。
在我看来,AI 可以实现全行业提效。我身边从事不同行业的朋友都向我反应过,用 AI 办公可以明显提升工作效率。比如宣传文案、方案策划等工作内容,AI 会是一个绝好的工作伙伴。但同时我也发现,虽然用 AI 工作的人有很多,但是并没有人深耕这一块,也没有人投身到这一行。由此可见,目前国内市场在这一块还有缺口。
从公司象限的角度来看,不管是 To C 还是 To B 领域,也不管是陪伴还是产生效率,每个象限里都有一定机会。在此我重点提一下 SAAS 行业,未来它一定会有供大量人才大展拳脚的空间,比如 Adobe 公司的新产品 Firefly,该产品与 Photoshop 进行了结合,还延伸出一些工具可以让用户更方便地制作图片、海报和插画。
另外,制作虚拟人陪伴类产品的公司有很多,Character AI 是其中的代表。在单身率逐年上升的当下,年轻人的孤独感也与日俱增,虚拟人陪伴类的产品有很大的市场潜力。前段时间,美国有位女明星把自己的 AI 分身按照分钟时间售卖出去,获得了很高的销售额。越来越多的人投入到了这个领域,在未来会成为一个更广阔的市场。
通过这两个例子,我想说明大模型只是少数人的机会,小模型才是大多数人的机会。那么,在未来,大模型 + 小模型的模式将会是主流。
可以看来,前不久 ChatGPT 开放了一些插件。日常生活中的一些需求都可以通过这些小插件完成。目前来说,它的体验效果有待升级,但却可以看出之后 AI 发展的一个趋势:大模型之上的小插件可以帮助人类解决各方面的问题。
这些插件看似很小,但收入惊人。我们可以看一个例子:Monica 是 Google 上的一个小插件,它可以帮助用户撰写文案,也可以用作智能搜索。根据 Google 的官方数据,该插件目前约有 60 万名用户,每位用户每月收取 8.3 美元的费用,一年大概收入 6000 万美金左右。但其实这个插件的技术含量并不高,制作团队一共才 11 人。由此可见,这种基于大模型之上的小模型其实有无限可能,因此我认为未来如果有机会涌现的话,一般都是小模型。因为它定位很明确,能够很直接地帮用户处理难题。
所以,如果有小模型能够在某一特定专业里做到极致,将是巨大的机会。
讲到这里,我生出一个思考:如果未来的人机交互不再需要屏幕,那一定是基于大模型之上的。
这个思考源于人机交互的核心在于人把信息传递给机器,机器再通过大模型进行信息翻译,最后把它给到的信息传递给人。
这样的交互方式相比屏幕来说,更简单、更便捷。因此,如果 AI 势不可挡地发展下去,那这种人机交互的方式将成为主流。而这,也宣告了 AR 时代的到来。
在此我简单解释一下 VR 和 AR 的区别。VR 需要以一个眼镜为介质,戴上眼镜之后,人类就会处在一个虚拟世界里,你可以身在家里,但视野之内是马尔代夫的风景。AR 眼镜起到的作用是增强现实, 是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D 模型的技术,这种技术的目标是在屏幕上把虚拟世界套在现实世界并进行互动。是把原本在现实世界的一定时间空间范围内很难体验到的实体信息 ( 视觉信息、声音、味道、触觉等 ) 通过电脑等科学技术,模拟仿真后再叠加。
AR 眼镜架设在大模型之上,但是目前它的开发成本极高。因此,要进入 AR 时代之前,大模型得成为普遍。
提到 AR,绕不开 " 数字人 " 的概念。数字人集合了多种多样的模型,能够替代真人完成许多真人完成不了的任务,诸如宇宙失重地区、高寒缺氧地区和不便长期居留地区。它在外形上与人类真假难辨,正如萨姆 · 奥特曼所说的:" 需要用眼睛的虹膜验证数字人和现实的人 "。
数字人之后,则会出现 " 数字生命 "。这个技术可通过网页获得形象自助生成、AI 对话等定制型服务。
今年年初,一位年轻人想念奶奶,于是他把奶奶的语音、数据、图像等内容传达网上之后,做成了一个小视频,引发广泛讨论。从这件事情里我们可以预见到未来的一角,这个小视频可以说正是数字生命的早期版本。所以,未来应该会有一些机会体现在这个领域,比如刚刚所讲的祖先虚拟人,这个技术可以帮助一些人缓解亲人离世的悲伤,且有很强的情感内核。
总结一下这部分的内容,大概有以下几点:
1、ChatGPT 能够帮助大部分行业提高工作效率。
2、模型即产品,小模型(插件)目前是一个新的创业方向。
3、由于交互模式的变化,可能会颠覆 APP 的形式。
4、由于 AR 的出现,会出现新的产业机会。
5、大模型就是下一代的超级计算机。
6、AI 的价值交换体系可能会搭载在某条区块链公链上。
中美 AIGC 赚钱的差异
依然先亮出我的结论:中美 AIGC 的差距至少在一年以上。另外,美国所有的融资项目必然关联 AI。在国内与美国如此巨大的信息差异下,几乎只有 To B 市场拥有巨大的机会。
我们都知道,全世界的 AI 几乎被三巨头统领了。OpenAI 作为 ChatGPT 的开发者,在市场上具有显著竞争优势。Google 在早期是领头位置,后面被 OpenAI 一举超越了,后面它开始在细分领域里做尝试。Meta AI 相比前两家,势头要弱一些。它的主营业务 LLama,可以在单个 GPU 上运行。
可以看到,一些大模型早期都是运用了开源模型的底子,所以这可以成为我们借鉴的方式。当美国那边一些比较成熟的产品出来之后,我们再对其进行效仿和跟随,风险性会小很多。
目前来看,国内的竞品还不甚成熟,短时间内国内的大模型在 To C 端的服务和体验类产品上还存在很大的问题。相较而言,To B 市场则要有前景一些。
伊隆马斯克也曾说中国和美国在 AI 技术上的差距为一年以上。虽然这句话听起来让我们感到很振奋,但确实只是他的一句客套话。因为目前芯片像是卡住了这行的脖子,国内采购芯片要么很困难,要么就是不正规的版本。而大模型离不开芯片,需要上万个芯片连在一起进行分布式的计算。同时如何设计一个可以让上万个芯片一起工作的操作系统来加快计算也是需要长时间来实践的。而这对我们来说是一个巨大的鸿沟。
当然,芯片方面我国正在努力推进,但这并不是短时间就能解决的问题。另外,我国在人才的质量和数量上美国的差距也是不能忽视的方面。所以虽然我们需要对自己保持信息,但同时也要清楚目前所处的位置。
中国与美国相比的确尚有段路要走,但其中仍然存在着一些机会:
我首先推荐一个名叫 Hugging Face 的 AI 开源社区。它被称为 AI 领域的 GitHub,成立于 2016 年,团队将近 170 人,总部位于纽约。目前,Hugging Face 上有超过 20000 个开源数据集,超过 10 万个 demo,有超 10000 家公司使用上面的开源的 AI 技术。
如果我们的公司如果在做项目时需要用到一些技术方案,我建议可以在这个平台上找一找,这能帮我们节省很多的精力。这个平台还支持语音转换、文字转换等功能,使用起来十分便捷。
AI 的开源云是现在国外努力的一个方向,这个技术支持在云端快速地订购产品。这个项目的负责人是之前在苹果公司里的一个高级工程师,他现在带领着团队专攻这一领域,如果最终他们真的能够做到,就可以让很多企业快速上手智能服务。那时候很多小公司或个人可以把自己的模型上传至平台,提供给大家使用。
另外还有一些反对 AI 开源的声音。他们认为开源如果放在某个人的手里,就相当于这个人手持了一枚原子弹,具有毁灭性的威力。对公司而言,如果掌握了这个开源模型,就会导致对生产效率的需求没有以往那么大,有些公司可以快速地把产品做出来,然后把一些内容放在开源的云平台上,为大家提供服务。这意味着,未来的小公司或个人公司会大规模出现。
讲到这里,我觉得我的结论比较明显了:
1. 我认为国内一定会出现自己的大模型,虽然暂时人才还比较稀缺,但在累积够一定的经验过后,一定会有培养出大量的人才。但是,大模型可能各有各的特点,就跟做菜的一样,同样的食材用不同的方法烹饪,做出来的味道就会迥然不同。但特点也意味着多元,多元意味着丰富。
2. 对于中小企业来说,如果想乘一乘这波 AI 的东风,开源的小模型需要尤其关注。我断定它在未来会涌现出很多机会。
3. 最后还想说,面对新时代的到来,我们往往会因为措手不及而感到焦虑。但是与其焦虑,不如放平心态、活在当下。有太多太多的技术我们都看不明白,但是站在历史的十字关口,我们能做的就是接受现实,并且勇往直前。
我希望在未来,中国能在 AI 领域上实现巨大的突破,因为那将改变整个社会,改变全人类。
提问环节:
主持人:您觉得下一代拥有怎样的能力,能更好地去迎接 AI 时代?
章鹏:我觉得逻辑思维和哲科思维是必须的思维能力。人要与机器相处,就无可避免需要逻辑思维能力,才能把机器的能力充分地调用出来。至于哲科思维,我认为这是 AI 比较欠缺的能力,因此未来的人类想要与 AI 竞争,可以在 AI 的短板领域里发挥所长,这样更具有竞争力。
主持人:作为创新院的老校友,是怎样的驱动力让您又读了一期?
章鹏:在疫情前我接触了李善友教授的课程,他的 " 第一性原理 " 理论让我印象深刻。但是现在的时代迭代的速度是特别快的,上一次的课程我没有完全吸收 " 第二曲线 " 和 " 创新理论 " 的奥义,所以想要重修一次,努力跟上时代的迭代速度。
主持人:23 级我们已经进行了两个模块的课程,您觉得最大的收获是什么?
章鹏:我觉得这是一个不内卷的环境。虽然我们每天都会做一些刻意练习,在一起相互学习,但都是怀着互帮互助、相互激发的善意。混沌的教学让我从以往过多依赖 " 听 " 的学习方式里走出来,利用和同学的碰撞,提升了学习的效率。在一起讨论的时候,别人输出的想法,总能启发到我;我自己输出的想法,也在这个过程中有了更深的思考。
主持人:在这样一个浓度很高的场域里面,最让你印象深刻的价值点是什么?
章鹏:这两次课程让我印象最深的点是 " 第一曲线 "。其实很多人的第一曲线都没有被击穿,一旦击穿,会发现自己身上巨大的能量,所以这是我认为非常有实用价值的看世界的方式。同样我也经常推荐身边的朋友通过混沌的课程击穿自己的 " 第一曲线 "。
标签: