对话王小川:人类进入 AI 新时代
轮值主编 | 智勇 责编 | 青羊
(资料图片)
第 7415篇深度好文:5905 字 | 15 分钟阅读
商业思维
笔记君说:
王小川的精彩观点如下:
1、创业不是一个拼盘的过程,感觉好像拉几个人,概念上放在一块就行了。它是一个生命体,要不断演化,一点点长起来。
2、我现在做的事是世界需要的,跟世界是连在一块的,不是公司需要、部门需要或者只是同学们需要的,这是不一样的。
3、机器掌握语言,强人工智能就到来了。当你没有语言的时候,我们其实没法去认知这个世界,语言的边界就是世界的边界。
4、OpenAI 需要特别自由的环境,甚至无目的性,不是为了赚个钱,或者为了有一种商业回报,就是对事情本身的好奇。这种情况本身就跟科学精神更一致。
5、搜索正好是 ChatGPT 的反面,细节都知道,抽象知识不会。ChatGPT 是抽象知识会了,细节全忘了。就像一个相对论,一个量子力学,合在一块儿,才能构成更完整的一种智能。
6、OpenAI 的逻辑叫做理想大于落地。我们就要平衡这件事儿,理想上可以比 OpenAI 慢半步,落地要快半步。
ChatGPT 引爆一系列变革之后,给王小川的直观感觉是 " 地动山摇,要变天了 "。
过去一个多月里,几乎每隔一段时间,甚至是每隔几天,OpenAI 就有新的技术进展,从 GPT-4 的发布,到与微软 Office 系列产品的结合,再到推出 Plugin 平台开放更多的插件,每天都在刷新人们的认知。
王小川对此的形容是 " 掉个渣儿都会产生很大的影响 "。
ChatGPT 也引发了国内的 AI 大模型创业潮。
在一系列的讨论中,王小川被认为是最有可能参与打造中国版 OpenAI 的候选人之一。
王小川是清华大学计算机系 96 级的知名人物,创办了搜狗搜索,多年前就通过 AI 技术探索在输入法、搜索、语音识别等应用。
更重要的是,2021 年 10 月,卸任搜狗 CEO 后,王小川一直在寻求指引他再次创业的那盏明灯。
一年零两个月后,他终于看到了。
2023 年 1 月,王小川在试用 ChatGPT 后,意识到 " 强人工智能时代到来了 "。
仅 3 个月后,4 月 10 日,他正式官宣入场大模型创业,和前搜狗 COO 茹立云联合创立人工智能公司——百川智能。
目前,百川智能已获得 5000 万美元启动资金,来自王小川与其业内好友的个人支持。
团队拥有包括来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的数十位顶尖 AI 人才。
不同于创办搜狗,这一次创业,王小川把自己的名字写进了公司名字中,他解释:
" 百川不是我一个人,需要更多人来做这个事。"
每天,他花三分之一的时间找人,三分之一的时间学习。
他也非常有信心在年底做出中国最好的大语言模型。
过去十多年,王小川一直在关注人工智能的进展。
2016 年,在 AlphaGo 与李世石展开人机大战之前,他就和几位 AI 大佬打赌并预测 AlphaGo 会赢。
不过,从搜狗退出后,他把重心转移到了生命健康领域,这些年他读了上千篇医学论文。
关于缺失在人工智能语境中的那两年,他告诉我们:
" 可能有人比我先淋到雨,但有可能他不觉得在下雨。但当雨滴滴下来之后,我第一个意识到,变天儿了!"
短短三个月,他用 ChatGPT 的次数已经明显多于用搜索的次数。
针对 " 谁能在这场大模型竞争中胜出 " 这个问题,王小川表示:
" 小创新大厂赢,大创新小厂赢。大厂的专注度和效率不一定比创业公司高,而且有追求的人可能在原有的地方也有瓶颈,这个事就适合用创新来做,我不觉得 AI 创新是专属于大厂的事情。"
一、谈 ChatGPT
当它能多轮对话时,我觉得要变天了
问:我们最近访谈了很多人,他们谈到 ChatGPT 的时候,往往都有一个惊艳时刻,你有没有这样的惊艳时刻?
王小川:我们一直搞语言,搜狗当时也做了百亿参数的大模型,但交给腾讯之后,我开始转向把健康变成数学问题的研究,中间零零散散看到一些进展突破。
假如当时还在语境里,我可能会更早敏感到这个事儿。
尤其记得当时,当你提个问题,一旦后面加了一个 prompt(提示词)"think step by step(仔细想一想)",机器就答对了,我觉得好好玩儿。
到了今年 1 月,用了 ChatGPT 之后,当我开始追问它时,我就发现变天了。
它能够用最自然的方法,根据我的提问回答,然后我再追加几个字的问题,它能根据追问做调整,这个时候我就发现不得了了,通用人工智能时代已经到来了。
问:傅盛老对外讲他问 ChatGPT,他的狗为什么叫三万的问题,随后让他惊艳,你有没有问这样的问题?
王小川:我跟他们其实很不一样。
我可能不需要一个特别能让大众理解的东西来触动我。
我记得当时有个会,我和傅盛都参加了。
我当时就讲,通用人工智能到来了,他还不信,还觉得我在装。
但后来他打电话跟我说,小川,你太英明了,他也跟我说了三万这个案例。
我的敏感跟大家不一样,看到它能够多轮对话了,我就觉得通用人工智能时代到来了,并不是需要三万这样一个惊艳的例子。
问:其实你很早就预言," 当机器掌握语言之后,强人工智能就到来了 ",会想到这么快就被实现了吗?
王小川:没有这种时间上的概念。
刚好在技术突破的时候,我退出搜狗离开了这个语境,但当这个雨滴滴下来之后,我认为我是第一个意识到,变天儿了!
可能有人比我先淋到雨,但他不觉得在下雨。
问:国内这么多年来一直在人工智能方面深耕,还有很多卓越的创业者,为什么等到 ChatGPT 出来之后才恍然大悟?大家原来都忽略了哪一点,或者说不敢想?
王小川:本身这种原创性的想法,很多时候就发生在美国。
我简单讲,大家不是不敢做,是没想法居多,特别到了工业界更是这样子。
他有自己的业务目标,天天为了向老板怎么汇报,天天琢磨收入,谁没事儿琢磨这个呢?
但我想过。
AlphaGo 出来之前,大概 2013 年我已经在想 CNN 网络(卷积神经网络)能下围棋,当时我就满清华去找老师合作,想去做下围棋这事儿。
系主任、党委书记、所长、实验室主任都找过,大家对这事没有太大的冲动和热情。
AlphaGo 出来之后,我有两个断言:
第一,机器掌握语言之后,强人工智能时代就来了;
第二,预测下一个由 AI 改变的是视频。
我相信今天预测下一个由 AI 改变的是视频这个事儿,也一定有人在死磕,因为这意味着你对物理空间有新的理解。
我觉得需要有这种脑洞,这个脑洞需要特别自由的环境,甚至无目的性,不是为了赚个钱,或者为了有一种商业回报,就是对事情本身的好奇。
这种情况本身就跟科学精神更一致的,去理解一种规律,跟商业世界确实比较远。
问:即使最头部的大厂意识到通用人工智能的机会,可能也没有办法持续投入?
王小川:没错。
这也是为什么我觉得谷歌干不过 OpenAI 的原因。
谷歌里面的工程师,可能有这个想法,没人有这个想法也组织不起来了。
二、谈通用人工智能
语言的边界就是世界的边界
问:你在很多场合说过语言的重要性。你认为语言在人类的文明,包括未来智能文明当中,扮演的角色是什么?
王小川:我之前说 " 机器掌握语言,通用人工智能就到来 ",就是把语言跟通用人工智能放在一个画等号的位置上。
我之前从做搜索、做输入法,都是以语言为核心。
我们小学上课的时候就知道,马克思、恩格斯也讲,人跟动物的区别,就是会语言、会使用工具。
我经常举一个例子,有一件艺术品叫做 " 三把椅子 ":
一把真的椅子在这儿,一张椅子的照片,还有一个是椅子这个词。
三把椅子,哪个才是椅子?
我们的第一反应可能都是,真正的椅子它是。
但是,我们去想,假设没有发明椅子这个词,人类没有个概念之前,那你坐着的就是一个东西,你没有办法抽象成一个具体的功能载体。
当没有语言的时候,我们其实没法去认知这个世界。
维特根斯坦也讲到,语言的边界就是世界的边界。
语言既是知识的载体,也是沟通的载体。
问:我听到一种说法,之前的深度学习的方式更像是一个人学习外语的方式,现在这种大模型的学习语言的方式,更接近于学习母语的方式。
王小川:我是认同的。
其实今天的问题,是深度学习之上更大的一个复杂方式,区别在哪儿?
学外语的时候,你等于要重新挂一个模块进来,通常是强迫你在迅速高密度地知道这种语料。
所以本身是大量的叫做监督数据或者标记数据里去做映射,例如英文映射成中文,你再去学习它,这是我们通常学的一种方法。
我们之前做机器翻译也是一样的。
但今天的做法,是让你先去书读百遍,其义自见,就跟小朋友学习一样。
第一天不是先教他学东西,而是先自由地到处看,他可能看到泡泡往上走、气球往上飞会特别兴奋。
他会很关注,然后去学。
他学的是世界上基本的规律,不是当成一个知识来学。
自然语言处理是人工智能皇冠上的明珠。
三、谈行业变化
地动山摇,掉个渣都会有很大影响
问:AI 大模型出来之后,整个科技界就像打了一剂强心针,你身在其中,有什么感觉?
王小川:地动山摇。
我认为这是一个大时代的变化。
我们已经走出了互联网时代、信息时代,进入到了一个智能时代,这种情况下,掉个渣都会产生很大的影响,我觉得这是一种新的文明。
基础大模型其实需要特别多的钱,但不妨碍在中间有各种开发,做各种事情,有很多垂直领域的做法。
我不认为今天可能就只有这么一件事情去做,有太多周边垂直的事情,然后更有创造力的事情,都被发展起来,就像人类社会一样。
问:现在 GPT-4 不是开源的,对于创业来说,这不是在源头断掉了?
王小川:局面很复杂。
微软中国正在推云上接口,排队排得很长。
中小企业排队,前面排了 15000 到 20000 个企业,还要先提前注册,然后排到一个半月甚至两个月后。
此外,你还要写清楚,我的公司是干吗的,我的网页长啥样子,然后我调这个服务器干吗用的。
对方审完了,才给你接口。
问:前段时间 OpenAI 推出的 Plugin 平台,将会产生一个非常大的操作系统、生态系统,你怎么看?
王小川:今天大家都说要做中国版 OpenAI,但很少有把 ChatGPT 当成它一部分来看的。
其实 ChatGPT 特别重要,是 to C 以后最大的一种颠覆性的入口和人机交互界面,就像黄仁勋讲,这是 iPhone 时刻。
这种情况下,ChatGPT 未来也会做增强,可能有不同的路线图。
在我的想法里,会去做搜索增强,你知道现在时效性不够,以及会有实时性的东西缺乏,需要用搜索去跟它接。
搜索正好是反面,细节都知道,抽象知识不会。
这个抽象知识会了,细节全忘了。
就像一个相对论,一个量子力学,合在一块儿,才能构成更完整的一种智能。
今天至少 OpenAI 的做法,就是一路狂奔,它不屑于把搜索当成一个老的轮子挂着,而通过 Plugin 的方式去解决,OpenAI 的逻辑叫做理想大于落地。
我们就要平衡这件事儿,理想上可以比 OpenAI 慢半步,落地要快半步。
问:这一波浪潮来了之后,搜索是在被海浪拍的最前沿的那个海岸线,是吧?
王小川:是的。
今天我用索的次数已经开始低于 ChatGPT 的次数。
问:你之前在做生命科学领域,后来出来做大模型,这中间你自己的变化是什么?
王小川:生命科学比这事更有理想,这个事今天做,十有八九只是觉得小川你适合干。
说明这事是更现实的,是已经被别人突破了。
前几年突破之前,中国其实也有一些人想做,但是理想坚定度不够,或者受到局限。
生命科学更复杂,更遥远,我认为健康本来就是数学模型,提了三个观点:
第一,牛顿把物理学变成了数学模型;
第二,OpenAI 把语言变成了数学模型;
第三,我思考把医疗健康变成数学模型。
因此,我在选择时也力图在新公司里,把医疗健康作为重要的组成部分。
四、谈创业
这不是属于大厂的游戏
问:你大概在什么阶段决定正式筹备百川智能?
王小川:2 月份我开始认真想这件事。
问:你把名字融入到公司名字,这个事看来很不王小川,是表明自己要 All in?
王小川:对,以前做搜狗的时候,没有这样一种机缘。
这次来讲,确实你说得对。
问:百川最核心的创始团队怎么达成的?吸纳更多外部的人,还是找原来一些创业伙伴?
王小川:这是两个问题。
首先,我是比较坚定一开始先从搜狗那边来搭团队。
因为创业其实不是一个拼盘的过程,创业是一个生命体,要不断演化这种过程,是一点点长起来的。
所以,今天的时代不允许你开始由两三个人一点点去找。
第二,搜狗的团队离 AI 非常接近,很多人觉得无人驾驶是 AI,搜索不是。
其实搜索对 AI 的使用是非常多的,搜索也是数据、算力、算法,数据本身基本上是语言数据。
搜狗其实是在语言数据上,到今天为止最有能力掌握数据的公司。
此外,安全问题、意识形态问题等,搜狗也都是有成套的处理经验。
问:探讨大模型创业,算力、数据、人才都是成本,如果拿不到足够多的投资,实际上这个事没法做。
王小川:不同的路线图。
如果想做的是离 AGI(通用人工智能)最近的公司,那么我预测是 3 亿到 20 亿美元的资金投入。
3 亿只是入门的门槛。我们目前是选了对资金要求比较高的道路。
问:在路线图选择上有过纠结吗?要选择离大模型最近的一条,还是做离使用更近的?
王小川:双轮驱动。
超级应用需要跟底层产生非常强的连接,如果没有底座是没有办法支撑超级应用,在我心中大底座和大应用是相辅相成的。
问:具备什么样的素质才能选择离大模型更近的路?
王小川:至少两件事:
一是本身对技术有足够多的理想,因为它就是很挑战技术的活;
二是中间有一定体量的公司治理的号召力和能力,否则肯定不会做。
摄影:邓攀
问:一端是对技术的理解,一端是对创业本身的理解。你说过有信心在年底做出中国最好的大语言模型,敢说这句话的人现在不多。
王小川:大厂的专注度和效率不一定比创业公司高,而且有追求的人可能在原有的地方也有瓶颈,说白了这个事就适合用创新来做,我不觉得这是属于大厂的事情。
不知道大家怎么看,我只不过长过一次教训,比如搜索那一波。
最早搜索起来所有门户都做了一遍,搜狗是拆分完了好不容易活下来了,百度也活下来了,但是阿里、腾讯也都没有做成,而那还是可以看得见的成熟的东西。
但今天有巨大的变化,对于决策的专注度、灵活度、专业性都有很高的要求,历史没有告诉我们大厂可以干这个事。
问:大家认为大厂,有可能是基于眼睛可以看到的,比如现在有多少 A100 的芯片,有多少人才,看起来像是大力出奇迹,你认同吗?
王小川:上一轮搜索也不是当时的大厂跟进的,这一波 AGI 也不是大厂可以做到的,但大家都说大厂可以干。
这个东西就是 " 小创新大厂赢,大创新小厂赢。"
问:现在大家都比较关注算力,其实数据高质量也很重要,如果数据质量比较低的话,算力再多最后也浪费了,你们在数据或者语料这一块怎么做的?
王小川:语料做搜索公司尽可能把公开的语料或者以前收集到的语料用起来,质量怎么评价会做得更好一些。
问:现在在搭建下一步团队的时候有什么样的标准?前两天听到说全世界的人都在挖 OpenAI 的人,但是没有人离开,还有大量的人才往 OpenAI 去。
王小川:确实有距离,需要敬仰的一个状态,现在人才储备有两条路,一是把国内最好的都能够聚到一块,甚至有好的效能把它发挥出来;
有机会再从硅谷摸到一点人或者认知。
我 4 月底会去一次美国交流学习。
问:你每天花在找人的时间多吗?
王小川:三分之一,找到合适的人之后还要做沟通,三分之一的时间还要学习,每天新的技术、新的产品发布都需要时间去学习。
问:你常说包袱变轻了,但好像压力变大了,怎么理解?
王小川:现在做的事是世界需要的,跟世界是连在一块的,不是公司需要、部门需要或者只是同学们需要,它需要的东西不一样的。
确实是压力变大了。
现在有太多创业需要整理的人和事,这个精力是远远不够用的状态。
* 文章为作者独立观点,不代表笔记侠立场。
扫码成为笔记侠的朋友
领取商业实战方法,迭代你的赚钱逻辑
分享、点赞、在看,3 连 3 连
标签: