原创:朱利明
来源:朱利明
图片来源:由无界 AI工具生成
引言
这段时间参加了几个国内人工智能领域的会议,听到很多专业人士,包括一些知名互联网企业技术负责人坦诚的反思为什么没有抓住 ChatGPT 这波人工智能新范式。很大的原因在于 ChatGPT 的核心—语言模型,不是一个新的技术,已经有百十来年的历史了,而且大家一直在使用它。大家没有想到,当这个司空见惯的模型参数量超过某个临界值后会“涌现”出很多强大的功能。这也是这次中国人工智能领域落后的一个重要原因,越是人工智能领域特别是 NLP 领域的专业人士,越容易犯这个“灯下黑”的错误。有一位专业人士自我剖析的更深刻,这是经验主义错误。
我自己认识 ChatGPT 也有一个从浅入深的过程,当我认识到这是一次前所未有的人工智能浪潮时,我希望通过系列文章的形式让更多人了解一次新的而且是和每个人都相关人工智能革命来到了。
今天看到”學人 Scholar”公众号发表了一篇吴军老师“ChatGPT 不算新技术革命,带不来什么新机会”的文章,非常吃惊。事关技术发展方向的重大判断,以本文和吴军老师商榷。
一驳标题
文章标题“ChatGPT 不算新技术革命,带不来什么新机会”就令人吃惊,初看以为是媒体博人眼球,看过文章内容后应该是吴军老师对 ChatGPT 的判断。首先亮出观点“ChatGPT 是科技发展史上的重大技术革命,将带来无数新机遇,对很多行业将带来颠覆式改变”。详细可以看我写的几十篇关于 ChatGPT 的文章,我认为这一观点已经是越来越多人的共识。
当然,我是无名之辈,写再多文章也没有什么公信力,我们列举部分大咖对 ChatGPT 的评价和行动来作例证(虽然从逻辑上并不严谨)。比尔盖茨评价 ChatGPT 是他有生以来第二次重大技术革命,上一次是 1980 s 的图形用户界面(GUI)。马斯克联名一众大咖呼吁暂停比 GPT-4 更强的人工智能研发至少六个月。包括李开复、王慧文/王兴、王小川等已经退出江湖,财富自由几辈子的大咖纷纷出山重新创业。百度、华为、阿里、360 等纷纷发布大模型。是吴军老师“ChatGPT 不算新技术革命,带不来什么新机会”对了,还是以上这些大咖都错了,相信每个人都可以很容易得出结论。
二驳内容
文章内容我看了一遍,感受到了吴军老师浓浓的仁爱情怀,伴随着阴谋论和经验主义气息。吴军老师的中心思想是认为 ChatGPT 是炒作,而且群众里面有坏人,一批阴谋家和镰刀已经磨刀霍霍了,大家要小心又被割韭菜。这种仁爱情怀我很赞同,任何领域都有可能被坏人利用,何止 ChatGPT。吴军老师顺便举了两个例子:区块链和元宇宙。“就比如说区块链,当时炒得那么热,但如今这个事已经很少有人讨论了,对吧?这是第一个。第二个就是元宇宙,目前美国只有 Facebook 一家还在坚持做。”,我觉得吴军老师肯定不在这两个领域之中,“区块链很少有人讨论了”严重不符合区块链领域的实际情况,我不久前参加的不论是 CCF 还是 BSN 举办的区块链大会都是盛况空前。关于区块链和元宇宙不是本文的重点,留给相关领域的专家和吴军老师商榷。
本文反驳的是吴军老师对 ChatGPT 的认知存在方向性重大偏差,会误人子弟。
吴军老师提到,“最近 ChatGPT 这事儿在中国很火,很多人在讨论,但很有意思的是,其实这件事在美国,已经没有太多人去谈论这个话题了”,因此,ChatGPT 在中国是炒作。我认为这严重不符合事实,不知道吴军老师是通过什么调查途径得出这个事实的,估计是调研的国外对 ChatGPT 同样不感兴趣的人?继 2023 年 3 月 15 日 OpenAI 发布 GPT-4 后的短短一周之后,又发布 ChatGPT 插件技术。Google、Meta 等也不甘落后发布了 Bard、LLaMA,大模型竞争不断白热化。不仅是在 NLP 领域,Meta 刚刚发布“Segment Anything”的大模型,估计很快,“Detection Anything”、“Recognition Anything”等都会出来。如此如火如荼的发展被吴军老师说在国外无人谈论,是这一段时间闭关读史没有上网?
为了证明自己的论点,吴军老师一下子把我们带回了七百二十年前的 1503 年,通过哥伦布掌握月食原理来和牙买加人斗智斗勇的故事来铺垫后面要懂得事物背后的原理,顺便带了一下自己给大家开《世界文明史》的课程的初衷。故事很有趣,“以史为鉴”也是中国古训,但是和 ChatGPT 没什么直接关联。
Q2-Q6 是文章的主体,吴军老师回顾了是他的导师在 1972 年提出的语言模型这个技术,意思是我是本源和正宗,最有发言权。我们先不展开讨论语言模型的发展历史,考证其严谨性。其实语言模型可以追溯到一百多年前苏联数学家马尔可夫。很遗憾,吴军老师犯了和前言中提到的一些大咖同样的错误:经验主义错误,有些时候历史不一定可以推演未来,走老路到不了新地方。
语言模型从被提出后一直被广泛使用,不断迭代创新发挥了越来越重要的作用。特别是当语言模型参数量超过某个临界值后会“涌现”出很多强大的功能:例如多任务能力、小样本和零样本学习能力、思维链(COT)能力、指令学习能力、上下文学习能力等等,这些都带来了不同以往的人工智能学习范式,不再是几年前甚至几十年前的样子。
在吴军老师的文章中,我们没有看到任何对 ChatGPT 的技术内容的使用和讨论,全部都是建立在历史经验对现在的评论,我想请问一下吴军老师,您看过 ChatGPT 相关的论文吗?您注册账号使用过 ChatGPT 的产品吗?
从 OpenAI 发表的关于 ChatGPT 一系列论文来看:“Improving language understanding by generative pre-training”,2018;GPT-2:“Language Models are Unsupervised Multitask Learners”,2019;GPT-3:“Language Models are Few-Shot Learners”,2020/5;InstructGPT:“Training language models to follow instructions with human feedback”,2022/3;ChatGPT is a sibling model to InstructGPT, 2022/11;GPT-4: large multimodal model、2023-04,持续在语言模型进行研究,坚持把模型做的更大,这个路径其实并不被大多数人认可,但是 OpenAI 坚持下来,终成正果。就算是语言模型的发明者也要向 OpenAI 虚心请教。
拥抱变化
以 ChatGPT 为代表的大模型技术是实实在在的人工智能技术革命,炒作不影响本质判断。吴军老师在文章中提到清楚原理就“不会恐慌”,我非常赞同,但可惜的是吴军老师基于自己错误的结论给出的建议更是大错特错:“我就开玩笑地问他说,你的房贷还清了吗?你要没还清,你就好好回去工作,把工作做好,这才是对大家最有意义的事情,从历史上看也是如此”。
实际的情况是,很多公司招聘设计师已经要求会使用人工智能工具,很多公司也在推进程序员使用智能编程工具,很多学生开始使用人工智能完成作业,很多人已经通过人工智能工具创建了新的工具和商业模式,更多的 ChatX 开始涌现。人工智能可能不会取代你和你的公司,但是会使用人工智能工具的人会取代你和你的公司,积极拥抱变化才能无惧无谓。
另外,如何防止被人工智能炒作割韭菜很简单,不看广告,看疗效。好不好,自己亲自用用不就知道了,顶上听专家纸上谈兵一万句。
总结
每个人发声的影响力不同,例如我这样的无名之辈,说话也没有几个人当回事,写文章不过是个人爱好。但是知名专家学者,大咖发声还是要慎重,首先互联网是有记忆的,当年 AlphaGO 大战李世石时的评论还都在知乎上记着呢,可能影响自己的公信力。其次,专家影响力大,个人看了会影响其发展方向,地方政府的负责人看了甚至会影响一个地方的经济发展。吴军老师,经验主义害死人。
推荐阅读:
吴军:ChatGPT 不算新技术革命,带不来什么新机会