ChatGPT 爆火中美 AI 差距拉大到什么程度?

2023-03-25 15:35 作者: 来源: 本站 浏览: 我要评论ChatGPT 爆火中美 AI 差距拉大到什么程度?已关闭评论 字号:

摘要: 3 月 16 日,李彦宏站在舞台聚光灯下,感受着全球科技从业者目光的注视,风头一时无两。 3 年前,同一个场景,他也曾这么出风头过,但当时是因为一瓶从头浇下的矿泉水。 这一次他显然信心十足。预热了几个月,只要 文心一言 一发布,在 ChatGPT 掀起全球 A...

3 月 16 日,李彦宏站在舞台聚光灯下,感受着全球科技从业者目光的注视,风头一时无两。

3 年前,同一个场景,他也曾这么出风头过,但当时是因为一瓶从头浇下的矿泉水。

这一次他显然信心十足。预热了几个月,只要 文心一言 一发布,在 ChatGPT 掀起全球 AIGC ( 生成式 AI ) 狂潮乃至狂热的当下,百度就将成为全球第 2 个触摸到未来的科技先锋。

无论是发布会前一天 OpenAI 不讲武德地推出了革新的 GPT-4 模型,还是发布会上缺少实机演示,亦或是第一批尝鲜的用户输入 爱国 结果画出星条旗,都沉重打击了市场信心。

发布会开始不到 20 分钟,百度港股股价就暴跌超 9.8%,后来股价略有上升,但跌幅仍超 5%。不出意料,微博、知乎迅速出现了一片嘲笑声, 百度股价跳水 被送上热搜,线上线下弥漫着快活的空气。

然而,仅过了一晚上,股市完全变了。3 月 17 日港股开盘后,百度几乎是直线拉升,日内继续波动上涨,全天涨幅近 15%。随后几天,余威未消,百度股价继续上涨,目前已经回到年内高位。

文心一言虽然比 GPT4 差得远,甚至比不上 GPT3.5 的 ChatGPT,但依然是能用的。各种让人啼笑皆非的产出结果恰恰证实了技术的真实性,没有弄虚作假,这就够了。只要是真的,花钱花时间,总能迭代到好用的时候。

况且要论落后,落后第 1 名,那也是行业第 2,在一个公认前途无量的领域做到世界第 2,不强么 ?

不能完全怪其他大厂不努力,从历史来看,过去 AI 发展经历了 3 波高潮,但总体来看,雷声大,雨点小。

人工智能概念的提出始于 1956 年的美国达特茅斯会议,1959 年 Arthur Samuel 提出了机器学习,推动人工智能进入第一个发展高潮期,但因为对现实问题束手无策而衰退。这个阶段,AI 只会依据规则证明中学数学定理。

此后 70 年代末期出现了专家系统,标志着人工智能从理论研究走向实际应用。80 年代到 90 年代随着美国和日本立项支持人工智能研究,人工智能进入第二个发展高潮期,期间人工智能相关的数学模型取得了一系列重大突破,如著名的多层神经网络、BP 反向传播算法等,算法模型准确度和专家系统进一步提升。

新世纪以来,互联网将人类代入大数据时代,深度学习算法的出现和强化,GPU、NPU、FPGA 等芯片技术带来的算力突破,共同推动了 AI 第三次浪潮的出现。

谷歌推出大规模预训练语言模型 BERT,通过 3 亿参数量的训练,在机器阅读理解顶级水平测试 SQuAD1.1 的 2 个衡量指标上全面超越人类,并在 11 种不同的 NLP 测试中达到 SOTA ( 业内最佳 ) 表现,宣布了大模型时代的到来。

次年,OpenAI 迅速跟进,将 GPT-1 的 1.17 亿参数量迭代至 GPT-2 的 15 亿,在没有对模型结构做出过多创新的情况下,实现了超强的内容生成能力。

又过了 1 年,现在已经家喻户晓的 GPT-3 诞生,大模型参数量暴涨到 1750 亿,系统出现了从量变到质变的跨越。在优化和熟识 1 年多后,OpenAI 将基于 GPT-3.5 的 ChatGPT 推向市场,轰动了全世界。

在智能化水平上,GPT-4 和之前的模型产生了天壤之别。比如说,在美国大学先修课程微积分 BC 考试中,GPT-4 获得 4 分 ( 满分 5 分 ) ,而 GPT-3 获得 1 分。GPT-3.5 是 GPT-3 和 GPT-4 的中间模型,也获得 4 分。

模拟律师考试方面,GPT-4 以排名前 10% 的成绩通过,GPT-3.5 的分数徘徊在后 10% 左右。

GPT-4 更有趣的方面之一是多模态。与 GPT-3 和 GPT-3.5 只能接受文本提示不同,GPT-4 还能接受图像提示来执行某些操作,也就是输入图片,它生成一段相关的文字内容。

从时间上看,GPT-4 早在 2022 年年中就基本完成 ; 从产品上看,OpenAI 还有很多,比如其中一款 DELL-E2,可以输入文字来一张图片,正好和 GPT-4 互补。

作为行业第 2,百度在 2019 年就已开始积累 AI 预训练模型技术,2021 年 12 月正式发布了全球首个知识增强千亿大模型鹏城 – 百度 · 文心,参数规模达到 2600 亿,比 ChatGPT 还大。

这里要为百度说句话,模型的参数量不是决定最终产品的唯一因素,模型的架构设计、数据质量、训练策略等因素都会影响模型的能力和性能。

就拿数据质量来说,如果百度是用中文互联网的信息来训练,那必然能起到一种事倍功半的效果。

3 月,谷歌正式开放类 ChatGPT 产品 Bard 的访问,成为全球第 3,其背后的 LaMDA 模型使用多达 1370 亿个参数进行训练。而从实际使用来看,这个第 3 当之无愧——有时候连文心一言都不如。

中国率先做出类 ChatGPT 产品的为什么不是腾讯、阿里、字节跳动这样顶尖的互联网大厂,而是百度这种 掉队 厂商 ?

国内互联网公司花钱多少不一样,聚集人工智能的人才团队大小不一样,但是思路一样——人工智能应该找场景,要解决自己业务中遇到的问题。

所以,为什么中国的人工智能都用来解决人脸识别、图像滤镜做得更漂亮,如果一个人工智能技术和自己的业务不能结合,可能就会认为没太大意义。

所以,没有人想到用 GPT NLP 的模型解决通用知识理解和推理的问题,更没有人想到大算力大数据,最后做出一个大模型,能够产生一种连 OpenAI 自己都想不到的智能化的结果。

这段话不一定全对,但一定有正确的地方,因为确实有大厂身体力行地证明了这一点。

ChatGPT 火了之后,腾讯深藏于血脉之中的本能立刻觉醒,马上宣布成立 混元助手 ( HunyuanAide ) 项目组。

根据 36 氪 职场 Bonus 消息,项目组 Owner 张正友是腾讯史上最高专业职级拥有者,首位 17 级研究员 / 杰出科学家 ; 下面的 3 位 PM,分别是腾讯在 AI 算法、AI 工程和商业化方面的高管 ;7 位组长是来自内部多个团队的骨干 ; 支持人员更是覆盖广泛,连微信和互娱的也出现在名单人员的业务覆盖面内,可见腾讯之重视。

事实上,如果搜索关键词可以发现, 混元 这个名字并不是第一次出现在腾讯的项目中。

早在去年 4 月,腾讯就宣布了发布多模态 混元 AI 大模型的消息,不过这个模型当时并没有用在类 ChatGPT 产品上。

根据当时的通稿, 混元 大模型 被广泛应用到广告创作、广告检索、广告推荐等腾讯业务场景中 。具体来说,就是利用 AI 更好地理解广告内容,然后更加精确地推送到你手机上。

首先是阿里。2020 年,阿里达摩院和清华大学共同推出了 3 亿参数量的 M6 大模型,2021 年 1 月模型参数规模到达百亿 ;2021 年 5 月,具有万亿参数规模的模型正式投入使用。

2022 年 10 月,M6 的参数规模扩展到惊人的 10 万亿,成为全球最大的 AI 预训练模型。

在产品方面,和腾讯一样,M6 主要应用在阿里业务上,比如增进淘宝、支付宝等平台的搜索及内容认知精度等。去年阿里曾公布其在 AIGC 方面的成果,生成的实景图片已经十分逼线 月,据媒体报道,阿里版聊天机器人 ChatGPT 正在研发中,目前处于内测阶段。

之后是京东。2 月 10 日,京东云旗下言犀人工智能应用平台宣布将整合过往产业实践和技术积累,推出产业版 ChatGPT:ChatJD。

不过这个产品也许八字还没一撇,其通稿公布的信息中,参数量用的是 预计 为千亿级别的字眼。

在此前的采访中,京东方面曾透露过自研领域知识大模型 K-PLUG 的消息,称其生成的商品文案覆盖了京东 3000+ 品类,累计生成 30 亿字,带来超过 3 亿元 GMV。

就算新产品发布了,也和普通网友没什么关系,因为其定位的领域是零售和金融,服务于京东相关领域。

字节跳动方面发力较晚。据公开报道,到今年 2 月,ChatGPT 已经火遍半边天了,字节还只是 正在大模型方面布局 。知情人士表示,字节跳动语言大模型团队在今年组建,探索方向主要为与搜索、广告等下游业务的结合,语言大模型团队的预期是在今年年中推出大模型。

另外还有华为。2021 年 4 月,华为发布了盘古大模型,包括 30 亿参数的视觉 ( CV ) 预训练模型,以及与循环智能、鹏城实验室联合开发的千亿参数、40TB 训练数据的中文语言 ( NLP ) 预训练模型。

不过无论是从当时公布的布局,后续通稿,还是近期的回应来看,华为似乎都没有推出类似 ChatGPT 这样面对普通网民的通用应用的意愿。也许未来我们可以在鸿蒙的车机上体验到华为的技术实力。

比如网易有道方面称,未来或将推出 ChatGPT 同源技术产品,应用场景围绕在线教育。

三六零在互动平台上表示,正计划尽快推出类 ChatGPT 技术的 demo ( 试用版本 ) 应用。

科大讯飞 2 月在投资者互动平台回应称,公司在该方向技术和应用具备长期深厚的积累。科大讯飞 AI 学习机将成为该项技术率先落地的产品,将于今年 5 月 6 日进行产品级发布。

有意思的是,去年 12 月,他们的董秘还说 目前没有类似 ChatGPT 的产品计划 。

必须强调的是,虽然行业的领先者已经出现,但是长期来看,生成式 AI 其实还在萌芽阶段,未来竞争格局依然可能生变。

Gartner《2022 年人工智能技术成熟度曲线》报告预测,广阔的应用场景和需求空间吸引大量资本和技术投入,预计将在 2-5 年内实现规模化应用。

但有一点可以确定,之前国内大厂的功利主义和商业 KPI 导向在此刻将会得到教育,接下来可以预期,行业对 AI 成果商业化的预期会更加宽容和长期主义,对于 AI 生产力和增长曲线的认知也会更加清晰和坚定。

【1】《2023-2028 年中国人工智能行业市场前瞻与投资战略规划分析报告》,前瞻产业研究院

同时前瞻产业研究院还提供产业大数据、产业研究、政策研究、产业链咨询、产业图谱、产业规划、园区规划、产业招商引资、区域产业对标研究、IPO 募投可研、IPO 业务与技术撰写、IPO 工作底稿咨询等解决方案。

迅雷会员25天/4.5元,独享1天0.7元,请点本站上边链接购买

2023年03月25日 15:34:38

 

随机账号密码机器码:
49JI474deZ84 QA08ob9
54G TJ92
70KD024gtI7 XC84
68OY347jfT34 MD35nu969Zx
71KZ713 PC96tu55

Comments are closed.

会员登录关闭

记住我 忘记密码

注册会员关闭

小提示: 您的密码会通过填写的"电子邮箱"发送给您.