直击WAIC2023阿里达摩院李晨亮:开源生态有助于大模型的繁荣

2023-07-10 07:11 作者: 来源: 本站 浏览: 我要评论直击WAIC2023阿里达摩院李晨亮:开源生态有助于大模型的繁荣已关闭评论 字号:

摘要: 在WAIC2023期间,阿里云推出了国内首款大模型调用工具魔搭GPT(ModelScopeGPT),它能接收用户指令,通过“中枢模型”一键调用魔搭社区其他的AI模型,大小模型协同完成复杂任务。目前,魔搭GPT已能够调用魔搭社区十多个核心AI模型的API。 “目...

在WAIC2023期间,阿里云推出了国内首款大模型调用工具魔搭GPT(ModelScopeGPT),它能接收用户指令,通过“中枢模型”一键调用魔搭社区其他的AI模型,大小模型协同完成复杂任务。目前,魔搭GPT已能够调用魔搭社区十多个核心AI模型的API。

“目前,大语言模型在文本创作、内容生成等方面,都有惊艳表现。但作为一个大模型,如果本身只有文本生成能力的话,其实并不足够的。我们提出了魔搭GPT,主要理念是以大模型为中枢,调动各种各样的小模型API,来弥补大模型在图片生成、语言视频、视频生成等能力上的不足。” 阿里巴巴达摩院高级算法工程师李晨亮对《科创板日报》记者表示。

当前,如何把通用大模型做小做精,让行业更快用起来,是一大探索方向。在这方面,李晨亮向《科创板日报》记者介绍,“为了让各行各业的这种开发者能够把大模型用在真实的业务场景上,我们对大模型做了很多的一些优化,包括利用蒸馏压缩的方法,来提供更多的小模型;通过模型量化,来压缩得到小模型等。后续也会开放更多和大模型周边相关的工具,来帮助模型的落地应用。”

构建和训练一个大模型需要大量的计算资源和数据,这对于个人研究者或者小团队来说非常具有挑战性。在这样的背景下,开源开放的生态系统成为了推进大模型技术发展的重要力量。

目前,阿里云魔搭社区是国内最大的AI模型社区,集聚了180多万AI开发者和900多个AI模型。模型贡献者包括百川智能、哔哩哔哩、IDEA研究院、兰丁股份、澜舟科技、openBMB社区、启智社区、清华TSAIL、RWKV、深势科技、WeNet社区、元语智能、浙江大学、智谱AI等,贡献了30多个10亿以上参数规模大模型。

“开源生态肯定是有助于大模型的繁荣。”李晨亮强调,“2018年谷歌提出了BERT大模型,并开源了模型的代码,这带来了整个预训练大模型领域的繁荣。如果没有BERT的开源,那可能就没有如今大模型的繁荣现状,整个业界发展得会比较慢。”

以数据层面为例,大模型非常依赖于数据的质量。“”现在不管是大厂还是创业公司,自身都有大量的数据积累。如果大家能够把一些数据贡献出来,构建高质量、更大规模的开源数据集,那么不管是从自身模型的迭代,还是国内大模型发展速度,都能带来很大的提升。” 李晨亮呼吁。

哔哩哔哩大会员2.68元/月,6.88元/3个月,请点本站上边链接购买

2023年07月10日 07:11:08

 

随机账号机器密码:
14VN746bxE8 SQ88hd920Qnm
85TG449jcJ46jn XH66fy209Vk
06PB410 OR93db802Gufo9
99OS602lnT85k HD52hx804S
45PY10 FY07ia04
41UV707rgR VM18hq438
39CR55 JD1
47WB887c CO51eh663Gx
51S QB03
73DA46 FH64mt463Ga
33U AL74z
87Z ZZ56
15ID421cxN WW23gn

Comments are closed.

会员登录关闭

记住我 忘记密码

注册会员关闭

小提示: 您的密码会通过填写的"电子邮箱"发送给您.