达摩院推出基于优酷视频的视频-文本数据集Youku-mPLUG

2023-06-16 20:08 作者: 来源: 本站 浏览: 我要评论达摩院推出基于优酷视频的视频-文本数据集Youku-mPLUG已关闭评论 字号:

摘要: 为解决长期以来人工智能领域缺少优秀的中文视频-文本数据集的问题,阿里达摩院的研究人员们从来自中国最流行的视频网站之一优酷(YouKu)上的4亿视频中,精选出了一千万条视频,并进行了人工标注,最终将其分成45个类别,从而为大尺度预训练模型的发展提供了良好的基础,...

为解决长期以来人工智能领域缺少优秀的中文视频-文本数据集的问题,阿里达摩院的研究人员们从来自中国最流行的视频网站之一优酷(YouKu)上的4亿视频中,精选出了一千万条视频,并进行了人工标注,最终将其分成45个类别,从而为大尺度预训练模型的发展提供了良好的基础,这些数据可以被应用在常见的视频文本任务中去,比如说跨模态检索、视频描述和视频分类等。

此前研究者们已经发布了大量英文的视频-文本数据集,如Howto100M、WebVid-2.5M、VLP等,都对研究工作起到了很好的助力作用,但是业界一直缺少比较好的精标中文视频-文本数据集,这个问题阻碍了中文场景下人工智能技术的发展,因此,一个优秀的精标中文视频-文本数据集是业内的迫切需要。在此情况下,达摩院推出的Youku-mPLUG数据集,将大大推进中文语境下一系列人工智能任务的发展。

与此同时,达摩院也发布了视频文本模型ALPRO和mPLUG-2。并在此基础上进行了各种类型的任务测试,取得了良好的效果。

优酷会员5.9元/月,8.9元/2个月,请点本站上边链接购买

2023年06月16日 20:08:09

 

随机账号机器密码:
53CX075 RC1
28SG901z NF09fn435Rw
51ZN921xjC7 PY77bi754Jn
83UI791nz WI02
12YU089mnE0 SU2
55HB487qfZ49wt IW85df846Jze
08ER7 AK88oo147Xeij
12DY212pdB64a PZ83fa730Xlnd6
31JR706voA7 TN87
62CH766qfS94q TM8
19JV49 XW07fl9
51TC00 DO16sr0
21WA8 ML43xg102Ufgk5

Comments are closed.

会员登录关闭

记住我 忘记密码

注册会员关闭

小提示: 您的密码会通过填写的"电子邮箱"发送给您.