摘要: 为解决长期以来人工智能领域缺少优秀的中文视频-文本数据集的问题,阿里达摩院的研究人员们从来自中国最流行的视频网站之一优酷(YouKu)上的4亿视频中,精选出了一千万条视频,并进行了人工标注,最终将其分成45个类别,从而为大尺度预训练模型的发展提供了良好的基础,...
为解决长期以来人工智能领域缺少优秀的中文视频-文本数据集的问题,阿里达摩院的研究人员们从来自中国最流行的视频网站之一优酷(YouKu)上的4亿视频中,精选出了一千万条视频,并进行了人工标注,最终将其分成45个类别,从而为大尺度预训练模型的发展提供了良好的基础,这些数据可以被应用在常见的视频文本任务中去,比如说跨模态检索、视频描述和视频分类等。
此前研究者们已经发布了大量英文的视频-文本数据集,如Howto100M、WebVid-2.5M、VLP等,都对研究工作起到了很好的助力作用,但是业界一直缺少比较好的精标中文视频-文本数据集,这个问题阻碍了中文场景下人工智能技术的发展,因此,一个优秀的精标中文视频-文本数据集是业内的迫切需要。在此情况下,达摩院推出的Youku-mPLUG数据集,将大大推进中文语境下一系列人工智能任务的发展。
与此同时,达摩院也发布了视频文本模型ALPRO和mPLUG-2。并在此基础上进行了各种类型的任务测试,取得了良好的效果。
优酷会员5.9元/月,8.9元/2个月,请点本站上边链接购买
2023年06月16日 20:08:09
随机账号机器密码:
53CX075 RC1
28SG901z NF09fn435Rw
51ZN921xjC7 PY77bi754Jn
83UI791nz WI02
12YU089mnE0 SU2
55HB487qfZ49wt IW85df846Jze
08ER7 AK88oo147Xeij
12DY212pdB64a PZ83fa730Xlnd6
31JR706voA7 TN87
62CH766qfS94q TM8
19JV49 XW07fl9
51TC00 DO16sr0
21WA8 ML43xg102Ufgk5
会员登录关闭
注册会员关闭