北京地区最大的生活类资讯门户

全球首个知识增强的多模态预训练模型,百度ERNIE-ViL超越谷歌登顶权威榜单

商业 2020-8-19 7:13540wangshuaigang

  赋予机器认知能力一直以来便是人工智能中最具挑战的难题,如今这个难题随着百度ERNIE新模型的推出而逐渐有了一个较为清晰的答案。

  近日,百度提出了知识增强的视觉-语言预训练模型ERNIE-ViL,首次将场景图知识融入多模态预训练,大幅提升了机器理解人类的能力。该模型不仅取得了5项多模态任务的最优解(SOTA),更是超越Google、Facebook等科技巨头,登顶国际权威榜单——视觉常识推理任务榜(VCR)。

  夜以继日的攻坚,让百度ERNIE此次在多模态语义理解领域取得了重大突破,不仅为多模态语义理解领域研究提供了新的思路,而且赋予了机器更加强大的认知能力,让AI技术的适用性进一步得到加强,为赋能各行各业提供了坚实的技术基础。

发表评论

北京之窗 Copyright ©