向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

AI再度进化:微软模仿人类增进对世界了解的方式来训练人工智能

2019-10-09
导语:近日,微软研究人员开发了一种AI系统,通过模仿人类增进对世界了解的方式来训练图像-文本对。Unified VLP :“一群人撑着伞站在雨中。”Question :“他们穿的都一

近日,微软研究人员开发了一种AI系统,通过模仿人类增进对世界了解的方式来训练图像-文本对。LR5机器人网

Unified VLP :“一群人撑着伞站在雨中。”Question :“他们穿的都一样吗”?Unified VLP : “是的。”

众所周知,没有详细的随附注释,机器很难理解场景和语言。LR5机器人网

但是标记通常耗时久、成本高,且最好的标记也只能传达对场景的理解,不能传达对语言的理解。LR5机器人网

为了解决该问题,微软开发了此系统。LR5机器人网

 LR5机器人网

研究人员表示,单模型编码器/解码器视觉语言预训练(VLP)模型既可以生成图像描述,又可以回答有关场景的自然语言问题,为将来可能达到人类同等水平奠定了基础。LR5机器人网

 LR5机器人网

GitHub上提供了使用三百万个图像-文本对进行预训练的模型。LR5机器人网

GitHub:https://github.com/LuoweiZhou/VLPLR5机器人网

 LR5机器人网

“对周围世界的感知是我们从小就开始学习的一种技能……我们与身体环境的互动越多……就越能理解和使用语言来解释存在的事物”微软高级研究员Hamid Palangi在博客中写道。LR5机器人网

“另一方面,对于机器而言,场景理解和语言理解非常具有挑战性,特别是在弱监督的情况下,本质上来说,能够被间接学习的人很好地利用。”LR5机器人网

正如Palangi及其同事所解释的那样,图像字幕和视觉问答质量算法通常表现不佳,原因如下:LR5机器人网

(1)无法利用上下文描述图像并进行推理;LR5机器人网

(2)没有利用大规模的训练数据进行预训练;LR5机器人网

(3)架构在设计语言,视觉对齐和语言生成任务时表现不佳。LR5机器人网

 LR5机器人网

该团队对包含编码器(学习给定数据的数字表示形式)和解码器(将编码器的表示形式转换为人类可解释的信息)的架构进行了预训练,并针对两种预测进行了优化。LR5机器人网

研究人员表示,该架构最终创建了更好地对齐的编码器和解码器表示形式,使他们可以用相同的模型来实现不同的目标,如图像字幕和视觉问题回答。LR5机器人网

 LR5机器人网

微软发布新AI:能生成图像描述,还能回答场景相关问题

 LR5机器人网

 LR5机器人网

上图:关于COCO和VQA 2.0的定性示例。LR5机器人网

图片来源:MicrosoftLR5机器人网

 LR5机器人网

研究人员评估了VLP在公开基准(包括COCO,Flickr30K和VQA 2.0)上对图片进行说明和推理的能力。LR5机器人网

研究人员表示,VLP不仅在几个图像标题和视觉问题回答指标方面优于最新模型,而且还设法回答了与先前模型有关的图像问题(例如与服装设计相似的图像),而之前只接受过语言训练的模型很难回答这些问题。LR5机器人网

 LR5机器人网

“通过智能模型设计和智能数据选择,我们可以利用现有的公共资源,在语言和场景理解方面达到更高的水平,VLP就是证明,” Palangi写道。LR5机器人网

“通过VLP,我们展示了统一模型在语言和场景理解水平的潜力,这是成功完成各种不同的下游任务所必需的——单个模型在不牺牲性能的情况下高效地完成多个任务。LR5机器人网

这意味着更有效,更强大的视觉语言系统,无需花费多个单独训练的模型来达到相同的目标。”LR5机器人网

 LR5机器人网

在未来的工作中,该团队将强化模型的架构,同时在预训练期间添加更多数据。LR5机器人网

本文为机器人网原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。

您可能感兴趣的文章

  • 什么是第三代人工智能,其发展趋势是什么?

    人工智能从1956年第一次提出来,人工智能已经发展了63年多,最初的第一代人工智能是用计算机来解决问题,第二代是以AlphaGo为标志的深度学习,但是深度学习是基于真正的大数据,在目

  • 2020年,将是人工智能成为人类科技革命制高点的分水岭

    人工智能将是工业革命的核心技术之一,对于这个问题我说一下自己的理解。在未来如何你不能掌握核心科技,那么高科技领域的竞争主动权就不能掌握在自己手里。在很多领域都会受到

  • 未来5年中国人工智能基础架构规模的分析

    中国人工智能基础架构规模分析  2019年11月,IDC公布的《2019年H1中国AI基础架构市场调查报告》显示,2019年上半年中国AI基础架构市场销售额达8.37亿美元,同比增长541%。其中,

  • AI小编,其作品享有著作权吗?

    AI机器人不是人,它写出来的东西能享有著作权吗?自人工智能蓬勃兴起,开始出现在新闻写作、视频音乐创作等领域后,有关人工智能作品的著作权问题就一直在困扰着学界和实务界,争议颇

  • 美国发布人工智能八大战略

    《美国国家人工智能战略》确定人工智能技术研发是维持美国人工智能在全球领先地位的重中之重。美国如今在人工智能创新方面处于世界领先地位,很大程度上要归功于美国强大的研

  • 盘点2019年人工智能+安防技术变革与创新

    2019年在中国的AI+5G+机器人+自动驾驶的浪潮中,伴随着中美贸易战的强势又千转百回的音符,过的似乎格外的快。纵观2019年安防行业新技术变革,我们会发现今年安防行业涌现出新概

相关推荐

广告
推荐使用浏览器内置分享