您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
人工智能 正文
发私信给何忞
发送

2

Facebook 推机器视觉方案,能轻易读懂图片信息

本文作者: 何忞 2016-10-13 16:50
导语:日前,Facebook AI 研究院刊登了最新的研究论文,主要针对完善对象分割方法进行解析,并推出了新的机器视觉方案——SharpMask。

完善对象分割方法(Learning to Refine Object Segments)

Facebook 推机器视觉方案,能轻易读懂图片信息

论文摘要

要实现对象分割,需要获得两方面的信息,一是目标层级的信息,二是更低级别即像素级别的信息。这就为前馈网络提出了挑战:卷积网络中的底层获取了大量的空间信息,而更高层则需要目标层级的信息,无法随着对象的造型及外观变化进行调整,效果不佳。本次研究中,我们为目标分隔的前馈网络提出了一种新的自上而下的改善方法。这种由顶层到底层的结构能够有效地做出高保真目标图像。该方法与跳接相比,相同点是都在网络各层级中放大了图像特征,不同点在于,我们的方法不在每层中输出独立的预测,而是先在前馈过程中输出一个粗略的图像编码,然后再在由上至下的过程中,用底层的图像特征依次向上完善该编码。这种方法更加简单、快捷和有效。在最近流行的 DeepMask 网络中做出图像指令,我们的方法将图像精确度平均提升了 10-20%。另外,在总体网络结构的最优化问题中,我们采用了 SharpMask,与原有的 DeepMask 网络相比,速度提升了50%(8 秒/图)。

作者简介

Pedro O. Pinheiro,供职于 Idiap Research Institute 和 Ecole Polytechnique Federale de Lausanne(EPFL)。

Tsung-Yi Lin 来自康奈尔大学康奈尔技术研究院。

结论和场景应用

本文针对快速对象分割任务发展了一种新的网络结构,对前馈网络进行自上而下通路的完善。文中的模型使目标图像无论是在处理速度还是在质量方面都有了大的提升。该方法可以广泛应用在各种像素标注的任务中。

via Research at Facebook

PS:本文由雷锋网(搜索“雷锋网”公众号关注)独家编译,未经许可不得转载!

可在此处进行原论文下载

推荐阅读:

论文精选 | 实现城市设备智能规划?——具有可选偏好的设施选址游戏

深度 | 计算机如何从乐盲到作曲家?建 28 层神经网络,听 8000 个 MIDI 乐章

雷峰网原创文章,未经授权禁止转载。详情见转载须知

Facebook 推机器视觉方案,能轻易读懂图片信息

分享:
相关文章

编辑

站在博士路的路口。
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
Baidu
map