加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_丽江站长网 (http://www.0888zz.com/)- 科技、建站、数据工具、云上网络、机器学习!
当前位置: 首页 > 综合聚焦 > 移动互联 > 评测 > 正文

亲测:让盲人“看见”图片我们离这项黑科技有多远

发布时间:2016-04-18 11:55:49 所属栏目:评测 来源:雷锋网
导读:上周Facebook告诉我们它们正在开发的功能已经能让盲人”看到“图片的时候,晒图狂们突然发现,哇,原来图像识别已经离我们的生活如此之近,以至于盲人伯伯们也能用听的方式

说起来很简单,那它实现起来有多难?

曾在阿里负责图像识别和搜索产品的赵京雷,现readface创始人表示:

“从视觉识别的角度,深度学习出现以后,它的难点主要在大规模可用训练数据和算法上

从数据层面上来讲,要“教会”计算机去识别、描述一个图片的内容,一方面要识别图片中出现了什么样的物品,另一方面要描述这些物品中的关联。

比如对于‘一个人坐在湖边钓鱼’这样的图片,要描述出来,最基本的要识别出:人、湖和钓鱼竿;识别出物品之后还要能够确定三者之间的关系。

世界上形形色色的物品种类繁多,构建可靠的标注数据集,使得针对每类物品都有足够的标注样本,去指导学习算法习得物品种类概念,本身工作量巨大。而同类的物品之间,又存在不同可能的关系。要对这些可能的关系,构建足够的样本数据,工作量会更大。

在计算机视觉的学术界,(我记得)斯坦福前些年推出“ImageNet”,人工对百万图片标注里面出现的物品种类,ImageNet在过去几年推动了对照片中通用物品识别技术的发展。而为了进一步确定不同物品的关系,斯坦福去年推出新的数据集“Visual Genome ”,致力于在ImageNet的基础上,刻画出物品的关系。Genome数据集针对一副图片,把结构化的图像概念和语言联系起来。

(编辑:应用网_丽江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读