中国版 Prisma 来了,我们今天再聊聊深度学习
截至到 2016 年 8 月 2 日,在俄罗斯 APP Store 免费榜上,Artisto 高居榜首,Vinci 位居第二,而 Prisma 则落到了第五的位置。 ▲图片制作软件 Vinci 的界面展示。图片来源:http://mspoweruser.com/vinci-great-alternative-prisma-now-available-windows-mobile-devices/ 不仅仅是俄国人在想视频这件事,Deep Art 那三个德国人也瞄准了视频市场。前不久,Deep Art 官方网站放出了一段 demo,开始制作付费短视频。一段 720p的视频(最长五分钟)售价 249 欧元。 Deep Art 的产品高价位和慢速度,定位的是中高级市场。而在大众消费端,免费产品 Prisma,Vinci,Artisto 不论谁赢,都是俄罗斯互联网巨头公司 Mail.Ru 的胜利。与其说几款产品是在技术上较量,不如说这是互联网资本大鳄的强势布局。 然而,事实上深度学习在视频上还处于起步阶段,主要面临如下三个挑战:
除了我们盘点过的这些 “滤镜类应用”,深度学习在图像处理上应用还有很多。总的说来,深度学习图像应用按照过程可以分为两部分:输入与输出。
在图像识别的高准确度的基础上,深度学习能够完成更为复杂的任务。举个例子,如果说百度图片搜索、微博自动检测图片中的敏感词属于计算机理性认知层面应用的代表,那么像 Prisma 这样的应用就是在深度学习的帮助下,让计算机不仅可以理性识别,还能感性认知图片,理解图像的风格与内容关系。 这才是人工智能的意义所在。计算机感知能力的发展决定了机器世界能否真正建立自洽、完整的知识体系,最终实现对人类能力的替代、延伸和增强。 按领域内容,深度学习在图像中的应用分为:图像识别、分类、检测、搜索、特征提取和视频处理这几大类别。其中,人脸识别是突破最快的深度学习图像应用。早在 2014 年便有多个初创科技团队达到了逼近或者超越肉眼的识别率,如下图展示: ▲各公司利用自己的公开样本集测试,提交测试结果。结果显示,汤晓鸥教授团队研发的人脸识别产品 Deep ID 已经超越肉眼的识别率。其中,小横线上面是技术产品名,下面是团队名称。(深蓝制图) 这几家公司中,Facebook 已经将 Deepface 的成果整合到自家产品中了。如今,用户上传照片到 Facebook 账号,系统就能自动标注图中的每一个人。而旷视科技和以汤晓鸥教授为技术核心的 “商汤科技”,则主要为金融、安防等部门提供成熟的身份认证产品,客户包括支付宝、招商银行、反恐部队等。 ▲商汤科技与旷视科技主要客户对比图(深蓝制图) Facebook 可能是这三家巨头中对深度学习图像应用最具有野心的大公司。据内部可靠消息,Facebook 或将在下周末(2016年8月底)将他们最新的研究成果代码开源。如果用一句最简单的话来形容 Facebook的新突破,叫做 “采用无监督学习让计算机无中生有,自己生成图片”。 ▲三大互联网公司在深度学习上的布局一览。(深蓝制图) 在以往,人们让计算机去做图像生成采用的是监督式学习,即需要利用大量带标签的数据去训练人工神经网络,后者才能逐渐学会识别东西。比方说,给计算机看 1000 张猫的图片,看多了之后神经网络会逐步对猫建立模型并识别其他猫的图像。 但在今天,Facebook 采用的是无监督学习,让计算机自主生成一些含有飞机、汽车、小鸟等东西在内的场景图像样本,并令观众信以为真。 Google 的 Deep Dream 是一个会画画的计算机。它自动识别图像,筛选出某些部分,进行夸张,以创造出一种迷幻效果。半年前,Deep Dream 于湾区举办了成功的画展。Deep Dream 模仿 500 年前文艺复兴时期的德国画家汉斯·荷尔拜(Hans Holbein)的笔触与绘画技巧,画出了一系列硅谷名人。每张画作足以让人们掏出几千美金来收藏。 (编辑:应用网_丽江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |