Prisma虽昙花一现，但人工智能平民化时代才刚刚开始

发布时间：2016-08-12 03:34:34 所属栏目：评论来源：钛媒体

导读：如果说Alpha Go还让普通人仰之弥高，那么人人皆可“调戏”的Prisma可谓是第一款人工智能平民化应用，两者的共同特征是，都在让深度神经网络从幕后走到台前。先有Alpha Go在

让艺术家画作经过VGG神经网络，计算并保存格拉姆矩阵 G。然后再让用户的照片通过VGG神经网络，保存特征图F。生成一张白噪音图片，通过误差反向传播算法，不断升级这张图片直到它的特征图接近F，格拉姆矩阵接近G。

通过很难找到一张完美匹配G和F的图片，所以就需要做出一定程度的妥协。是更接近G还是更接近F?如果生成的图片更侧重于格拉姆矩阵接近G，那么它就更接近艺术品的风格。如果生成的图片更侧重于特征图接近F，那么它就保留更多照片的内容。下面的几张图片演示了这种妥协，从左至右，艺术风格越来越淡化，图片内容越来越凸显。

为什么Prisma注定昙花一现?

Prisma的滤镜更像脸萌而不是Instagram、Faceu，是娱乐型产品而不是工具型产品，更不用说进阶为社交应用了。实际上，很多新奇酷产品都把握不好娱乐产品和工具型产品的界限——是可以日常使用还是偶尔玩耍?使用场景是什么?Faceu之所以没有昙花一现，是因为它可以用于自拍、美颜、自带表情聊天，那么Prisma则只是为了追求新鲜炫酷。Faceu是锦上添花，Prisma则是改头换面。

而对于图片工具的主要应用场景——社交网络而言，被发在那里的照片主要是为了凸显内容而不是彰显风格，追求真实性大于效果炫酷，过度使用滤镜、使用过度“失真”的滤镜乃是一大忌讳。

更为重要的是，美颜是国内用户“修图”的首要驱动力，一切不能美颜的修图工具都是“耍流氓”，而Prisam过度“风格化”的滤镜在人像尤其是面部处理方面很难令人满意。美颜需要的是对面部细微之处的修修补补，轻抹慢涂，而不是狂放艺术家的笔刷横扫，颜料泼洒。

一方面要用艺术家的风格让人耳目一新、为之惊叹，一方面又要保留每一张照片的内容，这就意味着Prisma只能选取印象派之后、现代主义之前的艺术流派，正如一位学艺术的朋友所言：“它的智能尚不能学着像毕加索那样去解构人体，更不消说康定斯基完全不依实物作画。”而且后古典主义时代的审美(摆脱对于“像不像”的纠缠，同时注重内容与表现形式)目前在大众中尚未被普遍接受，Prisma的“日常化”尚不具备群众基础。

人工智能正在让智能手机更“智能”

正如钛媒体的文章《代码不再重要，未来我们要像训狗一样训练计算机》中写到的，机器学习在互联网应用中已经无处不在：Facebook利用它来决定哪条新闻出现在你的时间线上，Google图片用它来做面部识别。微软的Skype Translator利用机器学习把演讲实时转换成不同的语言。Google还利用DeepMind 为它昼夜运行的数据中心节能降耗。而基于深度神经网络的人脸识别技术已经广泛应用于线下的身份认证。

然而，这些面向企业用户、运行于后台的的人工智能技术还没有“把玩”在普通用户手中，响应他们的每一次需求，使智能手机真正变得智能起来。

Prisma的风行，标志智能手机的硬件时代已经过去，人工智能时代已经到来。Prisma使用的卷积神经网络技术，正是现在人工智能的前沿。以后各种顶尖的人工智能技术将继续平民化，实现在各种移动硬件上。实际上，除了Prisma这样的娱乐化应用，人工智能也正在被用于解决智能手机用户的真正“痛点”。

如果你是个拍照达人，不知不觉中相册中已经泛滥成灾了上千张照片，让你有心去整理而又不知从何下手。现在，Apple Photos、Flickr、 Google Photos等都开始利用图像识别技术帮助你自动整理、归类图片。

Prisma虽昙花一现，但人工智能平民化时代才刚刚开始

应用了人工神经网络之后，Swiftkey的预测准确性有了明显提升

而今年，人工智能技术也第一次应用在输入法上，7月份，全球拥有3亿用户的Swiftkey发布了一款利用人工神经网络预测用户输入内容的输入法SwiftKey Neural Alpha，相比于过去只能根据最新键入的两个词进行“局部预测”，SwiftKey Neural Alpha通过对每个单词编码，然后寻找句子中不同词语之间的相关性，基于云端数百万的语料库，从而实现基于句子的“全局预测”。这是神经网络技术首次应用在输入法上，SwiftKey的联合创始兼CTO Ben Medlock称，他们的一些想法是受到了英国著名科学家图灵的启发。(本文首发钛媒体，记者/张远)

（编辑：应用网_丽江站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2/2

首页