知乎在发展过程中应用了哪些增长黑客手段？

发布时间：2016-05-28 08:42:42 所属栏目：产品来源：鸟哥笔记

导读：在近几年的中文互联网上，知乎是一个无法忽视的存在。没有一个网站能像知乎这样，虽然只有3000多万用户，影响力却无处不在；知乎已经毫无疑问地成长为了国内最大的高品质知

知乎对答案排序算法进行优化，目的是让好的答案更靠前。随着用户量不断增加，早期最简单的答案排序规则出现了问题：一些答案友情赞同比较多，让专业性不足的答案被推到靠前的位置。于是，团队想到了给赞同票加权重的方法，基于每个人在话题下的专业权重进行计算，排序得到优化，能让大部分优质答案可以排到前面。虽然针对权重计算的优化仍然在持续进行，但知乎技术团队还是遇到了一些算法上的瓶颈。如：当问题下有多个发布较早的回答获得高票时，新的回答即使质量很高，也很难在问题页上获得足够的曝光，难以积累更多赞同票；另外，一些误导性、煽动性的高票内容，即使同时也有很多反对票，却仍然排在认真、严谨但票数相对较少的优质回答前。这些问题在专业领域内对参与讨论的用户造成的伤害尤其明显。

于是，知乎又设计了新的排序算法。使用威尔逊得分算法，即使前一步错了，现在这个新回答排到了前面，获得了更多展示，在它得到更多投票后，算法便会自我修正，基于更多的投票数据更准确地计算得分，从而让排序最终能够真实地反映内容的质量。该新算法年初发布之后，得到知乎站内用户热烈的反馈，很多专业的讨论涌现出来，为知乎的下一步优化提供了很好的想法。

六、设计反垃圾系统封杀Spammer，删除垃圾内容

知乎有个反垃圾系统（名「悟空」），每一次用户提交请求都会经过「悟空」的分析处理，「悟空」会通过一系列包括发布频率侦测、文本分析、相似行为检测、用户可信度查验等几十条在线分析策略，作出判断，根据判断结果，系统会作出对应的处理动作，比如屏蔽请求，删除内容封禁帐号、限制行为等。「悟空」会基于正常用户的行为模式，检测异常离群点；不断输入Spammer的行为数据，以检测相似 Spammer行为。

七、内容的个性化推荐

知乎希望在首页给不同的用户、不同的时段挑选出最棒的内容，使用机器学习算法，知乎提供了不会重复的个性化内容排序。首页的内容会主要考虑这几方面：

内容本身的话题领域是用户感兴趣的；

知乎是一个社交网络，用户的社交行为会带来“粉丝”首页的变化；

时间因素，一些内容及时出现，可以让它的价值更大。

知乎的首页有一套专用的数据收集和处理机制，可以记录用户在首页的所有重要动作，例如，某条内容出现在用户浏览器窗口或手机屏幕的可见范围内，就会记录一次。

八、邀请合适的回答者来回答问题。

“谢邀”这个词的产品功能是为每一个问题找到合适的回答者。采取一种算法模型预测某个用户回答某问题的可能性和回答质量，有 90% 的邀请是通过这种推荐结果发出的，剩下 10％是用户主动搜索产生的。

九、每周知乎个性化精选邮件（EDM），提高打开率。

针对每个用户做了个性化的计算，通过不断的算法优化，知乎已经做到30%的打开率和14%的点击率。

十、把问题聚类，形成更好的关联性阅读。

对问题的文本进行聚类，比如文本语义匹配，通过复杂的词袋模型（如传统的PLSA、LDA、新的Word2Vec等）对问题文本进行向量化，这样通过语义将相关问题聚类起来。知乎站内拥有庞大的用户浏览数据，如果将这些浏览数据通过简单地算法（如协同过滤）建立一个模型同样也能达到很好地效果。