知乎在发展过程中应用了哪些增长黑客手段?
知乎对答案排序算法进行优化,目的是让好的答案更靠前。随着用户量不断增加,早期最简单的答案排序规则出现了问题:一些答案友情赞同比较多,让专业性不足的答案被推到靠前的位置。于是,团队想到了给赞同票加权重的方法,基于每个人在话题下的专业权重进行计算,排序得到优化,能让大部分优质答案可以排到前面。虽然针对权重计算的优化仍然在持续进行,但知乎技术团队还是遇到了一些算法上的瓶颈。如:当问题下有多个发布较早的回答获得高票时,新的回答即使质量很高,也很难在问题页上获得足够的曝光,难以积累更多赞同票;另外,一些误导性、煽动性的高票内容,即使同时也有很多反对票,却仍然排在认真、严谨但票数相对较少的优质回答前。这些问题在专业领域内对参与讨论的用户造成的伤害尤其明显。 于是,知乎又设计了新的排序算法。使用威尔逊得分算法,即使前一步错了,现在这个新回答排到了前面,获得了更多展示,在它得到更多投票后,算法便会自我修正,基于更多的投票数据更准确地计算得分,从而让排序最终能够真实地反映内容的质量。该新算法年初发布之后,得到知乎站内用户热烈的反馈,很多专业的讨论涌现出来,为知乎的下一步优化提供了很好的想法。 六、设计反垃圾系统封杀Spammer,删除垃圾内容 知乎有个反垃圾系统(名「悟空」),每一次用户提交请求都会经过「悟空」的分析处理,「悟空」会通过一系列包括发布频率侦测、文本分析、相似行为检测、用户可信度查验等几十条在线分析策略,作出判断,根据判断结果,系统会作出对应的处理动作,比如屏蔽请求,删除内容封禁帐号、限制行为等。「悟空」会基于正常用户的行为模式,检测异常离群点;不断输入Spammer的行为数据,以检测相似 Spammer行为。 七、内容的个性化推荐 知乎希望在首页给不同的用户、不同的时段挑选出最棒的内容,使用机器学习算法,知乎提供了不会重复的个性化内容排序。首页的内容会主要考虑这几方面: 内容本身的话题领域是用户感兴趣的; 知乎是一个社交网络,用户的社交行为会带来“粉丝”首页的变化; 时间因素,一些内容及时出现,可以让它的价值更大。 知乎的首页有一套专用的数据收集和处理机制,可以记录用户在首页的所有重要动作,例如,某条内容出现在用户浏览器窗口或手机屏幕的可见范围内,就会记录一次。 八、邀请合适的回答者来回答问题。 “谢邀”这个词的产品功能是为每一个问题找到合适的回答者。采取一种算法模型预测某个用户回答某问题的可能性和回答质量,有 90% 的邀请是通过这种推荐结果发出的,剩下 10% 是用户主动搜索产生的。 九、每周知乎个性化精选邮件(EDM),提高打开率。 针对每个用户做了个性化的计算,通过不断的算法优化,知乎已经做到30%的打开率和14%的点击率。 十、把问题聚类,形成更好的关联性阅读。 对问题的文本进行聚类,比如文本语义匹配,通过复杂的词袋模型(如传统的PLSA、LDA、新的Word2Vec等)对问题文本进行向量化,这样通过语义将相关问题聚类起来。知乎站内拥有庞大的用户浏览数据,如果将这些浏览数据通过简单地算法(如协同过滤)建立一个模型同样也能达到很好地效果。 作者:Sting,一个互联网增长大会:http://topgeek.org/growthcon2016.html,感兴趣的可以看看。 本文为作者授权鸟哥笔记发布,转载请注明来源和作者信息。 (编辑:应用网_丽江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |