网易跟帖养成记,这款反垃圾云服务功不可没

社区编辑2018-05-14 16:11

      从2003年至今,网易跟帖在不知不觉中已经度过了13个年头,经历了互联网信息的爆发,也经历了PC向移动互联网的转型。而在同类产品近乎销声匿迹的时候,网易跟帖已然成为一种互联网文化,甚至可以说最成功的评论类产品。

 

  移动互联网发展到今天,UGC早已是诸多流行APP中不可或缺的品类,这些产品和网易跟帖的一个共同特点就是,由用户原创内容。但用户可以制造优质内容,也会带来大量的负面和垃圾信息,这不仅让很多内容运营难堪其重,一些产品的衰落也与此不无关系。那么,网易跟帖在反垃圾方面的成就对其他UGC产品来说又有何借鉴之处呢?

 

19年经验,以及网易的三次技术迭代

 

  互联网反垃圾的历史似乎可以追溯到1978年的第一封垃圾邮件,而在今天全球每天都有数十亿的垃圾邮件在传播,再加上垃圾评论、诈骗短信、色情广告等等,几乎所有互联网产品都面临着反垃圾的压力,网易也不例外。

 

  自1997年推出邮箱类产品开始,网易就开始了自己的反垃圾之路,产品线也从邮箱、新闻扩展到了影音娱乐、游戏、社交、电商等领域。网易跟帖可以看作是网易发垃圾技术的直接呈现,其实在“盖楼”文化背后,网易的反垃圾技术也完成了三次技术迭代。

 

  第一阶段主要是依赖关键词、黑白名单和各种过滤器技术,来做一些内容的侦测和拦截。这是最基础的阶段,也是网易邮箱在垃圾邮件过滤方面的初次尝试,后来这一技术也被应用于网易新闻的评论区。不过受限于当时计算能力瓶颈以及算法理论的发展,第一阶段的技术只能说勉强满足使用。

 

  第二个阶段主要基于计算机行业一些算法的更新,比如说贝叶斯过滤,一些肤色的识别,纹理的识别等等。网易在实际应用中对这些算法进行了更好的特征匹配和技术改造,达到更优的反垃圾效果,这也是网易跟帖能够持续13年之久并且越来越好的关键。

 

  第三个阶段加入了当下流行的大数据和人工智能等技术。网易在反垃圾技术上利用海量大数据做用户的行为分析,进行用户画像,评估用户是一个垃圾用户还是一个正常用户。此外,网易还能基于人工智能的图像识别技术等,更准确识别是否是垃圾词汇、色情图片、广告图片以及一些违禁品图片等等。

 

  个体的智慧是有限的,但个体乘以一百万之后就会产生神奇的化学反应。网易反垃圾技术就像是一个神奇的滤网,将网易新闻评论区的内容汰劣留良,使得跟帖这一体现网民智慧的生产力一直延续下去。

 

网易易盾上线,跟帖神话或许可以复制

 

  反垃圾技术进入到人工智能阶段时,网易的反垃圾团队发现国内第三方反垃圾市场近乎空白,尽管国外已经出现了mollom、WebPurify、Sightengine等产品。而此时网易内部95%的互联网产品已经迁入了云,正基于此,网易在2016年年初正式推出了易盾反垃圾云服务,将网易服务多年的成熟解决方案以云服务的形式推向市场,帮助更多产品。

 

  纵观市场上的各类UGC产品,在内容过滤方面的做法普遍有三类,一是人工干涉,诸如人工删除、屏蔽、禁言等等;二是进行用户分级,比如根据用户的注册时长和在线时间分为核心用户、普通用户、游客等等;三是优质内容的人工筛选,即人工置顶推荐一些优质内容。不难发现,这一机制和网易跟帖有着本质的差别,前者要投入庞大的人力资源和巨额的资金,而网易跟帖是网民的自发行为,网易很少进行人工干涉。此外,用户分级的做法在一定程度上有利于内容的净化,却也极大地损害了用户体验,网易跟帖则恰如其分的给了每个用户发言的权利。

 

  不难发现,传统的反垃圾技术业已成为UGC类产品的一大瓶颈,网易跟帖则从另一方面说明了反垃圾云服务的必要性。同时,作为专业的第三方反垃圾产品,网易易盾在网易新闻、网易云音乐、网易云课堂、网易邮箱身上表现出的可靠性和高效性,一方面是基于网易拥有19年的反垃圾特征数据沉淀,而这些正是能否快速有效过滤各种有害信息的关键;另一方面网易云在云计算大军中渐露头角,海量的云计算资源和弹性伸缩的特点,能够满足客户单日亿级请求。诚然,在打造了网易新闻、网易云音乐等标签式产品后,网易开始凭借网易易盾反垃圾来深耕这个市场。

 

  网易跟帖之所以成功,或许有人认为是基于网易的产品情怀和工匠精神,也或许有人说是网民的智慧结晶,但不可否认的是,反垃圾技术却是决定网易跟帖能否良性循环的重要因素之一。可以预见,UGC创业大潮在未来会越来越汹涌,而网易易盾反垃圾云服务等成熟的反垃圾解决方案,也将加速UGC产品的落地,网易跟帖的神话并非不可复制。