网易易盾

网易易盾官方号

195篇博客

让音频实时检测不再那么难 网易易盾音频检测助力音频业健康有序发展

网易易盾2019-07-02 17:46

近日,国家网信办会同有关部门,对26款传播历史虚无主义、淫秽色情内容的违法违规音频平台,分别采取了约谈、下架、关停服务等阶梯处罚,并针对网络音频乱象启动专项整治行动。


之所以进行专项整治,网信办在官网里的文章指出:


一段时间以来,网络音频行业野蛮生长,行业乱象频出。部分网络音频平台的管理制度形同虚设,任由未成年人注册、访问各类良莠不齐的内容;一些网络音频平台为追求流量、吸引眼球,利用算法技术向用户推送违背社会公序良俗的音频内容;有的音频直播平台藏污纳垢,任由主播传播性暗示、“娇喘”等色情淫秽信息,甚至引诱用户跨平台从事违法违规交易;有的音频即时通讯应用以私密社交、一对一社交为卖点,公然传播招嫖卖淫等违法犯罪信息;有的网络音乐平台传播所谓“色系神曲”,宣扬“二次元文化”、“亚文化”;一些有声读物平台宣扬历史虚无主义,传播惊悚恐怖、神仙鬼怪、僵尸、冥婚等怪力乱神的网络小说,散布封建迷信思想。
公众号:网信中国
国家网信办集中开展网络音频专项整治

网信办表示,希望专项整治活动能够遏制行业乱象,督促企业落实主体责任,促进行业健康有序发展。


实际上,除了极个别平台“本末倒置”外,大部分平台都不断在营造风清气正的互联网环境,积极承担起社会责任。


可能非行业人士会疑惑:为什么还是有不少平台还是存在一些色情等良莠不齐的内容?这主要是音频的内容审核实在太难了,就算有的厂商自研出来了,效果也差强人意。


一方面是音频的检测需要一定的技术实力,要具备语音和声纹的识别能力,以及算法上要能够多维度抗干扰的能力,另一方面也要能够持续投入,因为攻防是持续不断的过程,需要不断投入大量人力、物力。就算做到了上述两点,其是否有足够量级的模型库用于训练,训练后效果能否达到预期…又是两码事。


那是不是只能任其不良内容损害广大青少年健康成长?其实网易易盾早就有行动,在今年5月份,网易易盾就对音频检测服务进行迭代升级,在点播音频过检的基础上,开始支持直播音频,实现实时音频检测。


据悉,易盾的实时音频检测,依托网易云计算资源,动态扩容,弹性伸缩,轻松满足客户单日亿级请求,特有的降噪处理和多维度检测,能够从源头保障音频平台的内容安全。

除了支持实时检测外,直播音频检测还能结合场景的关联分析:根据弹幕、主播等信息维度,通过文本NLP模型、规则引擎、智能特征库等技术实现提前风险预判,更准确地返回审核结果。

网易易盾声纹检测技术:娇喘的声纹和正常的声纹区别图


高准确性的背后是网易易盾在声纹检测的背景环境和数据多样性上下足了功夫。据网易易盾算法专家姚泽平介绍,音频实时检测上最大的难题是背景噪声的动态变化,导致违规音频和背景噪声的重叠更加复杂,让模型分类难度变大。“我们做了两方面工作,一方面是人工地构造一些特定场景的背景噪声,和违禁数据相混合,用这些数据训练模型,提高模型对动态背景环境的鲁棒性。另一方面是,通过对数据进行归一化的方法,减少客观因素对模型分类造成的影响。”姚泽平说到。


领先技术的应用,使得网易易盾音频检测能够高效识别色情语音、渉政、娇喘语音、ASMR、谩骂等违规语音;在应用场景上,也能完美覆盖IM通讯、点播音频和直播音频。


作为新媒体时代下的重要产物,网络音频行业在当下正火。iiMedia Research数据显示,2018年在线音频用户规模增速达22.1%,2018年用户数量达到4.25亿。用户的快速发展,也伴随着低俗、色情内容在这些音频平台上蔓延。音频平台不良信息治理的道路任重而道远,网易易盾愿全力支持音频平台的内容治理工作,为音频业健康有序发展出一份微薄之力。


点击咨询或者免费发布