海淀区政府   | 中关村管委会 移动版

当前位置:首页>园区动态>企业发展

百度利用AI新技术 守护互联网的安全

发文时间:2018-07-30        信息来源:示范区展示中心

【字体:

打印本页

  近日,百度内容安全中心发布了《2018年上半年信息安全综合治理报告》。报告显示,2018年上半年,百度一共处理了145.4亿条有害信息,这些有害信息包含了淫秽类、毒品类、赌博类、非发信息交易类等共11大类,相比去年报告中涵盖的10类有害信息,今年上半年的报告新增了“公民信息类”这一有害类别。

  三种技术综合运用 全面对抗各类违法有害信息

  此次发布的报告中,百度将其处理违法有害信息的“核心技术”归纳为三类,分别是:基于成熟的主动巡查、自主清理等通用手段处理线上海量违法有害信息的基础技术;借助千亿级数据优势建立针对文字、图片、视频等各类信息的管控策略,确保全亮信息拥有高强度的网络保护,这一技术被定义为“杀手锏”技术;最后就是颠覆性技术,也就是百度所擅长的人工智能技术,目前百度内容安全中心已经将语言识别处理、图像甄别能力、数据增量研究等多种AI安全技术应用在日常的工作中。

  报告显示,百度安全内容中心在2018年上半年通过主动巡查共清理了11类共145.2亿余条违法有害信息,期中淫秽类信息为重点打击对象,占比达到47.21%,其次依次是赌博类、非法信息交易类,分别占拦截总量的18.67%、8.97%。通过数据可以看出,通过主动巡查方式所处理的违法有害信息占据全部处理量的99%,这一方式的特点就是覆盖范围广、处理的违法有害数据的类别非常全面。

  在自主巡查之外,百度还通过自主清理的方式,不断挖掘新型的有害信息,对相关的违法有害信息进行更深层次更准确的打击。报告显示,2018年上半年,百度内容安全中心通过自主清理手段处理的有害信息量为2209万条。

  在上述两个手段之外,百度还通过全产品开放的渠道,接入来自个人、企业、政府职能部门等第三方的反馈,并针对这部分反馈信息进行甄别和处理。第三方的反馈成为了上述两个主动手段的有效补充,帮助百度可以更加全面地处理违法有害信息。报告显示,2018年上半年通过第三方反馈信息,百度内容安全中心共清理有害信息约971863条。

  处理有害信息、正向引到用户疏堵结合 构建健康网络环境

  2018年上半年,百度积极参与了“净网2018”以及“护苗2018”两个专项行动,通过多种的技术手段和处理措施做到从源头上消灭有害信息,保护网络的健康环境。此外,在5月1日《中华人民共和国英雄烈士保护法》正式实施以后,百度随即开展了“英雄烈士保护”专项行动,以搜索类、交互类、视频类、新闻类等产品为核心,整理历史全量英雄烈士,全面部署审核人员、机器资源、专业知识培训等多项工作。在管控手段方面,严厉打击歪曲、否定革命历史; 诬蔑、诋毁英烈人物;罔顾事实、混淆是非、恶意解构,将民族英雄、革命先烈污名化等各类有害信息。

  在处理有害信息之外,百度还利用自身的技术优势,推出了很多优质的产品功能,通过打击有害信息、积极提供健康信息的疏堵结合的方式,为用户构建更好的网络环境。例如,百度搜索利用先进的语音识别技术,推出了“百度搜索少儿语音绿色项目”。

  百度还和国际爱护动物基金会(IFAW)在6月22日联合发起“DU AI 万物”项目,分别通过知识科普、线上线下活动正向引导、正向内容输出、目标用户运营等多种方式,落地生物多样性保护的理念。截止目前,百度依托强大的用户平台,已清理野生动植物非法网络贸易信息20余万条。

  作为数亿用户重要的上网入口,百度一直以来都在努力通过技术、产品、策略的升级力图更好地处理有害信息,为用户提供更加健康、优质的网络环境。未来,百度还将不断打造、升级自身的内容安全矩阵,与网民一起守护互联网的安全,推动网络安全生态的建设。