QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

华为云与鉴黄师不得不说的那些事

  • 2019-01-02
  • 本文字数:3084 字

    阅读完需:约 10 分钟

华为云与鉴黄师不得不说的那些事

相传,在当今时代中有一个神秘的职业——鉴黄师。他们阅片无数,能听声辨位并精准审核并识别出各类违规内容加以处置。但鉴黄师工作量巨大而且人力有限难免有所纰漏,那么如何还互联网一个清静之地,真正实现精准、统一、全面的鉴别违规内容呢?华为云的内容审核服务就可以帮助鉴黄师摆脱当下面临的这一烦恼。



互联网每天都在产生大量数据,对内容的审核带来了很大的挑战,在万物互联的今天,人工审核不仅要付出巨大的劳动力而且难免有不当之处。因此,华为云推出了内容审核服务(Content Moderation),主要涵盖了文本内容检测、涉政敏感检测、视频内容审核、图片内容检测、图像反黄检测等。当前行业中,内容审核主要有人工审核和智能审核两种方式,人工审核需要大量劳动力全天候进行肉眼 + 机器辅助模式的内容审核,问题在于时效性差、风险高、而且规模过大时无法匹配;而智能审核则以 AI 技术为基础,人工判决为辅助。而在当下,能够提供智能审核技术的云平台并不少,这也就给各家企业技术选型造成了困扰。


那么如何选择适合企业而且性能卓越的云服务呢?为了让开发者全面客观的了解华为云内容审核服务性能,华为云联合 InfoQ 共同发起了一场开发者众测活动,18 名来自不同企业的开发者给出专业的建议,下面是详细的测试使用报告。

一、文本内容检测测试

在去年,国家互联网信息办公室《互联网群组信息服务管理规定》明确了互联网群组建立者、管理者应当履行群组管理责任,即“谁建群谁负责”“谁管理谁负责”,对于文本内容的云端检测更是成为重中之重。华为云在内容检测方面的服务主要有以下几种:涉黄、涉政、广告、辱骂、违禁品和灌水文本内容等,还提供自定义的文本敏感内容检测方案。


涉黄、涉政、广告、辱骂、违禁品文本测试


原理:调用华为云提供的 API,可自由设置过滤内容类型,分别为:politics(涉政)、porn(涉黄)、ad(广告)、abuse(辱骂)、contraband(违禁品)、flood(灌水),不输入默认为全部筛选。根据用户输入内容,过滤出文本内容中的“中标词句”,分别把语句放在涉及到的属性下面。返回结果如下:



自定义的文本敏感内容检测测试


原理:用户在后台文本内容检测服务上面自定义配置,并勾选不指定检测场景时启用,可对全部过滤生效。也就是自己建一个关键字库,生效规则与其他预设一致。



测试感受:


1、在涉黄、涉政、辱骂、广告等单个测试时准确无误,在多种组合的场景下,华为云也可以根据返回结果分别查看各个属性下的不同的犯规词语。


2、对于网络用语的灌水文本测试正常,检测出灌水文本反应迅速。值得一提的是,由于网络流行与变更速度很快,而华为云的网络灌水词库在进行实时更新,可以实现自我优化。


3、而在测试中,华为云最具特色的一项功能就是可以自定义词库,这项功能在内容检测标准容易变化的场景下能够更好的控制文本内容;包括政治敏感词、网络用语等词库还做到了实时更新,使得整体服务更加安全。


小结:华为云文本内容检测基本满足了常用文本检测,支持自定义词库来加以补充,再加上实时更新,使得整体开发体验更为安全和智能。

二、反黄检测服务测试

色情性感图片检测测试


原理:根据图片或者图片链接,华为云 API 返回三个维度对应的比例,分别是正常比例、色情比例、性感比例,返回值里的参数 suggestion 结果为 block,则判定为色情图片;性感图片的返回值里的参数 suggestion 结果为 pass,在三个维度的比例中性感比例最大,则认为该图片是性感图片。对于正常与色情比例接近的会返回 review,需要人工确认。


除了普通画面的图片外,华为云还支持画中画涉黄内容的检测,验证反黄检测服务可以识别小窗口涉黄图片。


测试感受:


针对黄色图片检测准确,性感图片准确,画中画涉黄检测也可以正常反馈,整体流程顺利,在特殊情况下也会提供给人工进行确认,没有发生误判情况。


小结:反黄检测针对各个企业都是一个重度需求,人工智能对图片内容检测很有必要,华为云在这方面做的不错,值得用户信赖。

三、暴恐识别服务测试

枪支刀具类测试

原理:根据图片或者图片链接,华为云 API 返回多个维度对应的比例,分别为:fire、bloody、gun、knife、flag、tiananmen、crowd、dress、symbol、normal,如果符合要求就会给出结果为 block,根据各个维度的比例大小来判断中标那个维度。这里以枪支作为例子,测试结果如下:


枪支:


人群聚集测试

验证暴恐识别服务还可以准确的识别人群聚集类图片,若是测试结果中的 suggestion 值若为 block, 且 crowd 的置信度值占比最大,则表示该图片含有人群聚集元素。


测试感受:


1、在测试中枪支图片测试正确。


2、人群聚会检测正确,使用体验流畅


3、现在聚会地点以天安门为例进行了检测,结果无误。也可以做成自定义地点,支持国内大部分标志性建筑。


小结:枪支刀具的检测可以称之为线上安检机,华为云整体表现非常卓越。但这部分服务对企业来讲,需求量并不够大,非刚需内容。

四、涉政敏感检测服务测试

原理:根据图片或者图片链接,华为云 API 返回的结果中给出识别出的名字,根据结果是否为 block,判断是否为违规图片。华为云服务,支持国家领导人、烈士与恐怖分子识别,测试结果如下:



测试感受:


1、各国国家领导人识别正确,能够正确给出姓名;多个领导人也可以识别,识别度很高;测试中中国地市以上级别领导人以及国外名人也能识别正确。


2、烈士识别方面对知名人物识别无误,而针对一些没有图片的烈士,很大一部分是后人绘画留存,可能导致识别率降低,可以通过更新学习库进行改进。


3、恐怖分子测试,一些臭名昭著的恐怖分子检测准确率很高;一些较为少见恐怖分子识别难度较高,但可以通过更新学习库增加识别准确率。


小结:华为云服务在这块中表现最好的是对国家领导人与国际高管的识别,在烈士与恐怖分子识别上处于同行业前列水准,而通过更新学习库也可以进一步增强。

五、视频内容审核服务测试

原理:需要用户上传视频,然后根据返回的任务 id 取查询视频的处理状态。状态有四种类型 created(已创建)、running(正在处理)、finish(已完成)、failed(处理失败)。测试结果可以查看 suggestion 的值,当同时检测多个场景时,suggestion 的值以最可能包含敏感信息的场景为准。即任意场景出现了 block 则总的 suggestion 为 block,所有场景都 pass 时 suggestion 为 pass,这两种情况之外则一定有场景需要 review,此时 suggestion 为 review。


测试感受:


内容视频测试准确,分析原因可能为视频资源帧相对较多,可分析图片也多 ,因而使得测试结果更准确, 测试结果可以给出具体哪一类型问题产生结果,并且可以在色情、涉政、暴恐等各个维度分别给出可能性比例。


小结:视频内容检测服务容纳的类型更多,反黄、暴恐、涉政都会有涉及,这个考验了云服务内容检测的综合功能。华为云在这一块表现不错,充分证明了自己的技术。

总结

在本次测试中,华为云在视频、图片、内容等各个方面的检测中,针对现有网络中资源较多的内容检测准确率很高,这可以显示出其在数据分析以及智能识别等领域的技术沉淀深厚;而在一些变数较高的内容识别检测时,也可以通过更新学习库以及更新检测内容标准实现准确率的提升。在实际应用中,直播行业对于内容审核依赖度非常高。华为云已经成功帮助某视频直播业务实现整体内容审核的智能化升级,审核效率提升了 90%,能够智能化检测“色情内容”、“涉政”和“暴力”等内容,并且问题视频可以在 3 分钟之内快速处理掉。


整体来看,华为云的广告语确实可以准确体现出其目前所处的行业地位:有技术,有未来,值得信赖!与开发者和行业伙伴携手前行, 前方的路依然很长。


更多华为 EI 内容审核信息,请见:https://www.huaweicloud.com/product/imagemoderation.html


2019-01-02 17:247422

评论 1 条评论

发布
用户头像
企鹅3362六295林3 高速外..网.梯.子 免.费测...试
2019-01-02 20:33
回复
没有更多了
发现更多内容

使用Tapdata一步搞定关系型数据库到MongoDB的战略迁移

tapdata

To B的软件产品死结怎么解?

刘华Kenneth

tob产品 客户服务

读懂Redis源码,我总结了这7点心得

Java redis 架构 面试 后端

MyBatis Plus 批量数据插入功能,yyds!

王磊

mybatis springboot

2021年金九银十必问的1000道Java面试题及答案整理

Java 架构 面试 程序人生 编程语言

云计算科普:Pets(宠物)和Cattle(牲口)傻傻分不清楚?

刘华Kenneth

云计算 架构 云技术

腾讯云TDSQL助力金融核心系统数字化转型

腾讯云数据库

数据库 tdsql

斯图飞腾Stratifyd亮相Smart Retail,AI赋能零售新增长

第4章-《Linux一学就会》- vim编辑器和恢复ext4下误删文件-Xmanager工具

学神来啦

vim Linux 运维 VI

拥抱云原生,华为云GaussDB全新助力金融行业数字化转型

华为云数据库小助手

GaussDB GaussDB(for openGauss) 华为云数据库

地铁3D可视化,让一切尽在掌握

ThingJS数字孪生引擎

可视化

硬件Scrum指南

AmyGuo

Scrum 敏捷开发 硬件架构 硬件开发‘ 硬件敏捷

写给“后浪”们的职业生涯规划建议

轻口味

android 生涯规划 音视频 9月日更

J2PaaS低代码开源版,10月1号即将上线,企业数字化转型优选!

J2PaaS低代码平台

低代码 零代码 开发工具

双碳目标带来的机遇与挑战

石云升

新能源革命 碳中和 碳达峰 9月日更

TDSQL数据同步和备份

腾讯云数据库

数据库 tdsql

考试试卷redis存储详细设计

小智

架构训练营

直击灵魂!美团大牛手撸并发原理笔记,由浅入深剖析JDK源码

Java 编程 架构 面试 程序人生

设计千万级学生管理系统的考试试卷存储方案

缘分呐

架构设计实战

消息队列:Kafka Consumer源码解读

正向成长

kafka

2021西部云安全峰会召开:“云安全优才计划”发布,腾讯云安全攻防矩阵亮相

腾讯安全云鼎实验室

云安全 峰会

腾讯云TDSQL-C云原生数据库技术

腾讯云数据库

数据库 tdsql

喜讯 | 拍乐云创始人赵加雨荣获「2021企业数智化转型升级先锋人物」奖

拍乐云Pano

音视频 数智化

阿里资深架构师整理分享全套Java核心技术面试题及答案

Java 编程 架构 面试 程序人生

2021中国规模化敏捷大会(早鸟票倒计时)

AmyGuo

DevOps 敏捷开发 Scrum精髓 硬件敏捷 规模化敏捷

力扣前400题解答笔记,全被字节大神整理到了这份文档里

Java 编程 架构 面试 程序人生

从浏览器地址栏输入url到显示页面的步骤

Augus

浏览器 9月日更

阿里大牛再写传奇:并发原理JDK源码手册GitHub下载量已破百万

Java 编程 架构 面试 程序人生

人工智能、机器学习和数据工程 InfoQ 趋势报告 - 2021 年 8 月

Regan Yue

人工智能 9月日更 数据工程 趋势报告

成为一名月薪2万的web安全工程师需要掌握哪些技能??

网络安全学海

黑客 网络安全 信息安全 渗透测试 WEB安全

陌陌和它的解药,聊聊出海社交产品的思路

拍乐云Pano

社交APP出海 社交APP 泛娱乐出海

华为云与鉴黄师不得不说的那些事_服务革新_贾凯强_InfoQ精选文章