当前位置:经济频道首页 > 经济要闻 > 正文

AI解放人工鉴黄师:可识别多省份方言 无语义呻吟等

2018-08-22 09:12:20    第一财经  参与评论()人

随着AI(人工智能)的发展,人工鉴黄师逐渐从鉴黄行业里被“解放”出来。

AI鉴黄师每天可审核数亿张图片,识别准确率高于99.5%。”阿里安全部高级算法专家威视向第一财经记者举例称,如果一天要审核4亿张图片,单纯由人工来审,一人一天审1万张,需要4万人,而AI鉴黄只需将其中20万张可疑的图片筛出来,由人工再审一道,只需要20人即可。

传统的人工鉴黄师通过一双肉眼鉴别色情图片和视频。听起来像是“福利”,但实际上并不轻松。如今,伴随着互联网上社交媒体、直播、短视频的发展,每天光上传的图片就超过10亿张,发文数量超过5亿条,不少色情、暴力等内容充斥其中。

2015年10月,阿里巴巴“绿网”上线,用人工智能识别网络上包括色情、暴力在内的违规信息,阿里AI鉴黄师应运而生。通过人工智能、深度学习和大数据样本等技术,阿里巴巴的AI鉴黄师训练识别千万张正常图片与色情图片,最终生成一个智能鉴黄模型。

第一财经记者了解到,阿里的鉴黄AI做的色情图片检测,从原理上来说,就是一个典型的图像分类问题。当前的解决方案是标注样本后,使用深度学习技术训练一个人工神经网络。具体步骤包括明确分类标准→收集样本→样本打标→模型训练,四个步骤。其中前三个步骤主要由人工完成。

“我们要做的就是拿图片去‘喂养’它,让它不断学习,变得越来越聪明。”威视表示,最初在获取样本时,阿里筛选了近2000个网站、6000多万张色情图片,经过去重,标注1300多万张高质量的色情图片。之所以严格把握样本打标的过程,是因为深度学习,对高质量的标注数据有很高的要求。数据标志质量越高,最后模型的精度就会越高。

关键词:

相关报道:

    404 提示信息
    404

    您访问的页面找不回来了!

    返回首页
      您感兴趣的信息加载中...

    相关新闻