当前位置:经济频道首页 > 国内经济新闻 > 正文

你担心的金融安全 无监督机器学习技术可以搞定(2)

2019-03-19 09:36:24    科技日报  参与评论()人

能将异常用户一网打尽

有监督学习需要大量有标签数据来训练模型,以此来预测还未被标注的数据。以垃圾邮件为例,假如把5000封已由人工确认过的垃圾邮件输入到模型,模型通过对标题的识别、邮件内容句子的分割、关键词的识别等各种分析方法,找到其中的内在关系。如标题中有“福利”二字的,有90%的可能性是垃圾邮件;一次性发送超过200封的,有60%的可能性是垃圾邮件;回复率低于10%的,有70%的可能性是垃圾邮件……于是,当模型处理一封新邮件时,通过检测以上各子项,并对每一子项乘以百分比后相加,就能得出垃圾邮件的可能性。但有监督学习的弊端是,每个模型都需要大量训练数据以及较长的训练时间。

“可能你的模型还没有训练好,欺诈分子已经完成欺诈活动并寻找下个目标了。”吴中说。

无监督机器学习主要方式有聚类和图形分析。金端峰说,无监督无需任何训练数据和标签,通过聚类等机器学习算法模型发现用户的共性行为,以及用户和用户的关系来检测欺诈。“通过无监督机器学习分析用户的共性行为,可以发现伪装过的异常用户,将其一网打尽。”

何为聚类方式?例如一群用户注册事件,可通过聚类发现几个小群符合某些共性:注册时间集中,都使用了某种操作系统,某一个浏览器版本等。该用户群中的任何一个单独拿出来分析,看上去都极为正常,如果符合某种超乎寻常的一致性就十分可疑了。比如一群人在凌晨2—3点采用同一款浏览器注册了同一产品,其IP的前20位相同,GPS定位小于1公里,注册后都修改了昵称和性别等。

现在的金融欺诈都是团伙作战,面对“化整为零,批量复制”的欺诈手法,金端峰说,无监督算法应用于反欺诈检测还有一个优势,那就是能提前预警。“现在的欺诈分子都有潜伏期,以免太容易被发现。由于他们在潜伏期的行为依然符合某种规律,具有某些一致性,同样还是会被无监督算法捕捉到。在攻击发生前就检测出欺诈分子,这一点传统方法是难以做到的,防患于未然这也是无监督机器学习之所以在反欺诈检测中大放光彩的重要原因之一。”

相关报道:

    404 提示信息
    404

    您访问的页面找不回来了!

    返回首页
      您感兴趣的信息加载中...

    相关新闻