订阅业界RSS CSDN首页> 业界

突破技术壁垒 人工智能为银行反欺诈提供新思路

发表于2017-05-16 15:47| 次阅读| 来源第四范式| 0 条评论| 作者微信订阅号

摘要:第四范式基于”机器学习“的反欺诈解决方案,是通过从交易报文、用户、卡片等信息、训练出一个高维度模型,从而找出一些很难被专家规则发现的特征,这恰恰是机器所擅长的。

欺诈风险是国内金融领域面临的最大挑战之一,大部分金融机构长期受欺诈影响。全球领先的风险管理咨询公司Kroll发布的《 2016/17年度全球反欺诈及风险报告》指出,欺诈造成的受欺诈损失占营业额0.5%至3%之间不等(已核实的部分),并且随着欺诈手段日趋多元化,这一占比在逐年上升。因此,反欺诈已被金融机构和监管部门视为重要议题。

高维度机器学习模型:反欺诈方案的“内核”

以往,银行在侦测信用卡线下欺诈交易方面通常会采用专家规则的方式,即行内人员通过对欺诈案例的欺诈主体、手段等进行分析和总结,形成专家规则。这种规则的有效性是毋庸置疑的,但是同时也存在一些不足:首先,专家规则是由人来制定的,但人的思维往往是采用“抓大放小”的方式,因而其难以覆盖长尾的交易欺诈场景;其次,欺诈手段日趋多元化,但人很难快速准确地掌握新型欺诈手段的特征与规则,以应对欺诈行为的持续变化。诸多因素导致专家规则目前在罕见的、新的欺诈案件上有所局限。而通过机器学习技术,可以大幅提升这些欺诈案件的侦测率。

第四范式基于”机器学习“的反欺诈解决方案,是通过从交易报文、用户、卡片等信息、训练出一个高维度模型,从而找出一些很难被专家规则发现的特征,这恰恰是机器所擅长的。

在数据预处理环节,第四范式的反欺诈解决方案采用了全量样本进行数据建模。在特征工程阶段,机器学习和专家规则一样,首先需要抽取交易报文、用户信息、卡人卡片档等基本信息,之后再结合其他已有数据,在符合业务逻辑的情况下,通过将交易报文中的原始字段进行超高维组合、衍生。最终,对比于总数在千条之内的专家规则,第四范式设计的大数据机器学习模型的反欺诈特征体系,在总量超过25亿维的特征集上进行探索,最终发现有效特征8000万维,如此高维的规则是很难被不法分子攻破的。

此外,机器学习对于出现概率低的“非典型特征”以及不断更新中的特征,都有着超强的识别、总结能力。交易欺诈从数据上看实际上是一些模式(pattern)的变化,如果是非典型的欺诈手段,较难被专家规则命中,但机器学习的模型可能捕捉到这些异常模式(pattern)。具体来说,某次交易会同时命中多条弱模式(pattern),从而识别出该笔为欺诈交易。除此之外,即使欺诈手段发生彻底的变化,机器学习可以从案例中不断自主更新学习,以适应新的欺诈手段。

第三代实时反欺诈架构:反欺诈方案的“载体”

拥有出色的模型之后,如何将它应用在反欺诈体系中成为了另一道难题。模型越出色,则意味着对系统架构的要求约苛刻。

首先,在延迟方面,每笔信用卡交易的时长基本上在一百毫秒以内,换句话来说,实现对欺诈交易的阻拦全过程要控制在毫秒级,因此留给模型判断的时间非常短暂。如果处理过慢计算结果就会被丢弃,间接影响反欺诈效果。其次是稳定性。稳定性是指两个方面,其一是系统的高可用性,反欺诈系统必须保证较高的服务可用率。其二是系统的响应稳定性,比如在所有交易请求中,99%的交易响应时间需要控制在一定的范围内(P99)。最后是如何支持机器学习对高位特征计算以及预估的需求。

此前,银行共出现了两代实时反欺诈架构。第一代的实时反欺诈架构虽实现了对当前交易进行欺诈识别需求,但是无法满足专家规则对交易历史数据需求,且流式计算引擎运行较为复杂,难以保证在限定的时间内完成所有规则的计算。

相比于第一代,第二代的实时反欺诈架构引入对历史交易数据的支持,也支持了较为简单的机器学习算法,但支持的特征维度小于1万,无法充分发挥机器学习的能力,且系统响应的稳定性仍需提升。

针对前两代反欺诈框架的弊端,第四范式的工程开发人员从架构层面做了更加深入的优化,提出了第三代反欺诈技术架构,其优势有以下三点:

1. 第四范式的实时反欺诈架构是一套真正面向机器学习场景的架构,目前已支持千万级别的高维特征。

2. 第四范式的实时反欺诈架构有效结合了对长、短历史交易日志和交易行为的学习和应用。例如选择当前交易近一个月内的交易行为记录做实时的聚合与特征抽取;选择当前交易近四个月或者更长时间的交易记录做线下预聚合与特征抽取,并对预估模块做定期更新及优化。

3. 第四范式的实时反欺诈架构在保证系统稳定性的同时,保证P99控制在限定的时间内,实现了系统的高性能和高可用。

此外,该反欺诈模型在保证行业通用性的同时,还能通过自身研发达到最佳的模型效果,且每个模块都具备通用性,均可以根据不同的业务实现单独的定向配置。未来,该模型还可应用于更多实时、性能要求高的业务,更好地发挥其优势。

机器学习为银行反欺诈带来新契机

第四范式的机器学习模型在不同覆盖率的情况下,准确率比照专家规则和传统模型都有了极大提升。在对高危欺诈交易的侦测上,机器学习的模型效果显著,甚至能将现有的对可疑交易的“事后反欺诈”(主要通过电话确认)转化为“事中反欺诈”(在交易进行过程中,直接终止交易,需要非常高的准确率),节省了银行的人力成本和运营投入。而在覆盖绝大多数交易欺诈交易的情况下,与专家规则结合的机器学习模型能够为银行带来数目可观的额外的防堵金额收益。

与业界领先、训练数据庞大的国际卡组织提供的反欺诈解决方案相比,第四范式的反欺诈模型仅依靠某银行的交易数据,便做到了更加出色的效果。

通过评估,机器学习技术与传统专家规则结合,反欺诈的效果将更为出色。未来在实际应用中,随着机器学习模型与专家规则的深入结合,行内人员将会逐渐减少更新传统专家规则的时间,将更多的精力放在优化机器学习模型上,使反欺诈系统达到最优效果。

由第四范式自主研发的反欺诈解决方案,通过人工智能技术为欺诈风险进行精准的预测和评估,协助金融机构及时发现、规避潜在欺诈风险,将引领金融领域反欺诈业务的智能化趋势。第四范式具备众多经验丰富的一线互联网公司前、后端开发人员,以及出色的科学家团队,将尖端的人工智能技术转换成可落地的人工智能产品及解决方案。此外,团队成员还包括来自投行、咨询公司、金融机构的行业专家和资深顾问,把对行业的深厚理解和对人工智能技术的娴熟运用相结合。


0
0
  • CSDN官方微信
  • 扫描二维码,向CSDN吐槽
  • 微信号:CSDNnews
程序员移动端订阅下载

微博关注

相关热门文章