精华内容
下载资源
问答
  • 2019-05-26 13:05:58

    注:仅供参考学习,欢迎交流

     

    更多相关内容
  • 大数据风控体系如何搭建,分为哪些架构及原理,文档中有详细解释
  • 大数据风控系统概述

    千次阅读 2020-01-19 10:14:06
    为什么要做风控系统 不做的话,会有以下风险: 各种小号、垃圾账号泛滥 撞库攻击、盗号、毁号、拖库等 拉新 10w 留存率不到 5% 百万营销费用,却增加不了用户粘性 投票票数差距非常悬殊 各种榜单被垃圾账号占领 ...

    为什么要做风控系统

    不做的话,会有以下风险:

    • 各种小号、垃圾账号泛滥
    • 撞库攻击、盗号、毁号、拖库等
    • 拉新 10w 留存率不到 5%
    • 百万营销费用,却增加不了用户粘性
    • 投票票数差距非常悬殊
    • 各种榜单被垃圾账号占领
    • 实物奖励被机器人领走
    • 红包被秒抢
    • 下单不付款占库存
    • 虚拟占座
    • 刷单炒信
    • ……

    风控场景

    • 营销活动反作弊

    防御现金红包奖励、优惠劵促销、电商秒杀等营销活动场景下薅羊毛、黄牛党倒卖等各种欺诈行为

    • 内容防盗爬

    防御行业竞争数据、高价值内容、隐私数据等被盗爬行为

    • 渠道流量反作弊

    防御 iOS、国内外 Android 等各类渠道推广流量作弊行为

    • 刷榜刷单防护

    防御直播热度排行、电商销量排行、热门内容推荐等场景下恶意刷榜刷单行为

    • 虚假用户裂变识别

    防御拉新、助力砍价、电商拼团等场景下虚假用户裂变行为

    • 支付风控

    防御盗卡交易、游戏代充等欺诈行为

    作弊手段

    打接口和虚拟机

    这两种手法比较相似,都是用电脑模拟手机等移动设备,以虚假设备信息和网站、APP 的服务器端通信。

    这种低成本手段是移动互联网水大鱼大时期的遗留物,铭刻着各平台未对黑产痛下杀手时的“美好记忆”,由于操作简便,不需额外资源,仍是目前主流的黑产手段之一。

    识别打接口的主要方式是:引入设备标识判断逻辑,没有任何设备标识信息或信息不正确,就会被判断为打接口“假客户端”。

    识别虚拟机的方法:其中一种方法是看 CPU、PC 上虚拟机使用的 CPU 指令集架构和移动设备会有明显差别,如果发现指令集属于 PC 而非移动设备,则识别成功。

    设备农场

    此后,黑产不得不启用更高成本的新手段——用真实手机作恶,设备农场形态应运而生。

    这是与黑产对决的一个长期堡垒,攻防双方的手段交替进化,主要经历下面几个阶段:

    简单刷机(通过修改单个设备信息,如 IMEI 号,用一台手机模拟出多个移动设备)、

    复杂刷机(通过修改多维度设备信息模拟移动设备)、

    Hook 改机(通过劫持系统函数、返还虚假信息模拟移动设备)和

    多开(通过劫持系统函数,同时在单台手机上打开几十个相同应用,如几十个微信,提高作恶效率),把黑产逼到了不得不启用“真机农场”的境地。

    而真机农场,就是“老老实实”地把一台手机当做一个设备来用,相比用一台真实设计模拟数个虚假设备,其成本已十分高昂。

    反欺诈工程师们也找到了应对真机农场的关键:即便不刷机、不 Hook,群控却依然是黑产无法绕过的核心,所以在对群控多维痕迹进行专门检测后,真机农场也无所遁形。

    2018 年的黑产新动向:云手机、硬件插件和积分墙

    云手机

    2018 年 9 月下旬,云手机横空出世。就像其名称所展示的,这是云计算在黑产界的最新应用。和“云手机”的对决,

    云手机和传统设备农场的最大区别是:它背后并不是一个真正的手机,而是一套搭载在云服务器上的虚拟手机。

    在云手机加持的新型农场里,场景更加“科幻”——挂在墙上的不再是成百上千的手机,而是一片片装载了安卓的板卡,这些板卡可被电脑群控,模拟正常智能手机的注册、点击、分享等一系列用户行为。

    硬件插件

    在云计算之外,黑产也开始用起了硬件插件。

    大牛是一款可插装在苹果手机上的硬件,它最牛的功能是,是插上之后,能让苹果手机在不“越狱”(开放用户操作权限)的情形下实现改机和篡改 GPS 的目的。

    搞清了这个原理后,只要识别出相关特征,大牛也就不牛了。

    积分墙

    目前这波黑产中最难搞定的 Boss 级手段——积分墙。积分墙其实就是“人刷”,由羊头和羊群协作完成。

    厉害的羊头能触及多达万级乃至十万级的职业、半职业羊毛党。一旦有大漏洞出现,羊头就会将消息层层放出,组织大家一起薅——在由各种信号、传输协议连接的“平静互联网”中,羊头引领这支大军,进行着“夺金不用刀”的无声“抢劫”。

    电商平台今年初的优惠券漏洞,就可以理解成一次惊动全网的“积分墙”。积分墙的攻防难点在于,背后是真人、真设备。很难识别,这也是我们近期对抗的重点,不过现在也快识别得差不多了。”

    识别的方法也自成体系,主要通过团伙特征和行为时序异常等维度来综合判断,再结合通过大数据例行运营挖掘出的积分墙应用,一起做到风险可控。

    风控系统解决方案

    全链路风控解决方案,包括三大部分:事前预防、事中检测处置、事后分析回馈

    • 事前预防:通过数据采集收集用户侧信息、通过业务规则来限定参与活动的门槛、通过身份核验来确认用户身份等手段,防止风险事件的发生。
    • 事中检测处置:通过实时在线的手段来检测风险,并做相应的风险处置,防止风险事件的发生。
    • 事后分析回馈:基于长周期的离线数据分析,计算用户侧、设备侧、IP 侧、业务侧的各种风险特征,并作用于事前风控和事中风控。

    风控主要功能

    从数据提供规范、支持规则和社群、黑产库、输出方式等方面提供完整的解决方案风控引擎主要的工作是识别风险,一般的风控引擎都需要如下几个功能:

    • 名单服务:建立黑、白、灰名单;
    • 画像服务:建立基于 IP、手机号、账户等层级的画像服务;
    • 指标计算:一般包括高频类统计、求和、计数、求平均值、求最大值、求最小值等等;
    • 风控模型:基于采集到的数据,建立风控模型,比如:设备模型、行为模型、业务模型等;基于机器学习、深度学习技术来构建业务模型、设备模型、行为模型,或文本类模型(异常地址检测、异常昵称检测)等;
    • 规则引擎:最终的风控数据进入规则引擎,由规则引擎判断是否存在风险。风控运营需基于业务建立各种风控规则,以识别风险。

    风控系统架构

    数据采集

    用户信息/ 设备指纹 / 操作行为 / 网络数据 / 提现数据 /第三方数据

    机器学习模型

    • 社交网络

    欺诈团伙识别,基于手机号、设备、IP,行为等建立时域关联网络,利用社群发现、风险传播等无监督算法精准防御黑产团伙欺诈行为

    • 离群点分析

    识别异常频率行为用户,如刷量用户

    • 复杂事件处理

    基于一些规则模型,检测异常行为。比如信用卡盗刷检测,识别用户短时间内切换不同地点登陆账户

    • 效果评估

    准确率 召回率

    异常团伙示例

    通过机器学习模型生成的团伙行为特征如下所示:

    社群成员有相同的手机型号和手机号前缀,且启动时间高度一致,还都在充电,该团伙疑似为设备农场作弊。

    规则引擎

    根据规则和阈值进行判断,返回用户风控等级,下面为几个规则引擎方案:

    • 借助成熟的规则引擎,比如 Drools,Drools 和 Java 环境结合的非常好,本身也非常完善,支持很多特性,不过使用比较繁琐,有较高门槛
    • 基于 Groovy 等动态语言自己完成
    • Spark SQL 规则转化成的 SQL 语句构建规则引擎对用户风控指标进行分级

    管理系统

    • 指标管理
    • 指标组合管理
    • 阈值管理
    • 名单管理
    • 提现审批

    参考

    https://zhuanlan.zhihu.com/p/84747637https://www.cnblogs.com/cx2016/p/11647110.htmlhttps://www.jianshu.com/p/a14f1d9a1d9dhttps://ixyzero.com/blog/archives/4270.html

    更多文章

    知识图谱在大数据中的应用

    基于Spark Graphx Neo4j实现用户社群发现

    基于大数据聚类社群的作弊用户发现方法

    基于 Apache Flink 和规则引擎的实时风控解决方案

    Flink 在同程艺龙实时计算平台的研发与应用实践

    MapReduce Shuffle 和 Spark Shuffle 原理概述

    携程是如何把大数据用于实时风控的

    展开全文
  • 导读:大数据风控业务的开展依赖智能风控平台,智能风控平台的技术基础是大数据技术,智能风控系统技术架构也是以大数据系统技术架构为基础演进而来的。智能风控系统技术架构主要分为访问层、展现层、系...

    导读:大数据风控业务的开展依赖智能风控平台,智能风控平台的技术基础是大数据技术,智能风控系统技术架构也是以大数据系统技术架构为基础演进而来的。

    智能风控系统技术架构主要分为访问层、展现层、系统层、大数据平台四部分,其中大数据平台又分为接入层、清洗层、计算层、数据层四部分。本文主要介绍大数据风控平台。

    智能风控系统技术架构图

    大数据平台是智能风控系统技术架构的持久层,但又超越了传统的持久层功能,是以持久层为基础进行了技术应用的丰富。持久层又叫数据访问层,是指把数据永久地保存在存储设备中,它直接与数据库交互。

    大数据平台的创建不仅服务于智能风控体系,还服务于业务的其他场景,例如业务的营销场景、运营场景等。考虑到智能风控系统技术架构的数据还会服务其他业务场景,因此在初期搭建规划的时候应该考虑数据层的通用性、易用性、非耦合性等;并且伴随互联网业务的快速增长以及大数据技术的广泛运用,传统持久层的设计也不再局限于数据库以及数据的交互,而是以持久层为基础升级革新为大数据平台,统筹管理、规划数据的应用。

    智能风控系统技术架构的大数据平台划分为接入层清洗层计算层数据层四部分,这里只着重介绍接入层、清洗层、数据层的技术应用。

    01

    接入层

    接入层负责智能风控平台的内部接入,包括大数据平台以及系统层的系统产品的数据接入,通常接入的数据有结构化数据和非结构化数据两类,常用的技术应用有MQ、HTTP、HTTPS、FTP等,具体的技术介绍如下。

    • MQ(Message Queue,消息队列)是基础数据结构中“先进先出”的数据结构,一般用来解决应用解耦、异步消息、流量削峰等问题,是一种能够实现高性能、高可用、可伸缩和最终一致性的架构。

    • HTTP(Hyper Text Marked Language,超文本标记语言)是一种标识性语言,包括一系列标签,通过这些标签可以将网络上的文档格式统一,使分散的网络资源连接为一个逻辑整体。

    • HTTPS(Hyper Text Transfer Protocol over Secure Socket Layer)是以安全为目标的HTTP通道,在HTTP的基础上加入SSL层通过传输加密和身份认证保证了传输过程的安全性,被广泛用于万维网上安全敏感的通信,例如交易支付等方面。

    • FTP(File Transfer Protocol,文件传输协议)是在网络上进行文件传输的一套标准协议,用于将文件传输到主机或与主机交换文件。FTP可以使用用户名和密码进行身份验证,匿名FTP允许用户从互联网访问文件、程序和其他数据,而无须用户ID或密码。

    02

    清洗层

    清洗层是数据清洗处理层,负责智能风控平台接入数据的清洗处理。清洗处理后的数据再被推送到计算层、系统层和数据层。通常大数据平台清洗层使用的技术应用有Kafka、ETL,具体的技术介绍如下。

    • Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统,可以处理消费者在网站中的所有动作流数据。但大部分研发人员都会把kafka当作一个分布式消息队列,利用它的高性能、持久化、多副本备份、横向扩展等能力。生产者向队列里写消息,消费者从队列里取消息进行业务逻辑运算。

    • ETL(Extract-Transform-Load)是用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据模型,将数据加载到数据仓库中。虽然ETL一词常用在数据仓库,但其对象并不限于数据仓库。

    03

    数据层

    数据层是数据的载体层,大数据技术的基础是数据,因此大数据平台的基础是数据层。大数据平台的数据层为智能风控平台提供系统产品使用的数据,而智能风控平台系统产品产生的数据会回传到大数据平台的数据层,两个平台的数据相互循环迭代,数据量不断增加。数据层实际就是数据库,数据库根据数据存储方式分为关系型数据库、非关系型数据库,同时随着知识图谱技术的发展和应用,图数据库也被用到智能风控平台中。

    大数据平台常用的数据库有MySQL、MongoDB、HBase、Giraph、SSD等,具体的技术介绍如下。

    • MySQL是一个关系型数据库管理系统,由瑞典MySQL AB公司开发,属于Oracle旗下产品。MySQL是最流行的关系型数据库管理系统之一,在Web应用方面,MySQL是最好的关系数据库管理系统应用软件之一。

    • MongoDB是一个基于分布式文件存储的数据库,由C++语言编写,旨在为Web应用提供可扩展的高性能数据存储解决方案。

    • HBase(Hadoop Database)是一个分布式的、面向列的开源数据库,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC设备上搭建起大规模结构化存储集群。

    • Giraph是一个迭代的图计算系统,是基于Hadoop建立的上层应用。

    • SSD(Solid State Disk或Solid State Drive,固态驱动器),俗称固态硬盘,用于数据库等文件的存储。

    智能风控系统技术架构中用户通过访问层触发访问请求命令,由展现层承载访问请求命令并且传输请求命令到系统层,再由系统层根据请求命令获取大数据平台的数据,然后将数据传输到计算层进行分析计算,计算结果返回到系统层进行功能逻辑处理,最后输出系统层的服务结果到展现层或者以接口的形式提供给外部系统。整个智能风控平台通过智能风控系统技术高效、稳定运转,数据在智能风控平台中循环流转、迭代。

    智能风控的核心技术是大数据风控技术,智能风控系统技术架构的设计应该以大数据平台为基础,充分融入大数据系统技术架构。

    本书摘编自《智能风控平台:架构、设计与实现》,经出版方授权发布。

    关于作者:郑江,资深的互联网金融风控从业人员,现就职于融360。资深产品经理,尤其擅长风控平台的产品设计和研发,曾参与和主导了AI风控平台、SaaS风控云平台、大数据风控平台等各种类型的风控平台的建设,积累了丰富的经验。

    推荐语:本书从智能风控平台的业务架构、功能架构、技术架构以及产品的设计与实现角度详细讲解了如何构建一个完整的、通用的智能风控平台,从而让风控变得更容易、更高效、更精准和更智能。


    扫码关注【华章计算机】视频号

    每天来听华章哥讲书

    更多精彩回顾

    书讯 | 9月书讯 | 秋天的第一本书,来了

    资讯 | 什么是Serverless?有哪些应用?终于有人讲明白了

    书单 | 10本书,帮你看清未来的科技趋势

    干货 | Linux30岁生日:Linux 成功的真正原因

    收藏 | 终于有人把Scrapy爬虫框架讲明白了

    上新 | 【新书速递】“帆船书”——数据库领域殿堂级作品,全新升级第7版!

    赠书 | 【第71期】破案了!库里为何会花18万美元买一个猴子头像?

    点击阅读全文优惠购买

    展开全文
  • 浅谈大数据风控的基本框架

    万次阅读 2017-05-26 13:38:57
    随着监管趋严和行业愈加规范化,大数据风控,尤其是基于弱数据的风控正成为线上信用贷业务最重要的核心竞争力。

    本文转载自 CreditX氪信,作者 唐正阳

     

    近日,中国人民银行成立金融科技(FinTech)委员会,旨在加强金融科技工作的研究规划和统筹协调。

     

    随着AI、云计算在金融业务层面的快速渗透,也倒逼监管跟进升级,以进一步加强监管的有效性。事实上,这次央行提出监管科技(RegTech),也是对金融科技的肯定,希望其在驱动金融创新,引领金融规范化发展中发挥积极作用。

     

    金融的核心在于风险,现下谈及互联网金融,很多人都对大数据风控并不陌生,也都在行业野蛮发展的过程中有自己的理解。但如果要定义什么是大数据风控,可能不少行业外围同学的看法难免有些偏颇和碎片化。下面笔者浅显地从大数据风控的基本内容和框架出发,主要为想要了解这个行业的同学简要做一个相对完整的介绍。

     

    大数据到底有哪些?

    首先我们需要厘清大数据的概念,当下各行各业都在探索大数据的价值,大数据的定义也很多。从技术的角度来理解,本质就是来自多个渠道和系统的结构化和非结构化数据,在金融领域,尤其是消费金融,我们界定大数据到底有哪些维度,其实芝麻信用分是一个非常典型例子,虽然不同公司有自己的分法,但数据主体大都可以归类为身份属性、信用属性、行为数据、消费属性、人脉关系这五大方面。

     

     

    身份属性,这是最基础的,包括真实的身份信息、学历、就业经历等。

     

    信用属性包含的方面比较多,比如过往的履约记录、固定资产、流动资产、收入等都会纳入进来用以衡量一个人还款能力和还款意愿。

     

    过去我们去银行办理贷款,以上这两个维度就是传统风控的数据来源,但由于大多数人没有这方面比较完整的记录,且流程冗长麻烦,因此只有少部分人才能享受金融服务。

     

    现在随着互联网的爆发式发展,以及普惠金融的崛起,越来越多的机构正将海量互联网数据和金融结合探索其在表征风险方面的价值。如上所述,长期缺乏金融产品的人群基数庞大,需求旺盛,因此从创业公司到BAT到金融机构,都在拓展更多领域的大数据以抢占消费金融爆发的窗口期。

     

    数据拓展的第一个领域是消费属性,这块主要是电商或交易数据,比如日常购物商品、消费金额、消费时段等都可以从不同角度来分析出一个人消费稳定度,消费档次,还款能力等风险特征。

     

    其次,人脉关系也是很重要的一个维度,俗话说“近朱者赤,近墨者黑”。很多时候你的微信朋友圈、经常打电话的朋友也反映了你在风险上的表征。生活中我们和同事沟通比较频繁,而如果一个人社交稳定度差,可能说明他经常换工作,显然风险也会相应增加。

     

    最后一个维度是行为数据,这块数据涉及面比较广泛,主要是用户在APP上的活动所体现出的行为特点,包括浏览不同类目的频次、时间、风险偏好等等。

     

    说到这,我们对大数据风控涉及的几类数据应该有了一个基本的认识,那在具体工作中,我们是不是应该先把这些数据都收集好才能做好工作呢?

     

    答案是否定的,因为数据都是有成本的,开展一个金融业务,从数据、模型、服务再到最后的收益,更为关键的是业务本身的形态,再进一步扩展至产品、场景,我们会发现不同的场景面对不同的客群,风控关注的风险点都会有一定的差异,再反过来寻找能够表征这些风险点的数据也会有所侧重。因此,如果要厘清大数据风控该用哪些数据,首先要对风控场景有所了解,其中最为核心的是理解不同场景下要抓住哪些金融风险。

     

    金融风险的理解

     

    风险的概念比较大,为了给大家提供一个最基本的视角来了解,下面以线上信用贷款举例来阐述,这也是互联网消费金融最主要的方向之一。在这个场景下,我们面临的风险主要是信用风险和欺诈风险两块。

     

    首先是欺诈风险,据数字,在中国,互联网金融50-70%的损失来自欺诈,这也可以说是风控业务中最困难的地方。造成这种现状的原因比较多,一方面是诸如现金贷类型的消费金融短期爆发式发展,大量创业公司涌入赛道以互联网获客运营的流量思路做金融,与此同时相应的风控经验和能力缺失,因此给专业的欺诈分子暴露了较大的风险敞口,通过简单研究业务规则漏洞,并通过互联网传播,可能带来较大的损失;另一方面也是欺诈产业链自身研究实力不断的完善有关,现在的欺诈已经从以往单一的个人欺诈演变为有组织、有规模的集团化欺诈,链条上盗号,数据泄露作为基础账号库,已衍生出一系列包括黑产交易、ID Mapping、定向攻击的完整产业链,其中的分工和技术也非常专业和精细化。

     

     

    如图:这种设备称为养卡设备,俗称“猫池”,实际上就是一个号码卡插槽,可以在不拆卡的情况下将整张卡插到猫池里,连接电脑后使用,还可以接收短信验证码。现在在各种平台注册时都需要填写短信验证码,“刷手”为了获取平台的福利会利用猫池养卡,规避平台的身份确认短信。

     

     

    再比如短信拦截马,这是一种可以拦截他人短信的木马,让被攻击者收不到短信,并将短信内容截取到攻击者手机上。这种木马最常见的是通过钓鱼、诱骗、欺诈等方式诱导用户安装,然后通过拦截转发用户短信内容,以此获取各种用户重要的个人隐私信息,如用户姓名、身份证号码、银行卡账户、支付密码及各种登录账号和密码等,造成这些信息的泄露,再利用此信息从而达到窃取用户资金的目的,严重威胁用户的财产安全。

     

    第二块简单谈一下信用风险,其定义是借款者违约的风险,换句话说,也就是借款人因各种原因未能及时、足额偿还债务或贷款而违约的可能性。一般,我们会从还款能力和还款意愿两个角度去分析信用风险,但在小额信用贷场景中,由于额度一般为2000左右,少就几百,多也就5000,一个正常有工作的人很少会不具备按期还款的能力。所以在这点上我们更多的是从还款意愿角度来看,即借款人对偿还贷款的态度,现实中有不少人会借钱不还,这就是常说的“老赖”,如果我们以违约概率的目标去识别他,还是能挑出不少有正常借款意图的人。

     

    大数据风控体系的初步构建

     

    现在我们有了对大数据和风险的基本认知,但如何真正从大数据提炼出风险表征,并进一步转化为实时的金融风险决策服务呢?事实上,这需要重构一整套风控数据架构体系,过去传统金融机构在身份属性和信用属性的数据上沉淀了丰富知识,但在互联网金融业务中,用户能够关联的更多是消费、社交和行为类数据,且越是小额分散的业务,数据的金融属性越弱。近两年小额现金贷也正是由于这部分数据的风控知识体系缺乏,因此陷入高利率覆盖高坏账、暴力催收等乱象。

     

    随着监管趋严和行业愈加规范化,大数据风控,尤其是基于弱数据的风控正成为线上信用贷业务最重要的核心竞争力,除了基本的身份验证、合规、黑灰名单、规则过滤以外,要防控欺诈风险和信用风险,还需做好以下三个维度的准备:

     

    第一是设备层面,现在成熟的APP都需要辟如更换登录设备时重新输入短信验证码,或者登录时得手动滑动验证码等,这些既是挡住黑产的第一道关,也是后续风控的重要数据基础。

     

    第二是知识体系层面,拆解开来看,核心有2点,一是知识工程,二是模型。目前最领先的消金机构都有一套相对成熟的针对特定数据domain的风险特征库和分客群、分目标的模型,比如反欺诈模型、申请评分模型、风险行为预测模型等,贷后还会有催收模型、客户流失预测模型等。在这过程中,引入AI处理弱数据,并在大量样本上不断迭代模型是关键。

     

    第三是系统层面,试想我们有了清晰的数据认知,结合到场景和风险理解我们也摸索了一套经验证的数据使用方式,但如何与我们的业务系统对接,成为实时的数据服务?这还需要一个完整的支持数据接入、加工处理、得出结果以及监控管理的在线引擎。随着线上个人贷款规模的爆发式增长,控制风险、解放人力已成为最紧迫的需求,数据智能自动化引擎是机构“跑起来”的强大推动力。

     

    风控与征信

    最后,简单谈一下大数据风控和征信的区别,不少同学会认为风控公司就是征信公司,这其中还是有较大区别的,尤其在大数据领域。

     

    据百科,征信是专业化的、独立的第三方机构为个人或企业建立信用档案,依法采集、客观记录其信用信息,并依法对外提供信用信息服务的一种活动,它为专业化的授信机构提供了信用信息共享的平台。

     

    应该看到,征信所对应的数据还局限在开头所说的身份属性和信用属性范围,也就是强金融数据,而大数据风控认为所有数据都是风险数据,更侧重于将弱数据金融化,再提炼出风险表征。因此,征信本质是大数据风控的子集,覆盖的人群和应用领域也更为狭窄。当下大数据风控和征信的确还处于混业经营的状态,但随着行业发展,可预见市场还会逐渐细分,届时前者将更注重在数据生态体系上的经验和沉淀,后者则侧重在独立性和公信力以及监管合规等方面。

    展开全文
  • 大数据风控项目实战 Drools规则引擎

    千次阅读 2022-02-19 13:12:43
    一、风控项目背景介绍 ...二、风控项目系统架构 实时风控: 规则前处理、统一规则引擎、规则后处理 非实时风控: 数据收集入库、流式计算引擎、批量计算引擎 统一存储服务:数据存储 BFF:非核心模块 ...
  • 01 风险在哪里 _____ ...根据银行业的风险理论,信用风险是指借款人因各种原因未能及时、足额偿还债权人或银行贷款而违约的可能性。...信用风险的风控重点在于,甄别客户违约的原因究竟是还款能力,还是还款...
  • 量化派是一家金融大数据公司,为金融机构提供数据服务和技术支持,也通过旗下产品“信用钱包”帮助个人用户展示经济财务等状况,撮合金融机构为用户提供最优质的贷款服务。金融的本质是风险和流动性,但是目前中国...
  • 互联网风控系统架构分析

    千次阅读 2021-01-10 01:03:39
    去年下半年换工作之后,目前方向是做系统架构及数据分析相关的工作。前段时间和以前拿CVE大佬们一起接锅看着COE,感慨万千,不过也有颇多收获,能感受到自己在安全项目上非线性成长。Anyway,积极拥抱变化,以后...
  • 01风险在哪里1.1信用风险根据银行业的风险理论,信用风险是指借款人因各种原因未能及时、足额偿还债权人或...信用风险的风控重点在于,甄别客户违约的原因究竟是还款能力,还是还款意愿问题。如果客户真的由于各方面...
  • 前言 capital one 作为全球消金、互金和银行信用卡中心学习的典范, ...下面将解析一下capital one 的商业模式和大数据风控模式,希望对你有所启发。 一、Capital One概况及成长史 1988年,美国的大部分信用卡...
  • 转自:... 01 风险在哪里 _____   ...根据银行业的风险理论,信用风险是指借款人因各种原因未能及时、足额偿还债权人或银行贷款而违约的可能性。...信用风险的风控重点在于,甄别客户违约的原因...
  • 大数据风控目前应该是前沿技术在金融领域的最成熟应用,相对于智能投顾、区块链等还在初期的金融科技应用,大数据风控目前已经在业界逐步普及,从BATJ这样的大企业,到交易规模比较大的网贷平台,再到做现金贷、消费...
  • “羊毛党”始于线下、兴于线上,他的兴起与互联网的发展紧密相关。近几年,为了吸引注册用户,O2O企业、电商平台和各种互金网站的... 但是随着大数据的普及应用,大数据风控的概念随之而生,它是指通过运用大数据构
  • 信用风险的风控重点在于,甄别客户违约的原因究竟是还款能力,还是还款意愿问题。如果客户真的由于各方面的原因,暂时不具备还款能力,这是概率问题。即使发生了,处置起来也不会有什么损失。而如果是还款意愿问题,...
  • 携程作为国内OTA领头羊,每天都遭受着严酷的欺诈风险,个人银行卡被盗刷、账号被盗用、...也从原来基于“简单规则+DB”,发展到目前能够支撑10X交易增长的智能化风控系统,基于规则引擎、实时模型计算、流式处理、M/
  • 互联网行业中,通常使用风控系统抵御这些恶意访问。在技术层面上来讲,风控领域已逐渐由传统的“rule-base”(基于规则判断)发展到今天的大数据为基础的实时+离线双层识别。Hadoop,Spark等大数据大集群分布式处理...
  • 但是金融科技一结合大数据,也不能当成是万能药,大数据目前还有它的局限性,只能作为金融风控的补充手段,下面就结合大数据产业和具体方案聊一下,大数据在金融风控中的应用。 互联网科技发展蓬勃兴起,人工智能...
  • 大数据时代--风控系统

    千次阅读 2019-12-04 18:02:13
    https://www.docin.com/p-2216156529.html 实时业务风控系统https://www.jianshu.com/p/efcf3ce832c4 电商实时交易风控系统... 在线支付之风控系统架构选型https://cloud.tencent.com/developer...
  • 胡亚海 首席技术官 CTO 北京航空航天大学 博士 深耕互联网领域近20年,先后任职于普天信息技术研究...在手机系统研发、云生态技术架构与业务规划等领域拥有丰富经验,擅长技术体系搭建、大数据平台、运维与云服...
  • 互联网金融时代下机器学习与大数据风控系统 随着互联网的发展,互联网金融已成为当前最热门的话题,包括支付、理财、众筹、消费等功能在内的各类互联网金融产品和平台如雨后春笋般涌现。互联网金融是传统金融行业与...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 6,656
精华内容 2,662
关键字:

大数据风控系统架构

友情链接: Multicore_programming.zip