消费信贷中的智能风控｜浅谈用户画像、反欺诈模型的应用逻辑

分享至

面对严峻的网络风险环境，从2014年开始，大数据、人工智能等技术开始真正进入互联网金融风控领域，科技与金融的结合日益紧密。越来越多的金融科技公司利用自己的技术优势，帮助传统金融机构改善业务，辅助金融机构进行风控运营决策。近年来，智能技术先后在营销、风控、审计、投顾、投研等领域得到运用。

与传统金融机构采用评分卡模型和规则引擎等“强特征”进行风险评分相比，智能风控根据履约记录、社交行为、行为偏好、身份信息和设备安全等“弱特征”进行用户风险评估。两种风控方式从操作到场景都呈现出了明显的区别化效应，进入移动互联网时代后，智能风控的优势愈加凸显，成为传统风控的有效补充。

接下来两期，小象将围绕智能风控在消费信贷领域的应用情况进行探讨。本期我们将重点围绕身份识别、用户画像、反欺诈方面进行阐述。

身份识别

做好个体定位

一般来说，信贷机构与借款用户的接触中，第一步就是对用户的个体定位，也就是身份识别。

身份识别是判断借款人身份的首要步骤，一般以用户证照信息为基础，其中所使用到的技术主要有生物识别以及OCR技术。

生物识别，是将计算机与光学、声学、生物传感器和生物统计学原理等高科技手段相结合，利用身体特征来鉴别个人身份的技术。其中较为成熟的是指纹及人脸识别技术。消费信贷领域中，指纹认证通常被用于手机APP登录验证等，人脸识别技术则更为普及，近年来广泛代替了传统手持身份证拍照的验证方式。例如：目前刷脸认证已在借款用户申请阶段广为运用。

OCR技术，全称光学字符识别技术，其原理是利用扫描等光学录入方式将各类证件、资料、印刷品上的文字转化为图像信息，再通过文字识别技术将其转化成计算机输入技术。在消费信贷中，身份证识别和银行卡绑定是OCR技术的两项最广泛运用。一方面，通过OCR提取身份证头像能够快速获取身份识别的目标，达到人证合一；另一方面，OCR能够快速识别银行卡号、持卡人、发卡行等关键栏位，并自动填入识别到的信息内容，不仅在信贷平台，在电商平台的交易支付中也得到大量使用。

目前，身份证识别和银行卡绑定是OCR技术在消费信贷中运用最广的两项。一方面，通过OCR提取身份证头像，能够取得快速获取身份识别的目标，达到人证合一；另一方面，OCR能够快速识别银行卡号、持卡人、发卡行等关键栏位并自动填入识别到的信息内容，不仅在信贷平台，在电商平台的交易支付中亦得到大量使用。

构建用户画像

结合多方面数据进一步确认

对个人用户进行定位之后，其次就是用户画像。所谓“用户画像”，就是进一步通过用户授权，查询其央行征信、第三方征信、网络交易行为等多重维度。

用户画像最初是希望产品设计工作者在定性目标用户时，不再像之前那样想当然地猜测假想用户的需求，取而代之的是使用用户画像来侧写目标用户，从而将设计聚焦在真正用户的动机和行为上。

用户画像最早被互联网应用于电商中，在定性目标用户时，企业数据分析人员会将用户数据进行分析，并形成合适的用户画像，有姓名、性别、年龄、收货地址、手机号、银行卡、身份证号、邮箱等基础属性，以及浏览分类、点击偏好、购买习惯、登录设备类型等特殊属性。然后，通过分析此类信息，以方便后续分析了解目标用户的需求，如男性/女性用户更倾向于哪类商品、90后客户更偏爱购买哪类商品、不同地域热销商品的排行等。

可以看到，用户画像可以将用户人群进行分类，最终目的是为用户打上各类标签，如为用户打上诸如健身用户、化妆品受众等标签，之后市场人员可以对各类标签用户提供精准营销。

综合来看，在风控领域中构建用户画像的根本目的就是：

1. 系统的梳理用户群体，尽可能的找到异同点并将用户分类，分类是多维度的，可以是购买偏好，也可以是薅羊毛党，应该从各个角度去侧写用户；
2. 便于更深刻的理解业务，理解用户需求，风控离不开具体业务，只有深刻理解业务后，才可以拆解出可能的潜在风险；
3. 了解恶意用户的行为特征，可以根据用户特征做关联规则分析；
4. 便于对不同类型的用户，采用针对性的风控规则。单纯去侧写用户画像是没有意义的，当构建了用户画像后，需要结合实际的风控规则，来管控用户请求事件。

建立反欺诈模型

拒绝“黑产”

随着互联网的高速发展，黑产层出不穷，消费信贷领域的反欺诈模型建立刻不容缓。

反欺诈是风控中非常重要的一道环节。基于大数据的反欺诈的难点在于如何把不同来源的信息整合在一起，并构建反欺诈引擎，从而有效地识别出欺诈案件（比如身份造假、团体欺诈、代办包装等）。

根据工作原理，反欺诈模型可分为“基于规则的反欺诈模型” (Rule Based system)和“基于客户行为(Behavior Based system)的反欺诈模型”。

从核心架构来看，基于规则的反欺诈模型主要是建立规则库，其规则内容包括客户基本属性、账户基本属性等。而基于用户行为的反欺诈模型则需要根据过往用户信息的收集建立起用户行为库，因此其劣势也显而易见：对用户信息的规模、积累时间均有一定要求。

实务中，一些企业将两类模型充分结合，通过设定规则库对可疑用户进行识别，再通过收集到的用户行为不断对规则库进行更新，同时融入专家经验对模型修正。

不过，值得关注的是，不少欺诈案件会涉及到复杂的关系网络，这也给欺诈审核带来了新的挑战。在此背景下，中诚信征信利用“知识图谱”作为关系的直接表达方式，很好地解决了这个问题。

比如，可以做到不一致性验证。

不一致性验证可以用来判断一个借款人的欺诈风险，这个跟交叉验证类似。比如借款人张三和借款人李四填写的是同一个公司电话，但张三填写的公司和李四填写的公司完全不一样，这就成了一个风险点，需要审核人员格外的注意。

假如借款人说跟张三是朋友关系，跟李四是父子关系。当试图把借款人的信息添加到知识图谱里的时候，“一致性验证”引擎会触发。引擎首先会去读取张三和李四的关系，从而去验证这个“三角关系”是否正确。很显然，朋友的朋友不是父子关系，所以存在着明显的不一致性。

不一致性验证涉及到知识的推理。通俗地讲，知识的推理可以理解成“链接预测”，也就是从已有的关系图谱里推导出新的关系或链接。比如在上面的例子，假设张三和李四是朋友关系，而且张三和借款人也是朋友关系，那便可以推理出借款人和李四也是朋友关系。

再比如组团欺诈。

相比虚假身份的识别，组团欺诈的挖掘难度更大。这种组织在非常复杂的关系网络里隐藏着，不容易被发现。只有把其中隐含的关系网络梳理清楚，才有可能去分析并发现其中潜在的风险。知识图谱，作为天然的关系网络的分析工具，可以帮助公司更容易地去识别这种潜在的风险。

好了，本期我们暂且讲到这里，下期再见哦！

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.