(转)农业银行基于知识图谱和图挖掘的智能风控技术的研究和应用
总结:
- 目前知识图谱在银行的应用主要在智能风控、反欺诈方面,关于精准营销和问答存在应用意义,但意义不大。
- 企业知识图谱将是银行重点关注的点,小微企业信用风险评估离不开知识图谱。
- 知识图谱作为知识的终极整合方案,将越来越受到重视。
什么是知识图谱?
知识图谱本质上是一种大规模语义网络,是一种大数据时代知识的重要表现方式。当前,知识图谱作为一种技术体系,是大数据时代知识工程的代表性进展。
知识图谱的主要目标是用来描述真实世界中的各种实体和概念,以及他们之间的关系。利用知识图谱完备的实体和关联描述能力,以及其强大的知识推理能力,能够有效提升搜索和问答的准确性和有效性。
知识图谱可用于银行业哪些方面?
知识图谱最早被用于搜索引擎领域,在银行业,它能够用于金融搜索,金融问答、智能风控、反欺诈、智能营销、智能搜索可视化等等领域。
知识图谱在反欺诈方面的举例
小a想从银行贷一笔款,申请单上写的跟张三是同事关系,并留下了公司地址和电话。当我们试图把小a的信息添加到知识图谱里的时候,“一致性验证”引擎会触发。引擎首先会去读取张三的信息,发现留下的公司和地址跟小a填写的不一致。很显然,这种不一致性很可能有欺诈行为。
在信用风险管理方面的应用
利用知识图谱从数据到知识的抽取整合应用,能够有效解决当前信贷风险管理面临的一些问题。
一是能够处理海量的行内外数据,特别是客户以及客户关系相关的数据,形成知识图谱;
二是利用知识图谱从关系角度分析问题的优势,重点对关系紧密的客户群体(风险共同体)进行识别和管理,对可能发生的群体性、区域性风险进行监控,对风险传导进行预测;
三是利用知识图谱自动推理的特点,扩大客户经理管理半径,同时减少对专家经验过度依赖。
传统的信用风险管理面临哪些挑战
外部经营环境方面
经济增速回落以及经济结构深入调整带来资产质量下行压力。企业跨地域、集团化经营业态的发展,风险传导机制复杂,增加风险管理难度。银行信贷规模增长以及客户结构深刻变化,使得客户信用风险表现形式更加多元化,信用风险管理难度持续加大。
银行内部
在银行内部传统业务模式下的信贷风险控制体系由于几方面原因难以满足业务经营需求:一、客户洞察往往以单个客户为研究对象,较少关注客户关系网络;二、信贷风险领域缺乏统一的数据处理平台处理和管理客户关系网络涉及的大量行内网外客户对象和海量的行内外数据;三、风险管理专家管理模式难以覆盖以客户关系网络扩展的客户数量;四、信用风险管理理念还处于落后的静止状态,无法根据动态变化的客户关系网络检测出客户的风险变化,及时对贷款生命周期进行干预,进而造成风险累积爆发,影响到银行信贷资产质量。
外部监管方面
银监会于2014年下发《中国银监会办公厅关于加强企业担保圈贷款风险防范和化解工作的通知》,要求在开展担保圈识别认定和风险分类的基础上,摸清底数,因圈施策,存优汰劣,截流净化,从严管理新增担保圈贷款业务,积极化解存量担保圈贷款风险,坚决退出高风险担保圈客户,建立担保圈贷款风险防范和化解的长效机制,防范区域性、系统性金融风险。
基于上述背景,面向客户关系网络构建新型信息化风险监控模式是大势所趋。基于客户关系网络,可以构建更加丰富的客户信息平台,关注客户各类信息之间的关联性,实现客户洞察从点到面、从静态感知到动态识别的跨越,完善客户全景视图,从而发现潜在的风险因素并预判风险变化趋势。基于客户关系网络监测客户信用风险,将给现有的信用风险管理带来了革命性变化,也带来了前所未有的机遇。
立足现状,面向未来
基于“立足现状,面向未来”总体思路,聚焦信用风险管理发展的关键问题,完成了基于知识图谱和图挖掘构建全新的信用风险管理系统的建设工作。
该系统基于DIKW(Data, Information,Knowledge,Wisdom)体系,创新客户群体性风险洞察方法与管控模式,运用大数据及人工智能技术,从关系视图、客群划分、风险洞察三个层面提供技术支撑,完成信用风险管理从单体向客群、从人工判断到智能识别的两项转变,大幅提升客户群体性风险防范的意愿、能力、时效、成效,做到主动、科学防范系统性风险,做到早发现、早识别、早预警、早处置。
三大创新,领跑同业
为了有效应对新形势下内外部的风控需求,我们创新信用风险管理模式、满足客群风险管理、支持系统性金融风险监控和处置。打造基于知识图谱和图挖掘的信用风险管理系统,利用三方面创新,领跑同业。
建立数据视图,奠定信息基础
通过建立 信贷客户标识特征库,提升行内外可用数据整合程度,进而更加全面地识别客户间关联关系,构建客户关系全网视图,进一步打破银行对客户的信息不对称,完成从数据到信息的提炼,为从客户关系角度洞察客户风险传播规律奠定信息基础。该视图共计引入行内三大主题、行外六大主题数据,识别出11大类33小类关联关系,重点对隐形关系进行了识别,关系识别数量提升了33%。
构建知识图谱,奠定知识基础
基于客户关系视图,综合考虑客户本身属性和客户之间关联关系,通过客群划分算法找出风险传导强关联的客户群体,形成客户风险传播的知识图谱,完成从信息到知识的提炼,为从客户关系角度洞察客户风险传播规律奠定知识基础。
运用知识图谱和社区发现理论,通过单一关联关系风险传导系数计量、客户间风险传导系数拟合、客群关系子网划分三个步骤,完成信用风险传导知识图谱构建和风险客群自动划分。跟人工判断相比,自动识别出的客群规模更合适,可以处理大规模客群,考虑多种关系,多识别3600余个风险客群。
实现知识发现,奠定智慧基础
基于信用风险关系知识图谱打造客群风险洞察引擎CGEE,作为支撑信用风险管理模式创新的智慧基础。该引擎包含核心企业识别、风险传导测算、客群风险测评、客群关系探索四类应用。
核心客户识别
核心客户在客群风险传导中具有关键作用,是潜在信用风险的交织点,针对关系网的核心用户,提高预警的等级,能有效防范群体性风险。我们根据关联关系和风险传导特性,采用基于关系数量和传导系数的双因子聚合算法。重点解决人工识别看不清、看不全、效率低等问题。
风险传导测算
当客群中有客户发生风险事件时,及时发现最具可能的风险传导路径,指导客户经理分清主次先后、提前介入、有序防范,既能为风险处置赢得黄金时间,又能斩断风险蔓延路径。
我们基于客群子网及传导系数,构建客群风险传导概率矩阵,运用状态迁移算法,测算出子网中每个客户受其他客户影响的复合概率,由近极远、每层深度概率最大的客户形成风险传导路径。
客群风险测评
将客群内的所有客户当做一个整体,通过整合各个客户的财务、资金、历史行为等信息,复用单客户风险测评模型,为客群评定风险等级。为贷前提示、贷中管控、贷后预警提供参考,提高防范系统性和区域性风险的能力。
客群关系探索
用于客户关联关系探查,自主研发了高性能图谱计算与展示框架,支持用户对海量客户关系信息、大规模复杂关系网络的图形化、差异化、定制化、简便化探查。覆盖每月30万笔新增业务探查客户关系及关联风险需要。
该系统的建设与应用,为我行信用风险管理智能化探索迈出了坚实的第一步,搭乘金融科技的快车,紧跟业务发展需要,推动智能风控扎实推进。后续我们将进一步与隐性集团管理、信贷业务决策等业务场景结合,通过信用风险统一视图及智慧信贷等项目建设落地应用功能,助力信用风险管理进入智能化新阶段。
展望
更深度的应用
利用知识图谱帮助机器“理解”和“解释”数据的核心能力,能够提升机器语言认知、可解释人工智能、增强机器学习能力等方面的水平。当前知识图谱在金融领域的应用还处于起步阶段,结合银行的具体业务来看,它能够在智能风控、反欺诈、智能营销、智能搜索可视化等领域得到深度应用。
反欺诈
近年来,金融欺诈的形式复杂多变,提供虚假资料、团队诈骗、内外勾结等手法越来越隐蔽,在这种情况下,传统的通过单点突破进行反欺诈的方法已经远不能满足需求。反欺诈的核心是人,我们可以构建以借款人为核心的领域知识图谱,除了借款人的基本信息之外,还可以将其消费记录、行为记录、关系信息、日志信息等整合到知识图谱中。此外,除了申请阶段的反欺诈,通过构建已知欺诈要素的知识图谱,建立客户风险特征信息库,优化风险模型和规则,借助实时流计算和图数据库技术,还能做到交易阶段的反欺诈。
智能营销
营销的关键是分析和理解用户。知识图谱可以有效整合用户的特征行为,能更好、更深入地理解和解释用户的需求,挖掘客户的潜在需求,针对性地推送产品和服务。同时,基于社交网络知识图谱,根据各种社交行为(如交往方式、频次等)发现图谱的关系模型,对客户社交网中的相关主体(如亲属、同学、同事等)进行挖掘,评估关系紧密度,有利于进行潜在客户挖掘。
智能搜索可视化
基于知识图谱,我们也可以提供智能搜索和数据可视化服务。智能搜索主要可以利用知识图谱语义网络的特性,根据搜索关键词和应用场景需要,返回更丰富更全面等信息。例如,输入某人的身份证号,信贷管理领域返回的是该客户在我行的信用总账、风险提示等信息;客户营销领域返回的是该客户在我行的资产、关系、行为等信息。同时,这些结果信息可以使用图形网络的方式展示,从而提升用户对信息的理解,提升用户体验。