知识图谱在金融领域的分析与应用



前言

知识图谱因其自身的图展示、图挖掘、图模型计算优势,可帮助金融从业人员进行业务场景的分析与决策,有利于建立客户画像、进行精准营销获客,发现信用卡套现、资金挪用等行为,更好的表达、分析金融业务场景的交易全貌,从而成为行业的宠儿。


金融业务场景分析

从上世纪 50 年代的 IT 金融开始,到如今的人工智能金融,科技的进步帮助金融行业取得更长足的发展。人工智能的进步更是让金融服务场景变得更加丰满。

近年来知识图谱在电子商务、金融、公安、医疗等行业逐步开始落地,这些行业在基础设施、应用范围、市场规模来看,对于知识图谱的应用落地打下了坚实基础,渗透更深入。

本文重点来讲在金融领域的应用。金融行业的优势在于基础设施好、信息化较早且成熟,数据标准化程度高;业务由数据驱动,应用范围较广;市场规模大,金融机构在数据业务的付费意愿高,付费能力强。

下面将对智能在金融领域的4大业务线服务流程及细分环节、场景应用拆解,具体如下:

  • 信贷获客(用户画像、智能营销、智能客服、生命周期管理)、身份验证(反欺诈、活体识别、关联分析)、授信(风险定价、信用评分)、贷中监控(交易风险欺诈)、贷后管理(智能催收);
  • 理财获客(用户画像、智能营销)、KYC(智能投顾、智能客服)、匹配(智能匹配、智能投研、资产组合管理);
  • 保险产品设计(声明周期管理)、获客(用户画像、智能营销、智能获客)、定价/承保(风险定价)、核保核赔(反欺诈、图像识别)、赔付(智能理赔);
  • 支付交易前(交易反欺诈引擎)、交易中(交易反欺诈)、交易后(模型优化);

风控是金融领域的通用需求、核心需求更是金融的根基,无论是银行还是消费金融公司,风控的底层业务逻辑几乎完全相同,差异主要存在于面对客群与风险偏好。同时,风控也是金融业务的核心,无论是国家监管层还是经营利润驱动都对金融机构的风控能力提出很高的要求。

大数据及人工智能服务商以风控切入金融领域未来发展空间非常大,金融机构通常会谨慎选取服务商,建立长周期且深度的合作。有机会获取用户整个生命周期的数据,并以此切入到金融其他领域,为服务商的发展奠定了契机。

服务商想要服务金融领域的门槛也更高,也不是想进就能进的,门槛主要在于技术、数据、场景理解、客群和获客5各方面,金融业务依赖数据和建模,建模依赖于数据、算法的积累,同时也依赖于业务场景的理解;技术上的高投入对于客单价和客户数对服务商来说是非常大的考验,直接影响营销收入。

相关类型企业在金融领域发展的优劣势:

  • 互联网巨头在数据、技术、业务场景理解等方面均占优势,发展前景较好,未来市场空间大。
  • 创新型公司技术、业务场景理解强,在获取客户方面较弱,很难与银行及大型金融机构合作。
  • 产业类公司有数据优势,但随着百行征信的入场,数据优势被削弱。
  • I T类公司有较强的客户资源及获客能力,对业务场景的理解弱于其他类型服务商。

金融领域客户资源层级图:

服务商在进行金融领域切入时可先对具体要服务的客户层级进行确定,方便对产品进行定位:


业务场景分析

金融领域四大核心业务中可发展知识图谱的场景流程,也是知识图谱现阶段落地的热门应用项目:

  • 信贷领域的重点是获客、身份验证、以及授信环节。获客需要建立用户画像,追踪用户的完整生命周期;身份验证即通过活体识别、OCR等技术进行申请人的验证的问题,任务关联分析需要图关联技术,找出任务关系图谱;授信环节更要汇聚多方数据源,通过多维度历史数据进行建模并取得风险定价,输出信用分给金融机构。

  • 理财领域的重点是营销获客和智能投顾。营销与信贷类似,需要建立用户画像实现精准营销;智能投顾需要KYC和投借匹配,要重点分析用户风险等级及偏好,并进行KYC与KYP结合,进行智能匹配。

  • 保险领域的重点是营销获客与核保核赔。在核保核赔环节需要建立反欺诈预警模型,降低欺诈风险。

  • 支付领域的核心是交易反欺诈,需要通过各种技术建立交易反欺诈引擎,并根据交易数据进行反欺诈引擎模型优化。

在金融行业的个领域细分场景中,唯营销、获客和反欺诈、风控是通用且核心的环节,市场上以这两个场景切入金融业务的各类公司尤为多。


营销&获客

在互联网的全面发展的大时代背景下,金融业务基于线下营销的模式已几乎全面转战线上,茫茫互联网,如何找到客户是进行金融营销的首要问题。

营销获客,需要链接多个数据源搭建智能化客户经营体系尤为关键,建立尽量全面完整的用户画像,覆盖完整的用户生命周期,并做机器学习与关系挖掘的混合营销模型,才能做到真正的智能营销、获客。

营销获客整体的系统设计搭建,可大体分为 5 个方面:数据层面、模型方案、业务引擎、场景搭建、推广渠道。

营销客群可分为个人客户和企业客户,链接多方数据源,针对客户建立完整的画像体系,挖掘潜在需求,进行有针对性的精准营销推送,是智能营销获客的基本思想。

个人客户画像可从基本属性、购买能力、行为特征、兴趣爱好、心理特征、社交网络等方面,采用聚类、分类,以及协同过滤,分析待售客户、及潜在客户的需求与客群之前的关系,分析用户的相似性、共同爱好,细分人群活动地点、产品使用场景,从而制定并匹配以什么样的营销策略、推送策略、洽谈策略、服务策略,沉淀企业营销获客中的方法论,提升经验的可复用性。

企业客户画像可以从基本信息、法律诉讼、经营状况、经营风险、企业发展、知识产权、投融资信息等方向来整体建立对企业当前状况的分析,通过这些数据建立细分服务场景中的各类分析模型,得出该企业当下的可营销指数,同时生成针对化的分析报告并针对当前问题提出解决方案,以此建立的营销机制策略可提高营销获客转化率,避免人海战术,降低人力成本。


风控&反欺诈

金融业务中反欺诈、风控本质上是通过数据、技术甄别业务中的潜在风险。采用不同维度的数据,灵活组合产品与服务模块,建立关联数据之间的信息挖掘、推理,识别诈骗团伙,建立科学量化的分级策略模型,进行业务场景中的欺诈风险验证,洞察业务中的高危行为,解决金融行业风险痛点。

依托知识图谱中的图关联分析、图计算推理等技术,解决金融领域数据孤岛、数据不对等造成的风险不可控问题,提前对信息的一致性进行验证,识别欺诈团伙、关联监控、失踪复联、黑产识别等风险,对客户数据、交易数据全面整合,建立频繁汇入、汇出、以及环装、汇聚等模型,对用户、账户进行针对性管理,减少机构、企业的损失。

金融欺诈的形式、方式不断更新,相对于风控,概括来说就是“道高一尺,魔高一丈”,从而引发一系列金融黑产,这些黑产的特征上逐渐呈现呈现专业化、产业化、隐蔽化、场景化等特征。

风险是金融的固有属性。金融机构本身就是以经营风险为盈利的根本手段,所以金融机构要提高盈利,最重要的就是降低风险。金融行业的 5大风险包括:信用、市场、流动性、操作和法律,以信用和市场风险为主。

  • 信用风险是指债务人或交易对手未能履行合同所规定的义务或信用质量发生变化,影响金融产品价值,从而给债权人或金融产品持有人造成经济损失的风险。

  • 市场风险是指在证券市场中因股市价格、利率、汇率等的变动而导致价值未预料到的潜在损失的风险。

  • 流动性风险是指因市场成交量不足或缺乏意愿交易的对手,导致未能在理想的时点完成买卖的风险。

  • 操作风险是指由不完善或有问题的内部程序、员工、信息科技系统以及外部事件所造成损失的风险。

为降低信用风险与市场风险给金融机构带来的影响,实时引入市场新闻、舆情、社交信息、政策变化,以及其他机构的信用数据,挖掘各放信息建立不同纬度的信用风险,信用风险不单单是评估不光是狭义的个人信用问题,还包含设计广义上的社会不可控因素。

建立市场风险评估,更要深度结合股市价格、利率、汇率等数据,与相关数据房建立深度合作关系,把握实时市场走势,识别风险、预测风险影响范围,给出风险定价范围,清楚的给出细粒度的风险计算结果,让预测结果更有可信性和溯源性。

风控不单单是对外,也要包含对机构内部的风险控制,对内主要是对机构内部流程、跨部门合作漏洞、子机构对接风险、业务逻辑风险、产品策略风险、多条业务线重合风险等各种隐含风险,所以在系统设计时应尽量进行全量数据、全角色的覆盖整合。

金融知识图谱构建的早期还是以数据为主,随着不同纬度数据的补充,数据源市场集中度的提升,市场核心需求逐渐由数据过渡到建模,不久的未来金融KG市场的竞争核心,将是数据与分析平分天下。

以前风控业务是以数据输出为主,建模分析为辅,因此收费模式核心为数据调取量,随着数据壁垒的打破,数据分析能力(打分卡+数据科学家)输出将成为风控商业模式的核心。

需要注意的是搭建KG系统的核心不是数据和算法,而是对业务的理解和知识图谱的设计,就像常见的各类业务系统,数据库选型和数据表设计非常关键,但是这种系统的设计离不开对业务深入理解和对未来场景变化的预判。


结语

数据驱动是金融业务的共识。基于知识图谱的数据平台,解决数据挖掘关联分析,将是金融业务机构的发展方向,以营销获客、反欺诈风控切入的公司逐步发展为提供金融全流程服务的平台服务商,实现按业务服务流量收费的商业模式。

金融行业已经朝着大数据+云计算+区块链+人工智能技术互相融合的方向而去,大数据为机器学习、算法模型优化提供数据,云计算保证算力与存储,区块链避免信息泄露、被篡改的安全问题。人工智能是未来金融产业发展的核心驱动力,而知识图谱作为金融业务的核心驱动力之一,在信息数据隐含关系挖掘有着不可替代的能力,促进金融升级转型。

预告:下一篇将侧重金融领域营销获客及风控系统产品设计

注:文中部分数据、图表来源于ifenxi 、艾瑞。


Changelog

  • 创建于 2019-06-15

我手写我心,你赏表你心。