图风控数智经济的“新技术革命”
年底的北京从来不缺讨论重磅线日,清华大学金融科技研究院金融安全研究中心主任周道许、国家金融与发展实验室副主任杨涛、北京邮电大学计算机学院教授及博士研究生导师石川、中山大学软件工程系副主任陈亮、光大科学技术创新总监王硕、北京国家金融科技认证中心实验中心负责人李博文、蚂蚁安全实验室首席科学家王维强、蚂蚁集团图计算事业部总经理洪春涛,聚在了北京东城区国家文化和金融合作示范区服务中心。
这里正在进行的是大金融思想沙龙的第220期研讨。这个系列的研讨由中国人民大学国际货币研究所(IMI)与金融科技50人论坛(CFT50)联合发起举办,研讨重点一直都是当下金融领域最前沿创新与变革。
随着行业数字化、线上化的不断加深,安全的重要性日益凸显。多个方面数据显示,全球每年被电诈骗约1万亿美元以上,智能风控正是这些专家长期关心的课题、长期攻克的难题。
与此同时,黑灰产业链的作案手法变得更隐蔽,组织和分工专业化、组织化、技术化,交易链条复杂化,聚集性风险一直上升。风险防控已经走入一个深水区。整个风控业界面临的风险,已经逐渐从显性的个体风险,转变为了隐性、有组织的规模化风险。
原来基于单主体及单主体之间简单关联的风险防控方案已难以应对复杂的黑灰产风险,行业内因风控能力失位造成公司和用户巨大损失的案例时有发生。
中国工商银行的智能化全球反洗钱系统、金融风险信息服务产品“融安e信”;中国建设银行提取关系网络结构特征定量评估小微客户的欺诈风险;中国银行建设基于知识图谱的企业关系网络,深入分析企业关联风险,助力信贷审核;交通银行借助图计算指标预测企业客户自身及其关联企业违约概率,将风险事件预警从单体识别变为群体识别……
这些全行业备受瞩目的大金融机构创新应用案例背后,都不约而同的指向了一种新的风控技术——图风控技术。
图风控技术的出现提供了一种解决实际问题的思路。图计算被认为是理解世界的新方式;有业内人士认为,图计算是下一个科技前沿。这正是这些专家此时聚会的重要话题。
在国家金融与发展实验室副主任杨涛看来,“数字金融归根结底谈的是数字化与新技术对于金融带来的深刻影响,其中,智能风控是数字金融的核心内容,图技术在金融风控领域的应用,深刻把握了如何认识大数据时代下不同信息之间的关联性、相关性,与当今行业和学术研究探索发生的变化相契合”。此次会议上,他也提出“图算法与技术用于风险管理的潜在价值不容忽视,希望政产学研一同探讨未来在金融领域应用的边界和前景。”
北京邮电大学计算机学院教授及博士研究生导师石川,创建了图数据挖掘与机器学习实验室(GAMMA Lab), 相关研究成果已应用于阿里巴巴、腾讯、华为、美团等公司,也持有类似的观点。他认为,新型数字风控的重要性日益提升,风控管理的关注重点逐渐从显性个体风险向隐性规模化风险转化。在此背景下,包括风控图神经网络和图上异常检测等方法在内的图风控算法为数字时代的风险控制提供了新思路和新技术。
清华大学金融科技研究院金融安全研究中心主任周道许指出,当前图算法、图数据库等图风控技术在智能风控领域应用广泛,图风控行业发展空间广阔。
事实上,蚂蚁集团将图风控技术作为重点研发投入的创新技术之一。从2015年开始,蚂蚁集团在图风控领域已经进行了接近8年的研发。
2018年的世界杯,各路足球豪强激战,球迷沉浸在体育的盛宴中。但在网上不为人知的“博彩”角落,有人跃跃欲试,希望以小博大;有人则在法律边缘试探,开始赌局赚得一笔快钱。
那时,已经投入3年多相关技术研发的蚂蚁集团,敏锐地发现,刚刚崭露头角的图风控技术已表现出了超预期的风控能力,不让世界杯添“赌”,切断了不少赌球的路径与交易。
网络赌球作为网络博彩的一个分支,呈现出当下网络黑灰产的重要特征,让全球风控专家、金融及网络站点平台头痛不已。
2004年欧洲杯开始,网络赌球加快速度进行发展,到2018年时,已形成了“完善”的产业链,如境内外合作,利用返点模式发展代理,团伙作案,单线联系,线上线下融合,虚拟货币结算……
这背后反应的是当下安全行业不得不面临的棘手难题:黑灰产所关联的因素较为隐蔽,不断地尝试变换手法以规避监管和绕过系统,为此可能借助“跑分平台”和“水房账号”作业,其表现出的风险信号往往不易被直接观察,从单一事件和孤立行为来分析,往往没有办法获得准确决策;同时,资金的转移以毫秒计算,对风控系统的感知、响应速度要求大幅提升。
图计算擅长于能够将巨大、复杂、相互关联的数据整理为相连、基于时序的关系图谱。恰恰成为解决这一些难题的重要技术支持。
蚂蚁集团的算法工程师们发现,在类似的国内线上赌博这样的场景里,要重点解决的一大问题是资金流动。
线上赌博产业,可能会通过“跑分平台”,把许多受骗普通用户的支付宝账号收集起来,黑灰产利用这些用户的个人收款码,为别人进行代收款,赚取佣金“过水”。钱在不停地在不同看似合法的账户间流转,经过几度的传播,这笔钱才真正到达幕后操控人,并将这些不合法的收入变为看起来正常的收入。
这个过程里,资金在每一个账户上流动,就能够理解为在图上有一个从A到B的跳转。以往传统的关系型数据库及常规的风控手段,孤立地看单独的行为,无法分析账号之间关联, 无法洞察全局发现聚集性风险,很可能将其识别为正常行为。
通俗来讲,当黑灰产团伙作案,需要多人多账户的协同,如需要大量的手机、电脑、网络等设备资源和账号等虚拟资源的配合,或者是借助“跑分平台”和“水房账号”完成。这就使得在数据层面,存在账号、设备等“点”。他们之间往往会产生关联,就有了“图”的概念。一般来说,黑灰产作案,往往会使得手机、电脑、网络、账号等出现重复“相似”的行为。
而这恰恰是图风控技术的强项——在空间维度上,能够关联除了人以外的更多主体,例如常用的WiFi等;在时间维度上,能反映出多种主体的时序行为特征。甚至有业内的人表示,只有图具有这样强的承载力和刻画能力。
“图风控的优势是能够从空间和时间维度表现更多的信息,从点到面的扩展风控范围,提高风控效率和效果。”
蚂蚁集团大安全图风控算法负责人王宝坤,在复旦大学读书期间就从事图风控相关的研究。他告诉36氪,如今图风控技术之所以能成为保障数字化的经济安全的底层能力,一个重要的原因是图所具有的全局观-上帝视角,通过图的关系能力, 可以关联出交易双方上下游的多度关系,以更加全面信息来判断看似正常的交易背后的风险。以金融平台的业务为例,一个自然人来到平台注册一个账户,此后他在平台上做的所有的事情,如转账、交易、理财等,都可以在图上表示出来;与此同时,图风控技术能稳定的表达要素之间的交互关系;当数据量足够大时,图风控的优势就会更加明显。
王宝坤回忆,过去几年,基本上在支付宝所有的业务方都会向他们提出一个问题——在这个业务场景里面怎么来识别团伙性的风险。当时,这种团伙性的风险造成的资损,慢慢的变成了风控中的重头戏。
统计多个方面数据显示,在反欺诈资损中,收益方成为欺诈团伙性质的资损占比超过一半;在作弊全量定易中, 其中闭环类团伙交易占比超过一半;在各类下游洗钱风险中, 具备有资金“快进快出”风险特征的占比超过一半。
将团伙打击掉,就往往意味着风险解决了一半。为此,团队开发了一个业界比较通用的图风控解决方案,适配各个场景。事后,有工程师统计,在洗钱的场景中,识别到了50%的风险;在垃圾账户识别中,识别出了超过30%的风险。
根据公开信息,国内包括工商银行、建设银行在内的许多大银行和支付机构已应用图技术进行支付风控,提高资金风险的识别和防范效率,缩短风控决策时间,将不良贷款风险控制在更低的水平。
光大科学技术创新总监王硕认为,在金融场景中,“图技术具有强对抗、易延时,属于毫秒级,对于金融机构的高并发场景最重要。”
业界消息则表示,包括淘宝、美团等在内的电子商务平台应用图风控技术,快速识别和防范虚假交易、账号盗刷等行为,提升交易的安全性和效率。
此外,在供应链领域,通过构建供应链关系图,可以识别潜在的供应链风险,预测库存短缺,进而制定风险应对策略,提高供应链的安全性和可靠性。
石川表示,“通过图深度学习在解决套现、洗钱、违禁品检测等实际问题中的应用,能够准确的看出在当前的金融活动中图数据交互关系的普遍性。未来,用户关联信息图,资金往来信息图和供应链关系图等有几率会成为图智能方法解决风控问题的关键抓手。图风控系统与产品在大规模数据处理和高效风控方面有领头羊。”
王宝坤则同36氪分享了蚂蚁集团风控的实践。基于图计算技术的全图风控,蚂蚁集团已将所有可能对风控有帮助的信息,包括交易、登陆、社交等,构建成一幅巨大的图(相关信息数据显示已达到了万亿级图规模),然后在这张图上进行各种策略、算法、模型的应用,实现实时阻断、精准识别、主动防御等功能,助力蚂蚁集团将风险水位控制在业内较低。
来自公开信息的消息显示,基于图风控技术,蚂蚁的在线毫秒以内,对黑产团伙的检测准确率达到 95% 以上;风险识别在原有的基础上提升了9.4倍,审理分析能力提升了90%。
过去几年,市场上的参与方还多是阿里、腾讯、百度、亚马逊、eBay等为代表的互联网大平台。比如,腾讯推出了高性能分布式图计算框架——Plato、图计算框架Angle ,百度小满推出了图计算平台Eros。这也在某些特定的程度上证明了图风控技术的研发难度。
根据此次大会发布的《图风控行业技术报告》,图风控技术包括了构图逻辑、图上异常检测、风控图神经网络、图风控交互技术、图风控可解释技术、图基础设施建设等关键技术环节。
以图基础设施为例,真实场景中图数据的规模往往较大,就需要低成本的解决大量的数据存储和计算问题。
图数据来源的数据格式各不相同,有半结构化的数据、非结构化的数据及相对结构化的数据,同时这一些数据的时效性也存在一定的差异,有离线版的源数据也有近线版的源数据。因此,就需要针对源数据的多样性, 建设一套标准化的图清洗流程,从最源头的数据源内容管理来保障接入数据源质量和标准化。同时,常常需要采用分布式计算框架,解决数据切分、调度和通信等问题,才能提高图处理的效率。
再如,黑客往往通过发现现有风控系统中的漏洞来绕过它,因此图对抗攻防就很重要。这就要求,防御策略的设计需要考虑到可能的攻击情况和数据分布漂移的问题,图模型的鲁棒性、泛化性设计就需要大量的经验支撑。
在某些场景中,算法人员通过投诉发现或无监督算法挖掘可疑样本,并与行业专家为其打上准确标记,然后反复与算法交互优化模型。这是一个非常费时的过程,标记成本昂贵且难以大量获取的问题。因此,风控建模过程中的高效人机交互就显得很重要。
为了解决各域业务对于场景化图应用的问题, 设计业务图组件来解决多样化点/边转化需求, 同时在这个模块中加入存储物化方案,保障图数据可以物化到在线/近线/离线的场景的解决物化遇见的大点/热点等场景问题。
而在当下,因为黑灰产的特性又对风控提出了强对抗、低延时的要求。诸如洗钱在内的违背法律规定的行为,往往发生在分钟级,这就对风控的实时性提出了更高的要求。
这些都意味着高昂的人力成本投入。以蚂蚁集团为例,虽然直接涉及到图计算相关的开发团队在几十人规模,但是间接相关的研发人员则达到数百人。
再叠加互联网大公司往往有直接的应用场景,一个漏洞就非常有可能引发大规模的业务损失,甚至是让用户损失大量钱财。如果说风控是大厂的必打之战,图风控就是大厂必要的军备竞赛。
技术进步让社会享受到了更快捷的线上服务、金融服务等。但与此同时,所有和钱相关的地方,或许都存在风险。以零售行业为例,一份数据报告数据显示,超过三分之一(34%)的全球零售商表示他们在2020年因欺诈而损失了5%至10%的电子商务收入。
在更大的层面上,风控也成为国家保护产业高质量发展成果、数字化的经济成果的必要手段。据国际货币基金组织统计,全球每年非法洗钱的数额约占世界国内生产总值的2%至5%,介于6000亿至1.8万亿美元之间,且每年以1000亿美元的数额不断增加。
风控行业,就是这样在与黑灰产的缠斗中,一直在升级强化,为用户、为经济保驾护航。图风控技术的萌芽与演进,亦是如此。
即使如此,我们也应看到,今天图风控的发展仍然面临着诸多挑战和机遇,仍然需要行业逐渐完备算法和模型,以应对一直在变化的风险环境。
比如《图风控行业技术报告》中也指出了提升时效性、系统化、与AI结合等技术演进方向。
具体来说,风控系统的时效性越高,被攻击的可能性就越低。实时化的风控系统能最大限度上阻拦风险。因此,为越来越好的应对新的攻击手段,图风控系统必然要往实时化方向发展。
再如系统化。风控系统是由多个子系统构成的,这些子系统构成了一个复杂的大系统。然而多个子系统的复杂度也必然带来高昂的维护成本,拖慢系统演进的速度。例如图的离线计算,流式计算和在线数据库之间的数据和接口不一致问题就会给系统的研发和运维带来非常大的挑战。随着风控系统的逐步发展,将不同的子系统融合,减少子系统数量,优化子系统协同以减少相关成本,提高研发效率就成为一种必然选择。
当下,大模型如火如荼,风控系统可能会面临一次重构。王宝坤告诉36氪,蚂蚁内部也在图和大模型相互增强的方向上已经有一些研究,未来或不但可以使用图技术来解决大模型的安全问题,也能够正常的使用大模型技术提升图风控的性能,给用户所带来更好的安全保障。
除了图风控研发技术本身的迭代升级,风控行业的专家也在从不同的角度推动图风控技术的落地与应用。
杨涛发现,“图技术在新领域应用时面临着一些挑战,例如数据基础约束、算法研究与工程落地问题、场景深入的难度、成本收益的考量、底层设施的局限性和来自监管与合规的约束等。”
他认为,从金融行业应用的角度,“从技术专家的视角来看,技术演进过程可能很清楚,但从业务应用的视角来看,这些阶段是动态演进还是逐渐演进则要进一步探讨”;“探讨新型技术在金融风控领域应用的时候,应当考虑风险识别、收益与成本三元要素的平衡”。
北京国家金融科技认证中心实验中心负责人李博文发现,“图风控发展还存在诸多挑战。第一,图技术应用人才匮乏,图技术应用发展还不平衡,中小企业仍在观望情况。第二,图风控面临数据安全、算法可解释性的挑战。第三,图风控产品成熟度和技术交付问题。目前很多产品成熟度不够、接口不完善、应用语言独特,不利于大规模推广;交付上还需要仔细考虑私有化部署、持续技术上的支持和运维保障等系列问题。第四,业务场景与技术的深度结合,需要协同好风控部门和科技部门的工作。”
可以预见,在技术、业务、法律、人才教育培训等多个层面进行协调和创新,帮助图风控技术更好的落地与应用,帮助用户、客户、社会减少更多的经济损失,也将成为行业下一步的重要动向。