人工智能助力小微企业金融服务:从可信画像到“听说读写”
文|夏木
小微企业是我国经济和社会发展的生力军,然而,由于规模小、管理弱、风险高,在注重财务报表、抵押物和担保人的传统信贷模式下,其融资难的问题难以纾解。特别是一些轻资产运营的公司,时不时出现暂时性资金周转困难。
小微企业融资难,难在信息不对称、信用不对称。有时候,由于缺乏融资人的信息,金融机构难以绘制信用画像;而更多时候,面对冗杂过剩的信息,金融机构则是看不完也看不懂——信贷审核员们坐在堆积如山的文件中,既无法分辨真假,又难以获知全貌。
此时,有人联想到近来热度颇高的人工智能,包括其在内的金融科技能帮上忙吗?答案是肯定的。
公共数据打通信用孤岛
根据中国银行业协会发布的《2021年中国银行业服务报告》,截至2021年年末,金融机构用于小微企业的贷款余额为50万亿元,占社会融资存量总规模的15.9%。
为解决小微企业融资难题,有些银行推出了“银税贷”等产品,但都是基于特定领域信息来对企业进行信用评估,难以全面掌握企业的信用状况。对此,公共信用信息数据是一个突破口。它能打破信息融合应用的壁垒,构建多元数据底座,进而创新数据共享模式,让信用赋能金融和实体经济。
“公共数据贷”是金融机构基于企业经营、水电气费、五险一金、纳税、行政处罚等海量数据推出的产品,运用“数据安全屋”“同态加密”等先进技术,在数据不出库的前提下,让企业公共信用信息和金融信息得以充分碰撞,建立评价模型对企业精准画像,并探索出信息“可用不可见”的安全应用方案,建立全流程管控模式。
该类信贷服务借力于发改委的信用信息平台,利用“白名单”推送功能,将各区县、各部门推荐的优质“白名单”企业一键推送至各金融机构,供金融机构重点关注、主动对接。
此外,“公共数据贷”还能利用工商股权信息、年检及地址有效性等数据,绘制“企业生命树”,为企业族群提供能够揭示其“生长健康状态”的图谱——用树叶颜色变化展现企业经营状况和风险程度,向金融机构和有关部门推送。同时,获贷企业经营异常、列入失信等情况也会被及时推送到有关部门,提示其加强贷后跟踪管理,确保金融安全。
这类借力于公共数据的信贷服务具备主动授信、一键知信、线上操作、用券降息等特点,深受小微企业的欢迎。从大数据和大模型相结合的角度看,此类服务具备以下三个创新点。
第一,依托联合建模测算直接为企业进行主动预授信,打破企业跑银行找融资的惯例。金融机构急需的纳税、企业不动产、知识产权等信息均已纳入《全国公共信用信息基础目录(2021年版)》,通过“你有需求我来征”的方式,帮助金融机构提高“你有信用我来贷”的普惠金融服务比重,最终让企业受益。
第二,打造“数据多跑路、企业少跑腿”的申贷模式。过去企业申请贷款都是填完一张张报表后等待层层审批,现在针对小微企业融资“短、小、频、急”的特点,在各端均实现了线上操作,满足小微企业高效办理的业务需求。
第三,借力于国家公共信用信息中心这一平台,将信贷风控模型及算法赋能各家金融机构,为小微企业提供基于大数据及智能算法的融资,让这一服务模式不再“曲高和寡”。
安全计算助力数据融合
然而,不同的公共数据和金融征信数据之间仍存在着“流动难、共享难、融合难”的问题。如何在保证数据安全的前提下,让多个非互信数据源和使用方通过规定的数据用途和用量安全共享数据,是解决数据融合和数据隐私安全矛盾、真正将人工智能充分应用于大数据模型的关键难点。
为此,金融机构结合人工智能、知识图谱、联合建模、数据评分、指标计算等技术,进行了数据安全共享、有机融合和智能使用的探索。因为只有数据、算法、算力三者齐头并进,才能打造出基于联邦学习与多方安全计算(MPC)的、多应用场景的人工智能大数据平台。利用这样的平台,金融机构能在贷前审核和贷后管理两个阶段,对小微企业客户进行精准画像。
在技术上,该平台采用基于中间件的异构隐私计算平台互联互通方式,连通各数据源,构建完整的供应信息链。以此为基础,进一步构建安全特征图谱,对客户进行整体画像,并筛选出符合业务场景的标签维度,再将选中的标签维度代入安全多方计算或联邦学习算法中,完成对信息的交叉验证以及对目标客户的综合评价。利用区块链公开可验证、不可篡改等特性来保证信息的可靠性,不仅能实现全平台链上的信用穿透,还能实现上链比对验真、数据脱敏存证等多重功能,服务包括小微企业融资在内的几乎全部金融服务场景。
另外,金融机构还将隐私安全的知识图谱技术应用到小微企业金融场景中,通过隐私计算与知识图谱相结合的方式完善企业风控信息。经过不断的数据反哺和模型训练,能使智能风控大脑“越来越聪明”,形成面向各行各业的知识图谱,并将知识图谱注入到小微企业风险评估各个流程。
人工智能辅助“听说读写”
不过,即使有了公共数据来源和安全融合技术,一旦具体到某家小微企业,要进行尽调和批贷,仍然是困难的。因为有关的线上信息非常零散,很难迅速、完整收集并进行人工阅读。
目前行业内所做的探索是利用引擎将该企业的各类信息抓取出来,再通过自然语言处理技术进行解读,建立生成式的人工智能进行情感分析和标签分类,最后将这些分析结果和标签形成矩阵或者向量,辅助风控大脑生成结果。近期,ChatGPT的出现令人感慨大模型或将成为下一代人工智能技术竞争的核心议题,并重塑多个行业的工作方式和格局,而大模型又可以分为理解式大模型和生成式大模型。
理解式大模型能更好地辅助听与读,因为其优势在于数据洞察理解能力,可以用在智能推荐、风险管理、智能经营上,帮助银行业大幅提升经营效率和风险管理决策能力。只需把各类金融大数据、不同行业的数据和宏观经济数据注入大模型,就可以进行有效的风险预警和预测,降低整个社会的金融风险。例如,过去一份征信报告通常只能解读出几十、几百个风险指标,而智能算法却能识别出40多万个风险指标,大幅降低信贷风险。
更了不起的创新在于人工智能的说与写。人们惊讶于人工智能的多轮复杂对话,但实际上,生成式人工智能真正的价值在于自主生成新的数据、图像、语音和文本等信息,这让它能够大幅提升金融机构的服务效率和体验。
对客户来说,生成式大模型可以是24小时在线的超级金融顾问。不管是信贷产品、理财产品,还是保险产品,它都可以依托全网专业知识库为客户提供不间断的在线服务,让小微企业主不再求助无门。对于从业者来说,生成式大模型可以是全能的业务助理。在海量信息数据加持下,它不仅了解国内外的宏观政策、行业信息、产品信息,而且可以自动生成文章、报告,提供专业建议和方案辅助交流,从而将金融服务的流程缩短、成本降低,最终从整体上降低融资成本。
综合来看,无论是理解式大模型还是生成式大模型的人工智能,在金融领域都可以应用于多种业务场景。
一是智能投顾,根据客户的风险偏好、收益目标和资产状况,为客户提供个性化的投资建议和组合优化。利用大数据分析、深度学习和强化学习等技术,实时监测市场动态,调整投资策略,提高收益率和降低风险。
二是智能投研,通过分析海量的金融数据、新闻、社交媒体等信息,为投资者提供股票、基金、债券等金融产品的评估和预测,以及投资策略和建议。
三是智能投后,通过分析客户的信用历史、行为特征和社会关系等数据,为金融机构提供精准的风险评估和欺诈检测。生成式人工智能可以利用图神经网络、对抗生成网络和异常检测等技术,挖掘潜在的风险因素,识别异常行为,防范金融损失。
四是智能保险,根据客户的需求、偏好和场景,为客户提供定制化的保险产品和服务。生成式人工智能可以利用条件生成网络、文本生成和图像生成等技术,模拟不同的保险场景,生成适合的保险方案,提升客户体验和满意度。
不过,大模型的应用,也面临着诸多挑战。例如,在数据安全和隐私保护方面,理解式和生成式人工智能技术都需要大量的数据输入和输出,这涉及金融数据的安全性和客户隐私的保护问题。如何防止数据泄露、篡改、滥用等是亟待解决的问题。又如,技术可靠性和可解释性问题,生成式人工智能技术依赖于复杂的算法和模型,其生成的内容可能存在错误、偏差、不一致等问题,影响其可靠性和可信度。同时,其生成过程往往缺乏透明度和可解释性,难以让用户理解其原理和依据,影响其可接受性和可监督性。
监管与行业信息联通,共同推出相应的数据安全、技术可靠性以及法律法规等解决方案,加上社会各组织的监督,人工智能将会成为助力金融组织数字化转型的利器和解决小微企业融资难题的重要创新。