在AI蓬勃发展的当下,高质量数据集已成为驱动行业大模型应用落地的“核心燃料”。国务院日前印发的《关于深入实施“人工智能+”行动的意见》明确提出,持续加强人工智能高质量数据集建设。
近日在贵阳举办的2025数博会上,建设高质量数据集、加快促进数据要素流通交易和释放数据价值,成为各界人士讨论的焦点。浪潮软件集团金融业务总监王香萍在主题论坛上,分享了浪潮软件集团在人工智能助力金融高质量数据集建设的积极探索和实践成果,为金融行业借助 AI 技术构建高质量数据集提供了参考样本。
王香萍发表演讲
AI助力金融高质量数据集建设,浪潮构建了一体化技术路径
随着“人工智能+”行动的深入推进,人工智能在各行业的应用场景也由点到面、由浅入深,正发生质的跃迁。这一变革浪潮中,金融行业作为数字化转型的前沿阵地,更是迎来了从“数字化”向“数智化”跨越的重要机遇。浪潮伴随金融行业的发展,历经了从信息化到数字化、从数字化到“数智化”的升级,目前正在以深厚行业积累和AI、大数据技术助力金融行业客户进入数智新时代。
浪潮在深入参与数智金融建设中,认识到金融高质量数据集是驱动AI技术落地的基石。一方面,金融业务处理过程中产生的海量过程材料,为数据集的构建提供了丰富素材;另一方面,人工智能技术又能反向赋能数据集——通过精准处理、智能分析,不断丰富数据集的维度与价值。尤其在金融这一高度专业化的领域,数据必须具备高精准性、强行业规范性、高行业适配性三大核心特质,才能确保 AI 垂类模型训练“不跑偏”、决策优化“行业适用”,真正发挥技术价值。
在王香萍看来,在商业银行核心的信贷风控领域,AI 技术的价值尤为突出。过往 AI 多聚焦 C 端金融应用,如今随着小微企业 B 端需求激增,其应用重心逐步转移。小微企业数量大、单体授信额度小、业务频次高、覆盖范围广的特点,对信贷风控的数据治理与高质量数据集生成提出更高要求。
以商业银行普惠小微金融业务中高频次使用的“尽调报告”为例,其数据治理需重点突破两大核心要点:一是关系网精准构建。借助AI技术能够准确梳理企业股权链、供应链,以及企业实控人与经营团队的关系链,确保关联信息无遗漏、无偏差;二是单体、行业与异常特征值智能生成。通过AI技术自动计算企业财务指标与非财务指标,并与细分行业、通用行业的当期及历史数据进行对比分析,并精准识别原始材料异常与外部信息异常,为风控决策提供全面的“风险画像”。
针对这一需求,浪潮软件集团依托“星耀・模型引擎”,通过数据采集治理、模型深度分析两大核心能力,实现了对高质量尽调报告的自动化筛查与精准标注,大幅提升了尽调效率与数据质量。
在实践中,浪潮软件集团已形成“数据底座支撑层—采存加工层—大模型加小模型决策引擎层—高质量数据集” 的一体化实现路径。借助要素核查、行业分析、财务健康分析等轻量子模型,对小微企业尽调报告的质量、真实性进行评价与异常预警,以“小步快跑”的思路完成结构化与半结构化数据向高质量数据集的升级,既贴合金融业务逻辑,又能快速响应市场需求。
把握机遇、迎接挑战,共筑数智金融安全发展生态
王香萍表示,尽管AI为金融高质量数据集建设提供了有力支撑,有助于提升金融风控水平,然而不可忽视的是,在实践中仍面临不少挑战。诸如,业务与技术领域对多模态数据处理标准的理解偏差,导致数据应用衔接不畅;金融专业知识积累难度大,制约模型稳定性提升;信贷逻辑与技术逻辑的冲突,影响数据集实用性;同时,金融行业惯例下,结果可解释性与审计可溯源性难以满足监管要求等。
同时,金融高质量数据集建设面临广阔的机遇。在商业银行普惠金融领域,小微用户在授信、用信等金融行为中产生了海量数据。据中国人民银行统计,我国普惠金融领域贷款持续保持较快增长,截至2024年末,我国普惠小微贷款余额达32.93万亿元,同比增长14.6%,增速高于同期各项贷款平均水平;普惠小微授信户数超6000 万户,覆盖约1/3 经营主体;仅授信与续授信行为,每年就至少生成千万级的尽调报告。这些宝贵的“数据富矿”,为人工智能技术助力高质量数据集生成提供了坚实基础。
可以看到,随着人工智能技术的持续升级,以及数据要素与金融建设的深度融合,“以AI技术赋能金融高质量数据集建设”已具备广阔的应用空间与市场前景。
王香萍认为,金融行业“在发展中防风险、在创新中保安全”的审慎监管逻辑,需贯穿AI赋能高质量数据集建设全过程。首先要严控数据源头质量,避免财报质量低、要素缺失等问题影响数据可信度;其次需明确法律、责任、条线归口,解决权责模糊问题;再者要强化隐私保护,防范企业与个人信息泄露;同时需警惕AI模型精准度不足或“AI幻觉”引发的风控“茧房”风险,以及数据传输中的网络安全风险。
为此,浪潮软件集团倡议,金融科技厂商与金融机构需以开放态度推动技术创新,以审慎操作守住风险底线,共同实现“技术创新源自规范、AI能力创造价值、数智升级引领发展”的目标,为数字金融高质量发展注入动能。
浪潮软件集团作为金融科技领域的重要力量,已构建起全栈数智金融解决方案,未来将持续以人工智能、大数据技术为核心,深化与金融机构合作,推动数智金融高质量发展,助力金融机构为实体经济尤其是小微企业提供更优质服务,助推《关于深入实施“人工智能 +”行动的意见》在金融领域落地见效。
