金融大数据解决方案

一、方案概述

  航天信息基于航天信息自己掌握的CRM数据、防伪税控发票数据、电子发票数据、企业税务申报信息等数据开展企业征信业务,为上层应用提供企业信用决策支持。航天信息技术研究院所提出的企业征信大数据解决方案,是具有航天信息特色的基于税务数据的企业征信方案。税务数据是企业间经济来往的历史记录,能全面地反映企业的经营状况和所处行业特点与自身特点,从而能较好地反映企业的信用水平。

金融行业大数据解决方案总体框架图

  解决办法:企业征信大数据平台综合运用大数据技术进行数据处理,其数据处理过程分为三大部分:

  1)数据注入过程。从原始数据层将信用数据注入数据仓库层,包括数据向大数据平台的导入、数据清洗、筛选,数据分类、合并等处理过程。

  2)数据抽取过程。根据信用主题分析的要求,从数据仓库层将信用数据抽取到数据集市层,形成按信用主题分块的数据集市数据群,包括数据聚类、分类、基础数据提取、数据预处理、数据冗余、数据特征指标提取等过程。

  3)数据加工过程。从数据集市层将信息原数据加工到数据展现层,形成各信用服务对象需要的信用产品,包括初级信用数据的脱敏合成、中级信用指标的统计分析计算、末端信用产品的信用模型算出分类信用评分、评级结果。根据历史数据和专家经验选择反映企业征信的特征,通过关联分析、数据挖掘和机器学习等方法完成企业征信的客观评价。

  效果:实现信用数据分析加工全过程的高效率、模式化,为征信业务今后完整的、海量的数据处理提供保障。


二、主要功能

(1)企业画像

  通过历史数据给出企业经验和发展指标;通过历史数据,预测企业在今后一段时间的发展情况。

(2)企业信用评级

  经验模型,多指标的层次分析模型,多指标的综合评价模型等的多模型多角度地给出企业征信评级。


三、方案特色

(1)主动式征信

  有别于传统征信公司被动式征信的数据采集模式,采取主动式全面采集企业信用数据,确保信用数据的实时性和准确性。

(2)全覆盖信用调查

  拥有1000万余户企业信用数据,覆盖了大多数在册企业,包含一般纳税人及小规模纳税人。满足信用数据的完备性。

(3)客观、实时、连续数据采集方式

  不定期主动采集企业静态数据及动态生产经营数据,数据真实、客观,具有实时、连续性、有说服力的特点。

(4)多维度、多指标的企业征信综合评价

  企业征信行业专家指导,经验性和数据分析相结合的选择影响企业信用评级的多个指标,层次性地多角度地给出企业征信的评价,准确地反映企业的信用。