征信机构始于19世纪30年代的美国。雏形是一些商业调研机构,服务民间或银行借贷业务,获取信息途径通过招募些调研人员去街巷走访,然后逐渐形成规模及规范化。
作为起源之地,美国有3大征信机构都有百年历史,例如全国性3大个人征信机构益博睿、艾荃法克斯、环联。3大征信机构数据源95%相同、覆盖90%美国人。可以看出美国的征信数据覆盖率是非常广的。其征信服务覆盖行业也非常多。在美国个人征信收到严格的监管,监管法律也非常健全,目前企业征信基本不受监管。
中国征信行业历史起源
在中国,最早的专职征信机构是中华征信所,于1932年6月6日创办。国内征信行业快速发展基本是2003年后开始。在这一年中国人民银行征信管理局也成立了。2017年6月个人信息安全法出台,整个征信行业对数据的敏感性输出做了很大调整,很多敏感信息接口都主动关停。
中国央行征信覆盖情况
国内,央行征信数据其实只覆盖了3.8亿左右的自然人,覆盖率非常低,还有几亿人只有简单的身份数据。美国已达90%以上,因此在国内单靠央行数据已经不太符合创新型的互金行业信贷产品。从而催生了各式各样的数据公司(包括备案的征信机构)尝试将非央行征信的电商、社交等数据应用于信贷风控,例如京东白条。
中国个人征信行业查询规模情况
无论国外还是国内,企业征信的发展都不如个人征信。从国内央行征信查询数据来看,2015年已达6.3亿,这还只是央行体系内的数据查询量,可见征信行业市场可见还是非常巨大。以此类推,央行外的类征信数据市场规模应该也是非常客观。
中国个人征信行业备案情况
在国内还没有一家征信机构获得正式牌照。之前沸沸扬扬的8大征信机构也只是属于备案阶段。国内2016年底备案有134家机构,最新公布的数据其实只有133家征信机构还在备案,经过全面的初步调研,仅有20%不到的征信机构是属于有业务开展,其他的大多还在筹备和摸索阶段。这些备案机构属于正规军,市场上还有很多数据科技公司也在做征信业务,但为了避开监管,多打着“信贷风控”等名号开展数据查询的交易业务。而这些非正规军却非常有活力,各种创新的信贷模型产品层出不穷,具体哪些真的好用,还无法判断。
后续将征信备案机构及非备案机构归类为“大数据行业”机构
中国征信行业数据主要类型
征信行业使用的数据主要包括传统央行的征信数据及互联网征信数据。
传统征信体系的征信(央行)由于体制和技术等原因使用多限于金融行业,而互联网金融平台的大数据征信结果往往有在金融业外的更多应用。
中国互联网征信行业数据类型
大数据的风控框架
大数据风控行业类型
个人征信模型通用简版思路
最后说下非全自动的个人征信模型简版思路:首先需要接入各种各样的数据源,这些数据源需要与业务需求符合,其次将各类裸数据拆分,根据业务类型及其他规则进行特征提取,初步分类。然后,各类特征将根据不同算法逐一组合成对应模型,应用与不同业务场景。不同模型经过机器学习(监督学习及无监督学习)的方式,输出相应分值,给与各模型相应的参考。最好还需要有经验人士,根据得分进行最后的决策。