企业大数据公司「道口金科」已完成数千万元战略融资,投资方为百望云。本次融资主要用于加强核心技术积累,同时强化市场营销。该公司的历史投资方包括英诺天使基金、合合信息、常见投资、坤元资本、清控天诚和水木清华校友基金。
2018年,道口金科由清华大学五道口金融学院互联网金融实验室孵化创立。道口金科通过搭建针对中小微企业的全面且结构化的数据库,为金融机构、地方政府、集团企业、商业机构及研究机构等角色提供数据风控、精准营销和研究分析等服务。
具体来说,通过挖掘数十亿商品交易信息和1.8亿企业数据,道口金科拆解出数万种商品类型和上亿个商品名称,建立了囊括知识图谱、认知图谱、行业谱的数据体系。该数据体系可以较为充分地展示产业链商品之间的上中下游关系、产业链各环节的成员情况以及产业链的发展趋势。
同时,这一图谱可针对全国省、市、区等各级行政区划,提供超过200个产业链指标,识别各产业链发展的优劣势,帮助客户分析判断各地区的重点产业及其发展情况,为地区“强链、延链、补链”的产业链优化升级提供辅助决策支持。
道口金科创始人袁伟告诉36氪,从事产业链知识图谱研发的公司需要做好三个维度的工作,一方面要积累大量高质量数据,另一方面需要掌握较为扎实的算法技术,同时需要对各产业拥有一定的认知和理解。
在数据内容的选择上,道口金科侧重对税务、发票、支付等交易属性的稀缺数据进行价值挖掘。袁伟表示,公开的企业数据对于金融机构的开发利用价值有限,就当前而言,与数据服务商的合作深度将直接影响使用情况。得益于股东背景,道口金科在数据获取上具有一定资源优势。
除了在数据积累上具有优势,道口金科也建立了领先的技术体系。袁伟表示,道口金科基于大数据分析和分布式自然语言处理技术,通过自定义模型函数接口,构建面向复杂文本的快速并行分析能力。同时,利用BERT预训练语言模型,道口金科可实现对海量非结构化交易信息的自动化清洗及标注,并对千万级标准结构化数据信息进行梳理,构建包含产业和地区两大维度的数字化云图。
道口金科在技术侧持续积累,在行业侧也形成了一套较为完善的方法论。袁伟表示,道口金科的研究团队会提供对各产业的理解,并据此形成标准版本的产业结构图,再与技术人员通过数据处理搭建的行业结构进行关联,最终生成交付给客户的产业链图谱。
道口金科在技术、行业等方面的积累可以帮助客户较为明显地提升业务指标、降低成本。袁伟告诉36氪,道口金科在疫情期间为某防疫物资平台提供销售、采购线索,一周之内助其与46家医用口罩供应商建立了合作关系,该防疫物资平台在一个月内实现了7000多万元的GMV。综合来看,道口金科可以帮助客户降低30-40%的成本,这与公司能够提供精准的企业画像密切相关。
道口金科的收入来源包括SaaS服务年费、接口调取费用和私有化部署费用三类。袁伟告诉36氪,2020年,道口金科营收较2019年增长5-6倍。
袁伟认为,企业大数据行业的机会点主要体现在两大方面,其一是相较于个人数据,企业大数据有天然的商业属性,隐私性较弱,便于合法合规地获取;其二是交易数据是商业分析的基础设施,我国在这方面的建设尚不足,金融机构、政府对此均有较大的需求量,若能有效地将知识图谱等技术融入商业场景,市场潜力巨大。目前已有不少玩家进入这一领域,代表公司包括知因智慧、天眼查等。
谈及下一步发展计划,袁伟表示,道口金科会进一步迭代产品,并扩充团队以匹配业务规模,预计在2021年实现3-4倍的业绩增长。
团队方面,道口金科技术人员占比达65%。核心团队在大数据、金融科技等领域有多年工作经历,曾任职于腾讯、百度、微众银行、北文投等互联网公司和金融机构。创始人兼CEO袁伟先后毕业于中国科学院软件所和清华大学五道口金融学院,曾任水滴数据的联合创始人兼CTO,发表过3篇SCI论文,拥有相关领域专利11项,在大数据、机器学习领域拥有丰富的研究和实践经验。