数梦工场宣布完成6亿元B轮融资,提出「数据智能++」数据资产管理理念

9月26日,杭州数梦工场科技有限公司(简称“数梦工场”)宣布完成B轮融资,金额达6亿元人民币,公司估值达15亿美元。此轮融资由浙江省国企改革发展基金和浙商创投联合主投,融资资金将用于产品研发、人才引进和市场拓展等方向。

数梦工场创立于2015年3月,总部位于杭州云栖小镇,在全国三十一个省市设有分支机构,在北京、杭州、南京、成都、广州、长沙成立技术创新中心。截至目前,数梦工场已广泛服务于25个以上部省级客户、100个以上城市级客户和100家以上企业,该公司参与制定“大数据开放共享”“大数据安全”等国家标准,在大数据领域拥有160多项国家专利,处理过的数据累计达数百PB。

在9月26日数梦工场“数据价值之路”技术峰会暨B轮融资发布会上,数梦工场首席技术官崔晓峰阐述了“数据智能++”的理念、解决方案和最佳实践。数据价值的充分释放能够带来数字经济的爆发式发展,而大数据如何与人工智能完美结合,俨然已成为大数据产业新的探索点。

目前业界在应用层AI方面取得了一些进展,实现了“小数据、小智能”;当前在“智能+”时代,数据的复杂度、模型变量的复杂度、业务协同的复杂度和数据安全的复杂度都大幅提升,在海量数据的管理过程中需要通过人工智能技术的加持来结构性解决效率、精准度和多元适配问题。数梦工场认为大数据和人工智能的结合应覆盖全流程、全体系,贯穿数据资产管理和大数据应用的始终。大数据为人工智能的发展提供基础资源,而人工智能的加持使数据资产管理实现智能化。

数梦工场立足于大数据领域的技能和经验,从全局角度创造性地进行融合,强调数据资产管理过程的智能属性,也专注于数据资产管理结果的智能体现。“第一个智能+,就是数据资产管理过程中的智能”,崔晓峰解释道,“数年积累的大数据能力结合人工智能,让数梦工场在数据处理效率和准确性等方面优势尽显,数据资产管理呈现出高效、精准、多元的特点”。

基于元数据在数据接入、数据探查、数据清洗、模型设计与加工等阶段,通过自然语言语义分析机器学习,构建“元数据”驱动的“数据项和数据标准推荐关联”和“关联后的自动清洗”; 以“元数据”为基础,自动建立全链路数据血缘,进行数据流转分析、属性继承分析和影响分析;以“元数据”和“数据标准”为基础,构建深度学习的数据标准和模型标准,建立起符合预期的数据质量体系,提高数据治理精准度; 以主题库和标签为基础,来承载“专家经验”,支撑行业化数据智能; 在普遍耗时的环节,嵌入 AI 能力,比如智能数据增量同步的自动配置、智能数据切片、智能去重、智能清洗等环节。通过各个环节的提升,实现数据治理过程的高效、精准和多元。综合人口库超过12000个字段的标准化工作从20人月被优化至1人月,极大地提高了数据标准化的效率。

数据经过治理成为资产后,通过智能评估生成数据质量报告和安全评估报告,并依靠全链路数据风险感知、数据安全堡垒和敏感数据智能发现等技术,进行质量监控、运维保障和安全防护。在保障全生命周期数据安全的同时,数梦工场建立并持续积累了大量具有行业属性的业务标签和模型,让数据资产管理变得更加高效和精准。

“除了过程的智能化,我们还在具体的业务效果上呈现出智能化的特点:可解释、可量化和可迭代”。崔晓峰认为,这正是第二个“智能+”的含义。

人工智能越来越多地用于辅助人类决策和业务创新,用户需要更直观的、更透明的数据智能。数梦工场在自然人大数据实践中,沉淀出大量的模型和标签,生成扶贫专题库,通过数据共享与民政救助应用进行数据联通,进而主动发现贫困户,进行精准扶贫。从标签识别到最终的救助服务,每一步都有迹可循,有理可依,直观而清晰,可拆解、可溯源、可分析。

数据资产管理的结果需要用数据说话,即使是定性的分析,也要有定量的数据做支撑,包括数据分类分级、各级类目、标准数据元和量化标签等。自提升、自优化是可迭代智能的典型表现,即通过持续不断的反馈和修正,来形成可持续的、愈加精准高效的数据智能。

数梦工场通过可持续优化的行业语义关联推荐引擎,结合丰富的行业实践,使综合人口库数据关联推荐的准确率从60%跃升至98%。在公安领域,数梦工场已沉淀出135组标签,结合精准督察算法,在酒驾督察、扫黑除恶、重点人员预警等实践中,均取得了亮眼的成绩,如秒级获取酒驾督察结果,通过长途客运旅客实名信息管控平台抓获77名在逃人员等,获得了客户的一致认可,也进一步丰富了公安大数据领域的数据积累。

产业数梦工场
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

语义分析技术

语义分析是编译过程的一个逻辑阶段, 语义分析的任务是对结构上正确的源程序进行上下文有关性质的审查,进行类型审查。语义分析是审查源程序有无语义错误,为代码生成阶段收集类型信息。比如语义分析的一个工作是进行类型审查,审查每个算符是否具有语言规范允许的运算对象,当不符合语言规范时,编译程序应报告错误。如有的编译程序要对实数用作数组下标的情况报告错误。又比如某些程序规定运算对象可被强制,那么当二目运算施于一整型和一实型对象时,编译程序应将整型转换为实型而不能认为是源程序的错误。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

数梦工场机构

杭州数梦工场科技有限公司(简称“数梦工场”)创立于2015年3月,总部位于杭州云栖小镇,在全国三十一个省市设有分支机构,在北京、杭州、南京、广州、郑州、长沙、成都、兰州成立技术创新中心,公司80%以上为技术人员。数梦工场由阿里巴巴集团、银杏谷资本和光大实业资本等投资,定位于新型互联网平台开发和服务。2017年6月,数梦工场获A轮融资,估值超10亿美元,成为大数据行业独角兽。2019年9月,数梦工场获B轮融资,估值超15亿美元。 数梦工场秉持新型互联网平台战略,提出“数据智能++”的技术发展路径,在数据资源资产化、数据资产服务化、数据服务价值化过程中,运用人工智能技术并加持行业专家经验,实现过程智能和结果智能。公司研发创新方向涵盖数据集成、数据共享交换、数据治理、数据资产管理、数据安全和行业智能等,提供在政务、城市、产业互联网领域全栈数据智能产品、解决方案和服务。

http://www.dtdream.com/
推荐文章
暂无评论
暂无评论~