Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

应用IBM数据治理软件,四川省税务局构建知识图谱

应用数据治理工具,多年前的业务内容被重新转化成为有效资产。

在传统行业之外,数据治理也正在为政府部门提高效率作出贡献。

近日,来自四川省税务局大数据风险管理局的大数据平台技术专家肖斌与 IBM 中国客户成功架构师张敏向媒体分享了政府部门应用大数据实现智能化转型的最新案例。

在国家税务总局金税四期及总省两级对数据管理的要求下,四川省大数据风险管理局针对省级数据管理进行了数智化转型升级。

四川省税务局有多达 70 余个业务系统,有的单表数据达 30 亿行,其中包含历史版本和现有数据,分布的位置也各不相同。「在启动大数据建设后,我们把这些数据汇总,发现如果不做数据治理,将会面临很多问题和挑战,」肖斌介绍道。「比如我们到底有多少数据,有多少个系统,历史版本的数据在哪个地方,这让我们对于整体情况没有把握。」

自从大数据风险管理局成立后,税务局的工程师把数据全部汇聚到大数据平台上。自 2021 年 1 月起,IBM 中国科技事业部的数据与人工智能技术顾问开始为税务局的技术团队做产品和方案介绍、软件测试(PoC)、生产系统配置、安装、功能验证等工作;到去年 7 月,IBM 客户成功管理团队开始协助生产系统安装和系统上线;在此过程中,IBM 中国开发中心持续跟进,解决相关生产系统问题。

通过基于 IBM Cloud Pak for Data (CP4D) 系统平台上的软件模块 Watson Knowledge Catalog(WKC)体系,四川税务局大数据风险管理局目前已能做到在元数据管理上管理表和字段,另外还能做到业务和数据的关联,把征管规范、税务表证单书与数据关联起来,形成了从业务到数据的知识图谱,这样无论是技术人员还是业务人员应用数据库就可以根据知识图谱做数据或业务的双向追溯。

IBM Cloud Pak for Data 是 IBM 混合云战略最重要的产品线之一,构架在 Red Hat OpenShift 容器云之上,包含很多和数据中台建设相关的产品,其中数据治理能力主要来自于 IBM WKC。

在数据治理完成之后,数据资产可被大量业务用于数据分析。「目前,业务人员可以追溯征管行为。技术人员可以了解数据的业务含义,认识到取证需求,取数会更准确,」肖斌表示。「我们的数据增长量很大:目前已有超过 200T 的数据,还不包括 Hadoop 平台中的备份。」

IBM 专家表示,客户使用 WKC 实现了企业级数据治理系统平台建设,完成的业务系统包括:税务登记、税务申报、发票类、国际税收业务类,税务行政、出口退免税等。

「数据治理是一个强咨询项目类型,存在很多治理策略。四川省税务局对于数据治理的认知程度很高。在这里数据量对过程会有挑战。大量的表单对于工具要求很高,在全球来看,单表数据达数十亿行的量也是很少见的,」IBM 中国客户成功架构师张敏表示。

使用 WKC 解决方案,四川省税务局和 IBM 合作,采用人工智能技术提升了自动化治理数据效率,降低了运营成本,为数据用户提供可信赖的信息,未来还有望在目前的基础上开展新业务。

目前,该项目完成了建设数据知识体系的工作,在未来大规模应用阶段,大数据将会实现更多的业务效率提升。

产业大数据技术IBM
暂无评论
暂无评论~