Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

数据价值跃迁:洞见下一代变革力量

「机器之心2021-2022年度AI趋势大咖说」聚焦「驱动未来的AI技术」与「重塑产业的AI科技」,推出线上分享,共邀请近40位AI领域知名学者、产业专家及企业高管通过主题分享及多人圆桌等形式,与行业精英、读者、观众共同回顾 2021年中的重要技术和学术热点,盘点AI产业的年度研究方向以及重大科技突破,展望2022年度AI技术发展方向、AI技术与产业科技融合趋势。

本文为格物钛智能科技CEO崔运凯于「重塑产业的AI科技」系列主题,「企业数字化转型」专场的分享内容节选。点击进入「机器之心Pro」,查看更多优质内容。


数据价值跃迁,洞见下一代变革力量

近日“东数西算”工程正式全面启动,数据要素的战略性地位被一同推向新高潮,如何更好地释放数据价值成为各界关注的重要议题。

“数据正在发生代际跃迁,而中国大部分企业还未觉醒。”作为数据新基建领域的专家,格物钛智能科技创始人兼CEO崔运凯指出,随着数字化转型的深入,非结构化数据的管理和使用将是下个时代核心命题,企业需要新一代数据平台去应对即将爆发的变革与挑战。

从结构化数据到非结构化数据

据IDC预测,全球数据圈将从2018年的33ZB增至2025年的175ZB,中国将以27.8%的占比成最大数据圈。未来5年内,这些数据的80%是以图片、视频、语音等形式存在的非结构化数据,并将以每年60%的增速持续扩张下去。

相较于已经被市场充分有效使用的结构化数据,非结构化数据具有体量更大、类型更丰富、信息维度更多、价值更高等特点,因其挑战难度大被称为“商业世界的白鲸”,带来时间人力成本高、多维多模态数据价值挖掘、安全稳定合规性等众多问题。

目前企业对非结构化的管理相对原始和落后,大部分企业还停留在用传统文件夹式管理的阶段,研究表明,他们80%的空间存储着重复的数据,工程师60%的工作时间在进行数据搜索,40%的数据处理时间花在了把数据从硬盘读到内存和从内存写到硬盘上。

在格物钛近期的一项调研中,面对规模海量分散、形式多样、关系复杂且呈指数级增长的非结构化数据,近95%的AI开发者表示非结构化数据管理正面临巨大挑战,管理缺乏行之有效的工具,企业也面临更严重的成本压力和数据质量隐患。

数据平台的演进变革

图片

作为新型数据基础设施建设者,格物钛智能科技看到了一个面向非结构化数据的平台级机会,决心成为这场变革的技术先锋和领头羊,开创性地为创新企业和开发团队提供新一代数据平台支持,解决非结构化数据难发现、难管理、难利用等痛点。

要看清格物钛数据平台在当下和未来的战略意义,需要回到上一代针对结构化数据的数据平台中去理解。上一代数据平台是汇聚传统SQL数据库数据支持检索和分析的平台,数据平台最早的形态,是操作者手动将各部门导出的Excel进行汇总,从而在更完善的Excel表格中展开数据分析,以辅助决策者得出最终决策。这种数据管理存在着独属其自身的局限,只能存在单机的内存中,无法支持长时间的运作管理。

随着美国2000年前后互联网泡沫的发酵,数据库技术开始变得越来越流行,衍生出一系列软件帮助公司各个部门更好地管理内部数据,比如HR系统、ERP、CRM等等,逐渐取代通过Excel表格记录的模式。

之后商业环境愈加复杂,企业在SQL数据库里积累的数据量越来越多,需要一个平台把这些数据都汇集起来,因此数据平台兴起,Snowflake、Databricks、Elastic等公司和相关产品在2012年相继诞生。

10年后的今天这一切发生了翻天覆地的变化,基于更大规模、更大价值的非结构化数据生态将出现更大规模的非结构化数据平台。锋芒初露的格物钛或将带来革命性力量。

塑造变革新势力

格物钛数据平台,依托自研高效数据引擎,驱动海量复杂数据的灵活存取用,让AI开发和数据分析更好更快,助推AI工程化和数据资产化实践。此平台支持多维度的非结构化数据,同时可与不同的应用集成,贯穿数据全生命周期,也能将数据要素价值运用到各行各业中去。

崔运凯介绍,格物钛能够帮助企业提升数据迁移和数据管理两大能力。在数据迁移上,格物钛提供更好的工具让数据流转更快,比如数据检索、可视化、版本管理、自动化等等。以自动驾驶为例,格物钛已经帮助部分企业实现了模型迭代效率提升50%。与特斯拉自动训练框架“DataEngine”流程类似,从每个车端数据的收集到上云之后的所有流程,在格物钛数据平台都可以实现。通过数据采集、标注、模型部署等环节,在测试过程中识别出长尾情况、单独测试,未通过的数据会被送到数据容器中,对数据进行加强、重新标签、训练生成模型……如此反复直至覆盖所有场景,在大量训练数据的喂养下,自动驾驶能够变得越来越聪明。

图片

在数据管理方面,自研数据引擎是格物钛的技术核心,有三大系统性优势——存算分离的架构、多维度的高效数据检索、工作流自动化,就像汽车引擎一样给数据提供动力,让它能够更好地应对海量和复杂度挑战,实现更低成本、更大规模。崔运凯以某豪华品牌车企为例,解释了如何实现多场景的复杂数据管理,该企业在整车生产和用户服务的过程中产生了大量非结构化数据,但没有做任何使用或分析,只是存储在云端造成了大量浪费,格物钛帮助该企业把所有场景数据进行融合,打通结构化和非结构化数据,实现跨部门、跨业务的数据分析和应用,最终持续带来业务价值,如汽车保险、质量管控、面向未来的产品研发等等。

图片

“10年前,网景的创始人Marc Andreson说‘软件在吞噬世界’,而10年后的今天,我想帮他补充下半句,那就是‘数据在吞噬软件’。”崔运凯认为,全球目前正处于非结构化数据爆发的前夕,随着终端全方位感知物理世界和云的普及,未来非结构化数据潜能会进一步被释放,利用非结构化数据的各类场景也将更为广泛。许多谋求持续发展的企业,将更多高科技与智能AI加入自己的产品及战略中,他们将在格物钛的帮助下实现跨越性的数据驱动和增值。


产业数据管理
暂无评论
暂无评论~