Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

美国能源部投资1370万美元用于科学「数据缩减」研究

编辑/凯霞

美国能源部投资1370万美元用于科学「数据缩减」研究


9 月 2 日,美国能源部 (DOE) 宣布为 9 个研究项目投资 1370 万美元,这些项目将推动计算机科学和应用数学的发展。这些项目由八个州的五所大学和五个美国能源部国家实验室牵头,将解决移动、存储和处理科学天文台、实验设施和超级计算机产生的海量数据集的挑战,加快科学发现的步伐。

美国能源部投资1370万美元用于科学「数据缩减」研究


随着科学用户设施的升级和扩展,它们生成大量科学数据的能力开始超过科学家流式传输、存档和分析这些数据的能力。这迫切需要开发新的数学和计算机科学技术,通过删除琐碎或重复的数据来缩小这些数据集,同时保留可能导致发现的重要科学信息。

虽然对数据缩减(data reduction)技术的需求是显而易见的,但使用这些技术的科学家必须相信,他们不会丢失重要的科学信息,这是一个关键的挑战。该计划支持的研究不仅必须解决数据缩减技术的效率和有效性,还必须解决其可信度问题。

「包括美国能源部科学办公室在内的全国科学用户设施,正在产生可能导致令人兴奋和重要的科学发现的数据,但这些数据的规模正在带来新的挑战,」,美国能源部科学办公室高级科学计算研究副主任 Barb Helland 说。「这些发现只有在数据可控的情况下才能被发现,并且科学家们信任用于做到这一点的技术。」

在公告中选择的项目涵盖了广泛的主题,这些主题承诺在数据缩减技术方面进行重要创新,包括使用高级机器学习、大规模统计计算和新型硬件加速器的技术。项目示例包括:

  • 压缩流数据的方法:橡树岭国家实验室的研究人员将开发一种技术,通过利用科学仪器或计算机模型的特定结构,并集成先进的机器学习技术,对直接来自该仪器或计算机模型的数据进行压缩,同时允许科学家控制数据的某些特征。
  • 智能选择和调整压缩技术的方法:德克萨斯州立大学的研究人员将开发技术来搜索潜在数据压缩技术的广阔空间,并根据用户对保真度、速度和内存使用的要求选择最佳方法。
  • 相关数据集组的压缩方法:加州大学圣地亚哥分校的研究人员将开发可扩展的技术来压缩多个相关的数据流,例如,通过利用数据集之间的关系数据集,来自观察同一物理系统的多个传感器的数据流。
  • 为流式压缩定制硬件加速器的编程方法:费米国家加速器实验室的研究人员将开发用于编码高级压缩和过滤的技术,包括基于机器学习方法的技术,作为用于各种实验设置的定制硬件加速器,从粒子物理实验到电子显微镜。

参考内容:

https://www.eurekalert.org/news-releases/927316

https://science.osti.gov/ascr

产业
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

数据压缩技术

数据压缩是指在不丢失有用信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率,或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间的一种技术方法。数据压缩包括有损压缩和无损压缩。在计算机科学和信息论中,数据压缩或者源编码是按照特定的编码机制用比未经编码少的数据位元(或者其它信息相关的单位)表示信息的过程。

流数据技术

流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,数据流可被视为一个随时间延续而无限增长的动态数据集合。应用于网络监控、传感器网络、航空航天、气象测控和金融服务等领域。

推荐文章
暂无评论
暂无评论~