Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

召集令|热浪来袭,世界人工智能大会黑客松邀你来战!

世界人工智能大会(WAIC)是经国务院批准,国家发展改革委、科技部、工业和信息化部、国家互联网信息办公室、中国科学院、中国工程院等部委与上海市政府共同举办的顶级人工智能会议。2021 年大会继续秉持「智联世界」的理念,以「众智成城」为主题,促进全球人工智能创新思想、技术、应用、人才和资本的集聚和交流,推动全球科技的创新协同,助力打造人工智能世界级产业集群。本届大会将于 7 月 7 日 - 10 日在上海举办。


世界人工智能大会黑客马拉松作为 WAIC 期间唯一的一场黑客松,由世界人工智能大会组委会办公室作为指导单位,由机器之心,MindSpore 开源社区,Waston Build 创新中心,六七八九集团主办,此次黑客松设计多道赛题,聚焦 AI 技术与应用热点问题。黑客松颁奖典礼将在 7 月 10 日举办的 WAIC· 开发者论坛上举行颁奖。

在此诚挚邀请全球热爱 AI 的开发者们组团来战!

比赛简介
  • 报名时间:即日起开启线上报名,7 月 3 日截止线上报名

  • 决赛名单公布时间:决赛名单 7 月 4 日统一公布

  • 决赛时间:7 月 9 日 9:30-18:00

  • 比赛地点:上海张江人工智能岛 21 号楼 4 楼(上海市浦东新区川和路 55 弄上科路 366 号)

MindSpore 开源社区赛道

本赛道由华为 MindSpore 开源社区主办,设置三个赛题,围绕 Volcano 容器批量计算平台、openLooKeng 机器学习库、openGauss,三个方向设置赛题,每个赛道奖金分别为冠军: ¥5000、亚军: ¥3000、季军: ¥2000。

赛题 1: 基于 Volcano 容器批量计算平台进行 MindSpore LeNet 模型训练

赛题描述:

旨在实现易开发、高效执行、全场景覆盖三大目标,其中易开发表现为 API 友好、调试难度低,高效执行包括计算效率、数据预处理效率和分布式训练效率,全场景则指框架同时支持云、边缘以及端侧场景。LeNet-5 是最早的卷积神经网络之一,主要用来进行手写字符的识别与分类。LeNet-5 通过巧妙的设计,利用卷积、参数共享、池化等操作提取特征,避免了大量的计算成本。

在本次黑客松挑战赛中,挑战者需要使用 MindSpore 进行 LeNet-5 手写体识别模型训练。并需要把模型容器化后部署到 volcano 批处理系统中进行调度训练。

参考网站:
  • https://github.com/volcano-sh/volcano

  • https://volcano.sh/en/

  • https://www.mindspore.cn/tutorial/zh-CN/master/introduction.html

参赛要求:
  1. 技术要求:熟悉 Python;熟悉 kubernetes 平台;对 MindSpore 和 LeNet 有一定了解

  2. 团队要求:1-3 人

赛题 2:openLooKeng 机器学习库支持算法扩展

赛题简介:

当今社会机器学习算法在很多应用场景中得到大量成熟应用(如疫情人员追踪分析、医疗图像聚类分析、商业智能分析等),而一个好的算法离开了数据其能力也一定无法施展。
openLooKeng 原生支持对接不同类型的数据源,极大程度地方便了跨源分析的底层数据融合,基于此可以利用各种机器学习算法在海量规模的数据中做出精准有效的分析预测。

在本挑战赛中,需要在 openLooKeng 现有已经支持的机器学习算法上,扩展支持常见常用的两个聚类算法——DBSCAN 和 KMeans 以及两个个分类算法——KNN 和朴素贝叶斯

参考网站:
  • https://openlookeng.io/

  • https://gitee.com/openlookeng/hetu-core

参赛要求:
  1. 技术要求:熟悉 JAVA 和面向对象程序设计,了解 DBSCAN/Kmeans/KNN/Bayesian 原理

  2. 团队要求:1-3 人


赛题 3: 数据库内部实现基于 AI 的算子代价估算功能

赛题描述:

openGauss 是华为开源的一款集成华为数年来在数据库商用领域雄厚技术积淀的、高性能的关系型数据库,目前发布了 2.0.0 版本,具有高性能、高可靠、AI 易运维、高安全的特点。现有数据库理论中对执行算子的代价估算是基于代价模型(cost model)的,代价模型是预设模型,不可自我更新,模型参数需要预设,且在不同硬件上参数配置差异会很大(如 random_page_cost 与 seq_page_cost)。数据库优化器估算出的 cost 值与 SQL 语句的真实执行时间线性相关性差,难以直观体会 SQL 语句复杂程度。并且,在负载 SQL 语句下,某些算子的执行代价会被低估或高估,这将直接影响执行计划的生成(如 IndexScan 算子代价被低估,导致使用索引扫描而造成性能下降)。上述问题都是现有数据库优化器代价模型的现实问题。

在本挑战赛中,希望挑战者通过 AI 的方式来评估算子的代价信息,以此来构建数据库原生的、可在线学习的、时间线性相关的、评估准确的新型 AI 数据库代价估计模型,并以此来替换现有的代价模型。openGauss 已经在该领域有过初步探索,即 “predictor 执行时间预测” 特性,该特性在数据库外部实现,通过 Http 协议进行通信,并非数据库原生组件,不可替换现有代价模型,仅供挑战者参考。

参考网站:
  • https://gitee.com/opengauss/openGauss-server/tree/master/src/gausskernel/dbmind/tools/predictor

参赛要求:
  1. 技术要求:熟悉 Python、C/C++ 编程语言;对数据库内核原理、机器学习有了解

  2. 团队要求:1-3 人

Waston Build 创新中心赛道 & 六七八九集团赛道

本赛道由 Waston Build 创新中心赛道 & 六七八九集团赛道联合主办,设置气候变化和乡村振兴两大赛题,每个赛道冠军可以获得 5000 元现金奖励,所有获奖团队均可获得上海张江 Watson Build 10 周深度孵化营入场券,12 万美金 IBM 云平台信用额度,进入 Call For Code 全球挑战赛绿色通道,冲击 20 万美元现金大奖。

赛题 1:【气候变化】 如何能够借助先进的科学技术,让我们能够从容的面对众多复杂的气候变化的挑战

赛题描述:

虽然今天的科技发达足够发达,但我们人类社会也面临越来越严峻的来自气候变化,全球流行疾病等挑战。在本次黑客松挑战赛中,参赛者需要解决,如何能够借助先进的科学技术,让我们能够从容的面对众多复杂的挑战。

赛题 2:【乡村振兴】利用技术方式解决不平衡、不充分发展的矛盾,助力乡村实现进一步发展

赛题描述:

乡村兴则国家兴,乡村衰则国家衰,我国人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾在乡村最为突出。我们寄期望利用技术方式解决不平衡、不充分发展的矛盾,助力乡村实现进一步发展。

本次挑战赛以「乡村振兴」为主题,设置了「智慧农业」、「智慧康养」、「数字乡村管理」三大方向。

参赛要求:

  1. 参赛机构不限,全球企业、初创公司、高校、科研学术机构、个人开发者,有志于用数字化技术改变,创造世界的创新创业者,开发者,企业均可组队参赛。

  2. 每个团队最多允许由年满 18 岁的队员组成,且只能隶属于一支团队。

  3. 每支参赛团队人数不多于 5 人。

报名请扫一扫二维码:


产业WAIC
相关数据
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。

https://www.huawei.com/cn/
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
池化技术

池化(Pooling)是卷积神经网络中的一个重要的概念,它实际上是一种形式的降采样。有多种不同形式的非线性池化函数,而其中“最大池化(Max pooling)”是最为常见的。它是将输入的图像划分为若干个矩形区域,对每个子区域输出最大值。直觉上,这种机制能够有效的原因在于,在发现一个特征之后,它的精确位置远不及它和其他特征的相对位置的关系重要。池化层会不断地减小数据的空间大小,因此参数的数量和计算量也会下降,这在一定程度上也控制了过拟合。通常来说,CNN的卷积层之间都会周期性地插入池化层。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

商业智能技术

商业智能(Business Intelligence,BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。

LeNet技术

LeNet 诞生于 1994 年,是最早的卷积神经网络之一,并且推动了深度学习领域的发展。自从 1988 年开始,在许多次成功的迭代后,这项由 Yann LeCun 完成的开拓性成果被命名为 LeNet5。LeNet5 的架构基于这样的观点:(尤其是)图像的特征分布在整张图像上,以及带有可学习参数的卷积是一种用少量参数在多个位置上提取相似特征的有效方式。在那时候,没有 GPU 帮助训练,甚至 CPU 的速度也很慢。因此,能够保存参数以及计算过程是一个关键进展。这和将每个像素用作一个大型多层神经网络的单独输入相反。LeNet5 阐述了那些像素不应该被使用在第一层,因为图像具有很强的空间相关性,而使用图像中独立的像素作为不同的输入特征则利用不到这些相关性。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

朴素贝叶斯技术

朴素贝叶斯是一种构建分类器的简单方法。该分类器模型会给问题实例分配用特征值表示的类标签,类标签取自有限集合。它不是训练这种分类器的单一算法,而是一系列基于相同原理的算法:所有朴素贝叶斯分类器都假定样本每个特征与其他特征都不相关。举个例子,如果一种水果其具有红,圆,直径大概3英寸等特征,该水果可以被判定为是苹果。尽管这些特征相互依赖或者有些特征由其他特征决定,然而朴素贝叶斯分类器认为这些属性在判定该水果是否为苹果的概率分布上独立的。

在线学习技术

在计算机科学中,在线学习是一种机器学习方法。和立即对整个训练数据集进行学习的批处理学习技术相反,在线学习的数据按顺序可用,并在每个步骤使用未来数据更新最佳预测器。

优化器技术

优化器基类提供了计算梯度loss的方法,并可以将梯度应用于变量。优化器里包含了实现了经典的优化算法,如梯度下降和Adagrad。 优化器是提供了一个可以使用各种优化算法的接口,可以让用户直接调用一些经典的优化算法,如梯度下降法等等。优化器(optimizers)类的基类。这个类定义了在训练模型的时候添加一个操作的API。用户基本上不会直接使用这个类,但是你会用到他的子类比如GradientDescentOptimizer, AdagradOptimizer, MomentumOptimizer(tensorflow下的优化器包)等等这些算法。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
数据融合技术

数据融合技术将来自多个传感器(信息源)的数据和相关数据的信息相结合,以实现比单独使用单个传感器(信息源)所能实现的更高的准确性和更具体的推论。

图像聚类技术

聚类是一种运用广泛的探索性数据分析技术,直观上讲,聚类是将对象进行分组的一项任务,使相似的对象归为一类,不相似的对象归为不同类中。当聚类对象是图像的时候,就是所谓的图像聚类。

暂无评论
暂无评论~