Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

陈萍、杜伟报道

优秀!2021年谷歌博士生奖研金陆续揭晓,同济校友王鑫龙、南大校友李昀入选

在近日公布的谷歌2021博士生奖研金部分名单中,来自阿德莱德大学、新南威尔士大学、昆士兰科技大学和悉尼大学的四位博士生获得该殊荣。

谷歌的博士生奖研金项目(Google Ph.D Fellowship Program)创立于 2009 年,旨在奖励在计算机学科及其相关学科或者其它前瞻科研领域方面表现优异的博士生。

目前该项目提供奖学金的支持范围包括来自非洲、澳大利亚和新西兰、欧洲、印度、美国和加拿大等学生。

获得谷歌博士生奖研金项目的研究者将得到包括 15,000 澳元的奖励金,用于支付津贴和其他研究相关活动,此外,获奖者还会被分配一位 Google Mentor,负责提供指导帮助。

今年,该项目公布了来自澳大利亚的四名博士生因其杰出的研究而获得该奖学金。这四名获奖者包括来自机器感知、语音技术与计算机视觉方向王鑫龙,机器学习方向的李昀、Theekshana Dissanayake,算法、优化和市场方向的 Sampson Wong。

jiqizhix后续将跟踪报道更多其他地区与大学获得谷歌 2021 博士生奖研金的博士生。

机器感知、语音技术与计算机视觉方向

王鑫龙(Xinlong Wang),阿德莱德大学

个人主页:https://www.xloong.wang/

王鑫龙是阿德莱德大学二年级博士生,导师为沈春华(Chunhua Shen)教授。本科就读于同济大学,并曾在旷视科技腾讯优图实验室和字节跳动 AI 实验室实习。

王鑫龙的研究兴趣在计算机视觉机器学习,特别是赋能机器观察和理解环境。他的研究主题包括 2D/3D / 视频目标检测实例分割

此前,王鑫龙以字节跳动实习生的身份提出了一种实例分割新方法SOLO,通过引入实例类别的概念,将实例分割转换为分类问题。SOLO在一些性能指标上甚至超越了增强版的Mask R-CNN。

目前王鑫龙正在开发一种实例分割方法,未来可以为计算机视觉研究人员和技术公司节省大量时间和金钱

一种新的实例分割方法

物体识别定位技术对于机器人和自动驾驶汽车至关重要,机器人在移动中需要识别物体、自动驾驶汽车在城市街道上需要避开行人。实现此功能的一个关键技术是进行实例分割

王鑫龙解释道,实例分割计算机视觉中的一个基本问题。实例分割的目标是定位图像中的每个对象,并将其放在一个类别中。例如,有些像素都属于一棵树,而有些像素都是人的一部分。

目前,实例分割需要大量的时间和金钱投入,因为计算机模型并不是一开始就知道树和人之间的区别——它必须提前学习。「当我们训练这样的模型时,我们必须使用带有注释或标记的图像,」王鑫龙说道,但是给图像贴标签的过程增加了时间和成本。

因此,王鑫龙的工作旨在开发一种新的实例分割方法,该方法具有相当的准确率,但只需要不到现有方法三分之一的注释。例如,计算机视觉训练系统可能包含 100 万张图像——现有的实例分割方法需要对其中的每一张图像进行注释。而王鑫龙的方法仍然适用于这 100 万张图像,但只需要 20-30% 标记量就可以达到同样的训练准确率

目前为止,王鑫龙有多篇研究入选顶会论文,其中有四篇论文被 CVPR 2021 接收、一篇论文被 AAAI 2021 接收、两篇论文被 ECCV 2020 接收等。

机器学习方向

李昀(Yun Li),新南威尔士大学

个人主页:https://ogshun.github.io/

李昀是新南威尔士大学计算机科学与工程学院的博士生,她的导师为 Lina Yao 和 Boualem Benatallah 教授。2016 和 2019 年,她先后取得南京大学计算机科学与工程系的学士与硕士学位。

她的研究兴趣主要在于深度学习和大数据分析,尤其是在人类医疗健康领域的应用。目前,她的研究课题包括零样本学习、基因组分析和医疗成像

在李昀看来,深度学习在显著变革药物实践与医疗健康实现方面展示出了潜力。然而,医疗健康数据的低容量、高稀疏性和低质属性以及它们的多样化上下文限制了深度学习方法的性能。因此,在她的研究中,她意在开发一系列稳健和通用的少样本机器学习方法,以使用非常少的数据来高效地发现个性化和可迁移的洞见性知识。具体地,她已经确定并提出了用于基因组序列的数据高效方法,以及医疗图像增强、分层多视图数据分析和耳鸣诊断的解决方案。她还将继续提升临床转译的可解释性、透明性和个性化。她的研究将对基因组研究、医疗诊断、药物发现和疾病治疗等一系列实际场景产生更广泛的影响。

自 2018 年以来,李昀参与撰写的多篇论文被 TKDE、ICTAI、ICONIP、ICDE、CIKM、AAAI 等学术会议以及 VLDB Journal、TNNLS 等学术期刊接收。

Theekshana Dissanayake,昆士兰科技大学

个人主页:https://ieeexplore.ieee.org/author/37088772740

Theekshana Dissanayake 在佩拉德尼亚大学获得计算机工程学士学位。目前,他在昆士兰科技大学的信号处理人工智能和视觉技术 (SAIVT) 研究组攻读博士学位。他主要研究方向为生物信号数据的深度学习应用。

深度学习在解决基于生物信号的医学诊断问题上取得了巨大的成功。然而,现有的解决方案不能概括从不同的实验设置捕获的多个数据集。此外,当前的解决方案具有黑箱性质,从临床角度来看这阻碍了和预测相关的信任。Theekshana Dissanayake 的研究侧重于为基于生物信号医学诊断设计的深度学习模型的通用性和可解释性,并考虑单通道和多通道生物信号(如使用 EEG 和 ECG 的心脏信号和大脑信号)。

算法、优化和市场方向

Sampson Wong,悉尼大学

谷歌学术主页:https://scholar.google.com.au/citations?user=47gcJfsAAAAJ&hl=en

交通网络需要定期监控和维护以维持高水平的可操作性。随着网络的发展和技术的进步,对交通网络数据进行数据驱动分析的需求日益增长。从而导致政府和公司来开发特定领域的工具,为用户提供最佳推荐。这些工具的速度和质量很大程度上取决于它们的基本构建块。

Sampson Wong 的研究目标是开发有效的算法来解决交通网络中涉及几何运动数据的基本问题。该研究使用聚类和其他算法来检测几何运动数据中的通勤模式,并可以为交通网络选择有益的升级。

Sampson Wong 已发表多篇论文,部分论文如下:

参考链接:https://blog.google/around-the-globe/google-asia/australia/supporting-future-computer-science-2021-google-phd-fellowships/
入门Sampson Wong李昀王鑫龙2021谷歌博士生奖研金
相关数据
字节跳动机构

北京字节跳动科技有限公司成立于2012年,是最早将人工智能应用于移动互联网场景的科技企业之一,是中国北京的一家信息科技公司,地址位于北京市海淀区知春路甲48号。其独立研发的“今日头条”客户端,通过海量信息采集、深度数据挖掘和用户行为分析,为用户智能推荐个性化信息,从而开创了一种全新的新闻阅读模式

https://bytedance.com
沈春华人物

沈春华博士现任澳大利亚阿德莱德大学(澳大利亚8所研究型大学之一)计算机科学学院终身正教授。曾在南京大学(强化部本科及电子系硕士),澳大利亚国立大学(硕士)学习,并在阿德莱德大学获得计算机视觉方向的博士学位。沈春华教授在阿德莱德大学的团队目前主要从事统计机器学习以及计算机视觉领域的研究工作。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

分类问题技术

分类问题是数据挖掘处理的一个重要组成部分,在机器学习领域,分类问题通常被认为属于监督式学习(supervised learning),也就是说,分类问题的目标是根据已知样本的某些特征,判断一个新的样本属于哪种已知的样本类。根据类别的数量还可以进一步将分类问题划分为二元分类(binary classification)和多元分类(multiclass classification)。

物体识别技术

计算机视觉领域的一个分支,研究物体的识别任务

信号处理技术

信号处理涉及到信号的分析、合成和修改。信号被宽泛地定义为传递“关于某种现象的行为或属性的信息(如声音、图像和生物测量)”的函数。例如,信号处理技术用于提高信号传输的保真度、存储效率和主观质量,并在测量信号中强调或检测感兴趣的组件。我们熟悉的语音、图像都可以看做是一种信号形式。因此,对于语音、图像的增强、降噪、识别等等操作本质上都是信号处理。

定位技术技术

通常是指机器人领域的定位技术,see SLAM for details

零样本学习技术

从仅仅一个或一小撮样本中学习一个新的概念,而普通的机器学习标准算法通常需要几十或几百个表现类似的样本。

图像增强技术

图像增强技术用于增强图像中的有用信息,它可以是一个失真的过程,其目的是要改善图像的视觉效果,针对给定图像的应用场合。它通过有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果,满足某些特殊分析的需要。

旷视科技机构

旷视成立于2011年,是全球领先的人工智能产品和解决方案公司。深度学习是旷视的核心竞争力,我们打造出自研的AI生产力平台Brain++并开源其核心——深度学习框架“天元”,实现了算法的高效开发与部署。在持续引领技术进步的同时,我们推动AI产业的商业化落地,聚焦个人物联网、城市物联网、供应链物联网三大赛道,为个人用户带来更出色的美学体验与安全保障、让城市空间更有序、并帮助企业实现工业、仓储数字化升级。我们提供包括算法、软件和硬件产品在内的全栈式、一体化解决方案。

https://www.megvii.com
腾讯机构

腾讯,1998年11月诞生于中国深圳,是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念,为亿万网民提供优质的互联网综合服务。 腾讯的战略目标是“连接一切”,我们长期致力于社交平台与数字内容两大核心业务:一方面通过微信与QQ等社交平台,实现人与人、服务及设备的智慧连接;另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展,通过普及移动支付等技术能力,为智慧交通、智慧零售、智慧城市等领域提供有力支持。

http://www.tencent.com/
相关技术
聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

实例分割技术

实例分割是检测和描绘出现在图像中的每个不同目标物体的任务。

药物发现技术

在医学,生物技术和药理学领域,药物发现是发现新候选药物的过程。

视频目标检测技术

视频目标检测是从视频而不是图像中检测目标对象的任务。

同济大学机构
推荐文章
暂无评论
暂无评论~