北理工计算机学院作者

共聚北理工,2019 AI科学前沿大会即将开幕

20世纪最伟大的数学家 John von Neumann 希望计算机和人工智能能带来一场震撼我们这个星球的科学革命,菲尔兹奖和沃尔夫奖得主Stephen Smale继承和发扬了 John von Neumann 的科学思想,提出了著名的关于人工智能的Smale第十八问题。

为进一步继承和发扬 John von Neumann 的科学思想,中国科学院人工智能联盟标准组与北京理工大学计算机学院去年成功举办了“2018 AI科学前沿论坛”,论坛探讨了AI科学前沿的数学基础及其应用。由于该论坛反响热烈,应与会人士的要求,主办方决定将“AI科学前沿论坛”更名为“AI科学前沿大会”,拟定于2019年4月11日-12日在北京举办。

本次大会聚焦AI科学前沿的数学基础、算法、关键共性技术及其应用,邀请全国AI数学界、科学界知名学者和业界资深专家分享最新理论成果,展望AI科学未来。

会议热忱欢迎国内外AI数学、科学及应用相关领域的科研人员、高校师生、业界人士莅临。

大会福利: 注册费由主办方承担。

日程安排


组委会

会议主席

李真真   中国科学院人工智能联盟标准组

黄河燕   北京理工大学计算机学院

学术委员会主席 

姚  远   香港科技大学

谈胜利 华东师范大学

学术委员会委员 

Bo An   Nanyang Technological University, Singapore

戴彧红  中国科学院数学与系统科学研究院

郭  宪  南开大学

吉建民  中国科学技术大学

雷  娜  大连理工大学

Yuxi Li  ATTAIN.AI., Canada

刘铁岩  微软亚洲研究院

罗定生  北京大学

Jian Ma  Carnegie Mellon University

逄金辉  北京理工大学

齐国君  华为美国研究所

孙  剑  西安交通大学

孙仕亮  华东师范大学

吴焦苏  中国科学院人工智能联盟标准组

Zhiwei Steven Wu  University of Minnesota

夏光宇  上海纽约大学

谢广明  北京大学

Zhiqin John Xu  New York University       

宣晓华  SMALE数学与计算研究院

袁  泉  启元世界

章宗长  苏州大学

朱  军  清华大学

朱占星  北京大学

会务组成员

王大川 洪飞 王东方 李建雨 李敏 李土养 

嘉宾介绍

开幕致辞嘉宾

李真真

中国科学院人工智能联盟标准组组长,中国科学院科技战略研究院研究员。成功主办以人工智能技术、伦理与法律的关键科学问题为主题的第S36次香山科学会议等重要学术会议,倡导以博弈统摄机器学习的观点。

黄河燕

北京理工大学计算机学院院长,人工智能研究院院长,教授,博导,中国人工智能学会副理事长,北京市海量语言信息处理与云计算应用工程技术研究中心主任。主要学术研究方向为机器翻译自然语言处理 ,主持承担国家自科基金重点项目、“973 计划”课题、“863 计划”项目等 20 多项国家级科研攻关项目,获得国家科技进步一等奖等十余项国家级和省部级奖励。

学术报告嘉宾

1. 陈炳文 腾讯

  • 报告题目:营销风控的反欺诈技术

  • 内容摘要:本报告针对视频/电商等业务平台方在流量营销/线上线下活动营销中存在的“羊马牛”黑产演变情况,基于大数据无监督平台的反欺诈技术,提出腾讯云天御对抗黑产团伙的解决方案。

  • 嘉宾介绍:陈炳文(Bink Chen)博士,腾讯云天御流量风控业务负责人,主导多项基于大数据智能引擎信息系统,17年加入腾讯云,主导流量营销风控、活动营销风控等风控业务,发表十六篇学术论文,拥有4项发明专利。

2. 陈桂生 中国电子系统研究院信息化总体研究部

  • 报告题目:智能机器人需求理解与意图表达的元模型

  • 内容摘要:TBA

  • 嘉宾介绍:陈桂生,清华大学计算机系工学博士,中国电子系统研究院信息化总体研究部研究员,中国人工智能学会知识工程专委会理事,中国指挥与控制学会无人系统专委会理事。曾任中国人工智能学会副秘书长。陈桂生博士在人工智能与机器人技术领域长期从事理论研究与工程研究开发工作,在人工智能、智能交通、机器人传感器信息感知、网络传输、智能信息处理与决策、控制器及执行机构设计、人机交互设计,以及多智能车交互与协同等技术领域取得较好成果,拥有丰富的国家大型信息化项目需求分析、总体论证和设计经验,近年来参加的科研项目有:《机器人化工程机械研究》、《临场感技术》、《国家信息化水平测评指标体系研究》、《基于互联网海量信息的情报分析与处理需求论证》、《网络化数据挖掘》、《需求工程—对复杂系统的软件工程的基础研究》、《室外移动机器人多车交互协作关键技术研究》等,在高校讲授《不确定性人工智能》课程,对人工智能感知和认知过程中的双向认知云模型有深入的研究。

3. 陈小平 中国科学技术大学计算机学院

  • 报告题目:人工智能理论基础问题的新思考和新动向

  • 内容摘要:总结人工智能三次高潮产生的核心成果——暴力法和训练法,以及AlphaGo Zero对暴力法和训练法的融合与超越。分析当前人工智能发展的根本性瓶颈——不确定性问题,阐述不确定性给人工智能理论基础带来的挑战。介绍人工智能及理论基础研究在两个方向上的新动向——知识整合与融差操作。

  • 嘉宾介绍:陈小平博士,现任中国科学技术大学机器人实验室主任,机器人技术标准创新基地主任,计算机学院教授,中国人工智能学会AI伦理专委会主任,中国RoboCup委员会主席,国际RoboCup联合会理事。曾任2015世界人工智能联合大会机器人领域主席、2015和2008RoboCup机器人世界杯及学术大会主席。中科大“杰出研究”校长奖获得者,IEEE ROBIO’2016最佳大会论文等国际论文奖、世界人工智能联合大会最佳自主机器人奖和通用机器人技能奖、机器人世界杯12项世界冠军等团体奖获得者。

4. 戴彧虹 中国科学院数学与系统科学研究院

  • 报告题目:Training GANs with Centripetal Acceleration

  • 内容摘要:Training generative adversarial networks (GANs) often suffers from cyclic behaviors of iterates. Based on a simple intuition that the direction of centripetal acceleration of an object moving in uniform circular motion is toward the center of the circle, we present the Simultaneous Centripetal Acceleration (SCA) method and the Alternating Centripetal Acceleration (ACA) method to alleviate the cyclic behaviors. Under suitable conditions, gradient descent methods with either SCA or ACA are shown to be linearly convergent for bilinear games. Numerical experiments are conducted by applying ACA to existing gradientbased algorithms in a GAN setup scenario, which demonstrate the superiority of ACA.

  • 嘉宾介绍:戴彧虹,中国科学院数学与系统科学研究院院长助理、研究员、博士生导师。1992年毕业于北京理工大学;1992年中国科学院计算数学与科学工程计算研究所博士毕业后留所工作,先后担任助理研究员、副研究员、研究员、冯康首席研究员;2011年获国家杰出青年科学基金资助;2015年获得冯康科学计算奖;2017年获第十六届陈省身数学奖;2018年获首届萧树铁应用数学奖。戴彧虹主要从事计算数学、应用数学、运筹学人工智能的研究。

5. 董彬 北京大学北京国际数学研究中心

  • 报告题目:Mathematical Modeling in Image Restoration, Image Analysis and Beyond

  • 内容摘要:Image restoration, including image denoising, deblurring, inpainting, computed tomography, etc., is one of the most important areas in imaging science. In image restoration, wavelet frame based approach and PDE based approach (including variational models and PDE models) are two of the most successful approaches and are widely adopted in both academia and industry. Although the development of the two approaches took rather different paths, an intriguing and fundamental question is whether the two approaches are deeply connected. The main portion of this talk is based on a series of papers, where we established rigorous and generic connections between wavelet frame and PDE based approach. This includes connections of wavelet frame based approach to total variation model and the Mumford-Shah model. Furthermore, connections of wavelet frame shrinkage to a rather general form of nonlinear evolution PDEs are also established. Other than the establishment of the links between the two approaches, brand new models for both approaches are also discovered, which combine merits from both approaches, and thus outperform existing models in various applications in image restoration. Our theoretical studies also enable us to connect mathematical modeling and computations with deep learning. The connections not only can provide guidance to deep network design, which is a central task in deep learning, but also enable us to tackle challenging problems in applied and computation mathematics. In the end of my talk, I will present one of our recent works on bridging numerical differential equations with deep neural network design for PDE identification from observed dynamics data.

  • 嘉宾介绍:董彬,北京大学,北京国际数学研究中心长聘副教授、主任助理,北京大数据研究院深度学习实验室研究员、生物医学影像分析实验室副主任。主要研究领域为应用调和分析、优化方法、机器学习深度学习及其在图像和数据科学中的应用。在理论上,将图像领域独立发展近30年的两个数学分支(PDE/变分方法和小波方法)建立深刻的联系,改变了领域内对这两类方法的认识,拓宽了这两类方法的应用范畴。应用上,以数学理论为指导思想,为来源于医学影像、计算机视觉深度学习等领域中的重要问题提供行之有效的解决方案。董彬在包括《Journal of the American Mathematical Society》、《Applied and Computational Harmonic Analysis》、《SIAM系列期刊》、《Inverse Problems》、《ICML》在内的国际重要学术期刊和会议上发表论文50余篇,拥有2项美国专利,现任期刊《Inverse Problems and Imaging》编委。于2014年获得香港求是基金会的求是杰出青年学者奖,2015年入选中组部第十一批“千人计划”青年人才。

6. 范欣欣 网易大数据

  • 报告题目:数据平台的时序数据技术

  • 内容摘要:本报告就时序数据平台在大数据AI平台建设中主要应用场景,提出时序数据平台的核心系统及技术架构,重点分享时序数据库系统的功能特性和核心优化思路。

  • 嘉宾介绍:范欣欣,网易大数据技术专家,就职于网易研究院后台技术中心数据库技术组,专注于HBase的开发运维,热衷于MySQL等相关数据库技术。

7. 方斌 清华大学计算机系

  • 报告题目:机器人感知、操作与学习

  • 内容摘要:灵巧操作是机器人领域最具挑战技术之一。操作也是实现服务机器人多种任务的基本途径。报告围绕机器人感知、操作与学习三个方面展开。首先介绍机器人的各种感知手段,重点介绍视触力滑的多模态触觉感知装置和多模态信息融合的感知方法;接着介绍机器人的灵巧操作,重点介绍仿人灵巧手和软体手的操作;最后介绍机器人学习的研究现状,重点介绍机器人交互模仿的技能学习。

  • 嘉宾介绍:方斌,清华大学计算机系助理研究员。兼任中国人工智能学会认知系统与信息处理专委会秘书长。2017年清华计算机系博士后留校工作,主要研究方向是人工智能与机器人。承担或参与项目有科技部机器人专项、国家自然科学基金仪器专项、国家自然科学基金青年基金等。发表SCI/EI论文三十余篇,申请发明专利二十余项。研制的基于穿戴装置的机器人遥操作系统已在航天五院、大唐电信等多家应用,研制的仿人灵巧手应用于三星、航天五院等多家单位,曾被央视、北京卫视等多家媒体专访报道。

8. 冯超 滴滴AI Labs

  • 报告题目:A Review of Deep Reinforcement Learning: Implementing Distributed Frameworks and Overcoming Sparse Reward Challenges

  • 内容摘要:Deep reinforcement learning has received more and more attention and achieved breakthroughs in academic and industrial fields recently. Nowadays, deep neural network models already can beat human professional players in many games, such as Atari, Go, and even Dota (a multiplayer online battle arena game), with constrained environment. Reinforcement learning usually contains two major parts: 1. finding the state-action sequences that lead to the positive/negative rewards; 2. memorizing good decisions from the historical experience utilizing deep models with large scale training. Most of the work is enhancing the performance of these two parts. In this talk, recent developments of implementing distributed frameworks and overcoming sparse reward challenges will be reviewed, and some future work will be discussed.

  • 嘉宾介绍:冯超,现就职于滴滴出行AI Labs时空数据组,担任专家算法工程师,负责路径规划算法与图像、视频应用算法的研发工作,曾任小猿搜题拍照搜题算法负责人。著有书籍《强化学习精要》《深度学习轻松学》,个人的研究方向有计算机视觉,分布式机器学习框架和深度强化学习

9. 宫士敏 小米大数据

  • 报告题目:NLP中的移动搜索技术

  • 内容摘要:AI赋能和数据驱动使得小米互联网业务得到了持续的增长,也助推了搜索和推荐系统的发展。本报告就NLP技术在移动搜索场景下遇到的问题,提出相关性计算、查询分析和排序方面的算法设计与架构,并基于用户行为大数据,提升优化算法效果和用户体验。

  • 嘉宾介绍:宫士敏,小米大数据部算法团队Leader,带领团队构建了小米移动搜索算法体系。研究领域主要包括搜索引擎、机器学习推荐系统等。对搜索中的相关性计算、排序、NLP等相关技术有深刻理解,并对深度学习在搜索推荐领域应用有丰富的实践经验。毕业于中科院计算所,之前在搜狗搜索负责网页搜索算法相关工作。

10. 关海欣 云知声

  • 报告题目:远场语音交互中前端信号处理关键技术

  • 内容摘要:TBA

  • 嘉宾介绍:关海欣,北京云知声信息技术有限公司高级研发总监/资深技术专家,曾任3M Cogent北京研发中心高级研发经理/语音方向负责人,从事人工智能技术研究与产品开发10余年,于2010年获得声纹识别评测NIST SRE HASR1世界第一,2012年获得NIST SRE核心评测世界第三,2013年参与人脸识别NIST FRVT2013与真假指纹识别LivDet2013评测,分获世界第三与世界第二,现专注于远场语音交互中前端信号处理关键技术的研究与开发工作。

11. 胡翔宇 百度搜索

  • 报告题目:基于深度学习的识图搜索

  • 内容摘要:本报告结合百度下一代智能搜索的发展趋势和搜索业务的最新进展,融合传统CV与深度学习,应用CNN特征,构建千亿级别图片库和视觉索引,结合图像分类、细粒度识别、检索和大规模GPU 在线加速技术,给出识别万物的移动端深度学习图搜索系统,该系统实现千万级别 DAU、过亿的 PV 访问量。

  • 嘉宾介绍:胡翔宇,百度搜索公司资深策略工程师,AI领域(图像识别,视觉检索,视频理解,大规模深度学习,LTR)的资深专家。目前正负责百度下一代视觉搜索的研发工作,通过最新的AI 技术将百亿级线下信息数据化,构建千亿级行业知识库和多模态的索引,从文本检索升级到语义索引,用图像/视频/XR 技术,升级搜索引擎的 I/O 交互及索引内核,打造新的AI搜索体验,让搜索无处不在。

12. 胡晓光 百度深度学习技术平台部

  • 报告题目:PaddlePaddle核心技术

  • 内容摘要:本报告将分享PaddlePaddle 总体架构;深入框架设计原理及实现;PaddlePaddle 新特性,移动端部署、并行等;结合百度 AI 实践,NLP、图像等应用。

  • 嘉宾介绍:胡晓光,百度深度学习技术平台部主任工程师,多年深度学习算法实践经验,2015 年带领团队上线全球首个基于深度学习的在线翻译引擎;现负责 PaddlePaddle 模型应用,致力于打造最好用的深度学习平台。

13. 黄智生 荷兰阿姆斯特丹自由大学人工智能

  • 报告题目:智能机器人与网络自杀监控预警

  • 内容摘要:青少年自杀已经成为社会普遍关注的重要问题之一。自杀是15岁到34岁青少年人群死亡的主要原因。据估计15到24岁青少年中120万人受到抑郁症折磨,大学生中抑郁率高达23.8%。抑郁症是自杀死亡的主要原因。许多年轻人在自杀之前通过网络媒体表达了各种自杀情绪和愿望,这为采用人工智能大数据技术对网络媒体作分析并进行自杀救助提供了可能性。我们开发的网络智能机器人采用知识图谱技术,每天监控对应的网络媒体并发布自杀监控通报。我们组织的“树洞行动救援团”根据监控通报采取自杀救助行动。自2018年7月起,我们已经对数以百计的人提供自杀救助,暂时缓解了她们的自杀行为。我们将介绍构建网络智能机器人的基本技术,并阐述这种智能机器人如何用于发现自杀人群并发布对应的监控通报。

  • 嘉宾介绍: 黄智生博士是荷兰阿姆斯特丹自由大学人工智能系终身教授, 出版了《海量语义数据处理-平台,技术,与应用》、《生物医学语义技术》等教材,发表过论文论著超过二百篇, 担任超过一百个国际学术会议的程序委员会委员,超过二十个国际会议的联合主席,担任六个国际学术刊物的编委,特约主编或特约编委。主持欧盟第七框架重大项目LarKC中推理工作组的工作。主持欧盟第七框架智慧医疗重大项目EURECA中基于语义技术的临床试验系统 SemanticCT的开发;主持了基于语义技术的抗菌药物合理用药系统SeSRUA的开发。他参与开发的E-Culture项目在2006年世界语义万维网技术挑战赛上获得冠军。作为第一作者获得2014世界健康信息技术学术年会(HealthInfo2014)最佳论文奖。他所开发的网络自杀监控机器人具有很高的科学价值,已经取得明显的社会效益。他所发起的“树洞行动救援行动”已经成功地挽救数以百计的生命。这些事迹已经被科技日报、健康界、扬子晚报、和北京青年报等媒体广泛报导。

14. 江会星 美团点评搜索与NLP部

  • 报告题目:对话理解技术

  • 内容摘要:智能客服是一种使用自然语言与用户交互的人工智能系统,通过分析用户意图以人性化方式与用户沟通,向用户提供客户服务。本报告首先给出美团智能客服的对话交互设计框架,然后详细分析意图挖掘、意图理解、情绪识别、对话管理等的机器学习算法核心技术及其效果。

  • 嘉宾介绍:江会星,博士,美团点评搜索与NLP部NLP中心研究员,智能客服团队负责人,主要负责美团智能客服业务及智能客服平台的建设。曾在阿里达摩院语音实验室从事智能语音对话交互方向研究,主要负责主导的产品有斑马智行语音交互系统、YunOS语音助理等。

15. 姜忠鼎 复旦大学计算机学院

  • 报告题目:基于多模态交互的增强型VR视频协同式观看系统

  • 内容摘要:VR视频通常指立体全景视频,增强型VR视频使用弹幕、问答、语音以及辅助视频流等媒体素材对VR视频进行增强,提升视频重要区域的视觉清晰度,丰富VR视频包含的视听信息。针对本地文件、直播和点播视频,提出VR视频增强的若干关键技术,构建多人同时使用的VR视频观看系统。该系统实现多个观看用户的播放时间同步、视角同步并降低用户眩晕感。针对PC播放终端和移动播放终端,综合语音、手势和手柄等多模态交互技术实现系统的人机界面。本系统可提升基于VR视频的教育培训、事件直播和点播等应用的用户体验。

  • 嘉宾介绍:姜忠鼎博士现为复旦大学计算机学院副教授,毕业于浙江大学计算机科学与工程系CAD&CG国家重点实验室,获得学士和博士学位,2018年入选首届高校计算机专业优秀教师奖励计划。目前研究方向为虚拟现实/增强现实,具体包括基于多投影的集群式VR系统开发工具、基于VR头盔的教育培训与仿真系统、沉浸式大数据分析以及增强现实沙盘模拟等。研究工作发表于IEEE TVCG等一流国际期刊和CVPR等顶尖国际会议。研究成果成功应用于2010年上海世博会、新一代CRH2高铁列车研制以及AR沙盘推演等重要系统。

16. 李衡宇 小马智行

  • 报告题目:自动驾驶从0到1之路

  • 内容摘要:总结分析自动驾驶实现从0到1过程中所面临的技术挑战,以及小马智行所采取的路径:如何在短时间积累高效的数据,并实现模型的快速优化;如何打造一个最安全的自动驾驶系统,即不单单是保证各系统模块的表现和高度稳定性,更是持续的验证系统的可靠性和扩展性;在单车智能已得到验证的基础上,如何实现规模化复制。

  • 嘉宾介绍: 李衡宇,小马智行联合创始人、北京研发中心负责人。前百度广告搜索部和自动驾驶事业部资深工程师,具有10年设计和开发大规模、高可靠和高稳定性系统的工作经验;曾作为技术负责人主导开发了百度广告预算控制系统,并获2013年“百度最高奖”(百万美元大奖);四川大学电子信息学硕士和学士学位。

17. 李杰 快手

  • 报告提目:基于深度学习的语音识别声学建模

  • 内容摘要:本报告将以2011年提出的上下文相关-深度神经网络-隐马尔可夫框架为标志,基于深度学习的语音识别技术设计一个“又快又好” 的声学模型,具备下文语境的门控循环单元模型(mGRUIP-Ctx)。声学模型中,有效建模下文语境是保证模型性能的一大关键点。但“建模下文信息”与 “低延迟”经常会相互矛盾。我们提出的mGRUIP-Ctx模型在两者之间找到了比较好的平衡点。该模型性能优异且计算高效。二是基于SpeechTransformer的端到端语音识别技术。SpeechTransformer以机器翻译中的Transformer为基础,在大规模语音识别任务上在不使用任何语言模型的条件下,性能可以超过基于Lattice-Free MMI的语音识别系统。

  • 嘉宾介绍:李杰,博士毕业于中国科学院自动化研究所,模式识别与智能系统专业,研究方向为基于深度学习的声学模型建模。在国际主流语音会议,包括ICASSP, Interspeech, ISCSLP上发表论文12篇。之前曾于2016年加入微软(亚洲)互联网工程院,任语音技术研究员。2017年底加入快手,从事语音识别相关算法研究和产品落地,目前的工作重点在于短视频领域内的声学模型建模,所研发的声学模型在快手多个产品线中落地,日均处理语音请求数千万条。

18. 李亚楠 阿里大文娱

  • 报告题目:通用对话系统

  • 内容摘要:本报告重点分析通用信息服务领域的对话交互技术中的难点,包括对话理解、对话管理、任务型对话、智能问答、通用聊天等任务。

  • 嘉宾介绍:李亚楠,中科院计算所博士,先后工作于腾讯微软百度、阿里,研究方向为信息检索、自然语言处理、推荐。目前负责阿里神马智能对话,探索下一代AI搜索技术,打造更加自然的对话问答系统,提供更加智能的通用信息服务能力,服务天猫精灵、阿里云IoT、车载OS、优酷电视、蚂蚁客服、UC头条、夸克智能浏览器等多个阿里重要业务。基于国内第二大通用搜索引擎和亿级用户数据,我们拥有深厚的技术沉淀和海量的日志数据。

19. 李旸 深觉智能

  • 报告题目:通用知识表达框架的数学基础

  • 内容摘要:知识体系是智能系统中极为重要的一环,而有关传统理论研究虽然历史悠久,但大多都是从哲学层面进行定义和考虑,还停留在基于文字的层面。目前人工智能的现状是基于数字和符号的计算,本talk探讨如何构建通用知识表达框架的数学基础,使知识体系能够被智能系统有机和有效利用,进而推动人工智能的发展。

  • 嘉宾介绍:李旸博士,本科毕业于清华大学电子工程系。 后在美国伊利诺伊大学香槟分校智能人机互动实验室,师从计算机视觉大师Thomas Huang 和人机对话之父Stephen E. Levinson教授,并获得自然语言理解领域的电子工程博士。 李旸博士在美国有多年的创业高科技企业研发带队的经验,从事过多媒体压缩和传输,基于区块链的分布式云存储系统等的算法研发和产品开发工作,拥有3项美国技术发明专利,多项技术创新。李旸博士在人工智能理论研究方面独树一帜,把物理哲学思想引入人工智能领域,拥有一套未公开的完整的人工智能核心理论,并重点研发人工智能理论在自然语义理解和智能对话系统中的应用。 李旸博士目前在国内创立了上海深觉智能科技有限公司,带领团队致力于研发通用人工智能引擎的核心算法,并把这一算法用于重点开发智能对话产品。李旸博士目前重点研究知识学的基础理论,通用知识表达框架,以及知识的自动生成方法。

20. 李子晋 中国音乐学院

  • 报告题目:音乐人工智能:发展与展望

  • 内容摘要:近年来音乐与人工智能结合发展迅速,本报告将概述人工智能在音乐创作制作、音乐表演、音乐教育、音乐研究等的应用情况,分类总结歌声信息处理、音乐处理、乐器识别等任务中涉及的声学技术、认知感知信号处理、声音合成技术等概念、原理、应用、基本技术框架,并展望其未来发展趋势。

  • 嘉宾介绍:李子晋,中国音乐学院音乐科技专业副教授,音乐声学博士,麦吉尔大学国家公派访问学者。长期从事音乐科技相关科研与教学活动。发表期刊及会议论文近30篇,出版专著1部,获国家专利4项,主持和参与国家科技部基础项目《中国传统乐器声学测量及频谱分析》、国家艺术基金《中国传统乐器数字博物馆传播平台建设》、北京市社科基金《西山文化小镇声音景观设计研究》等10余项项目。参与组织全国乐器学研讨会、全国计算机声音与音乐技术会议(CSMT)中国传统音乐技术论坛、音乐人工智能发展研讨会等10余场学术会议及论坛。

21. 林会杰 网易有道

  • 报告题目:NLP与智慧教育

  • 内容摘要:本报告基于有道智慧教育系统AI技术,包括作业批改、自适应学习、口语评测,探讨计算机视觉、语音、自然语言处理等相关技术在教育领域中的应用。

  • 嘉宾介绍:林会杰,2011年和2016年在清华大学获得计算机学士和博士学位,主要研究兴趣包括情感计算、人机语音交互及移动计算。现任网易有道技术总监,负责有道语言翻译及教育类工具产品和智能硬件产品研发工作。

22. 刘青山 南京信息工程大学

  • 报告题目:视觉特征学习

  • 内容摘要:机器视觉的目标就是让机器能像人眼视觉系统一样自动‘’看懂‘’外部环境,因此是人工智能领域的一个重要研究方向。本报告将介绍机器视觉研究中特征学习方面的一些最新进展及其面临的问题,并重点从高维视觉特征表达和深度视觉特征学习两个方面,介绍我们团队近年来在目标检测、遥感图像分类等方面的研究进展。

  • 嘉宾介绍:刘青山博士现任南京信息工程大学教授、博导。2003年4月毕业于中科院自动化所模式识别国家重点实验室获博士学位,随后留实验室工作,2006年4月赴美国Rutgers大学访问、工作。2011年9月加盟南京信息工程大学。先后入选江苏省特聘教授、江苏省双创团队领军人才、江苏省优秀教育工作者、科技部中青年创新领军人才等。是江苏省人工智能学会副理事长、中国自动化学会模式识别与机器智能专委会副主任、中国计算机学会多媒体专委会和计算机视觉专委会常务委员等。主要研究方向为图像与视频分析、计算机视觉、和机器学习。先后主持承担国家杰出青年基金项目,国家自然基金重点项目、面上项目、江苏省杰出青年基金等。先后获2016年度教育部自然科学二等奖、2017年江苏省教学成果二等奖、2018年江苏省高校自然科学一等奖、和2018年中国电子学会自然科学一等奖等。

23. 刘武 京东AI研究院

  • 报告题目:Empowering Retailing Experiences with Computer Vision

  • 内容摘要:作为人工智能的眼睛,计算机视觉研究的发展正在对我们的生活和生产产生巨大的影响,其中包括整个零售业态。京东提出了“零售即服务”的概念,将零售定义为内容与交互的自然结合。在本次报告将展示京东AI如何通过研发计算机视觉技术,更好地感知和了解顾客、产品以及零售场景,从而对顾客提供更加自然、更个性化的交互服务,推动整个零售业的发展。

  • 嘉宾介绍:刘武,京东AI研究院高级研究员,ACM未来计算协会创始委员,中科院计算所博士。研究方向为多媒体与计算机视觉,在IEEE CVPR、ACM MM、IJCAI、AAAI、UBICOMP等一流国际会议和期刊上发表文章30余篇。获得过中国科学院优秀博士学位论文奖、中国科学院院长特别奖、国际会议IEEE ICME 2016 Best Student Paper、京东集团AI平台与研究部技术创新奖等,并入选2017年微软铸星计划。在JD率领团队获得过IEEE CVPR 2018全球人体姿态估计挑战赛两个任务的冠军。曾担任SCI期刊MTAP、MVA客邀编辑,国际会议ICME 2019 Web Chair, BIGMM 2018 Publicity Chairs,ICIP 2017、PCM 2016等分会主席。

24. 吕超 北京理工大学智能车辆研究所

  • 报告题目:智能车辆类人驾驶行为学习与建模

  • 内容摘要:随着智能系统理论和技术的快速发展,具有自主学习能力,能够学习人类驾驶经验和驾驶行为的智能车辆开始成为学者和公众共同关注的焦点。然而,现有的驾驶行为学习方法旨在通过模仿到达学习的目的,对数据依赖性强,不能有效地将已有的知识和经验迁移到新任务的学习中,具有学习效率低、泛化能力差的缺点,限制了其在复杂动态驾驶场景中的应用。本次报告将介绍一种针对智能车辆的驾驶行为建模与学习方法。该方法基于迁移学习(Transfer Learning),可以实现不同驾驶任务与驾驶员之间的知识迁移,大大提高了系统的学习效率和泛化能力。

  • 嘉宾介绍:吕超,北京理工大学智能车辆研究所讲师,2015年于英国利兹大学获博士学位。主要从事强化学习、驾驶行为建模、智能控制系统、智能车辆与智能交通系统的研究。主持国家自然基金项目和上汽联合基金重点项目,参与了包括欧盟COST组织项目,国家863课题等在内的多项国际和国内项目。发表SCI /EI收录论文20余篇 ,对深度学习强化学习在智能交通系统中的应用有丰富经验。所在团队为无人车技术工业和信息化部重点实验室和无人平台科技创新团队。

25. 彭佩玺 中国科学院自动化研究所

  • 报告题目:Unsupervised Cross-dataset Transfer Learning for Person Re-Identification

  • 内容摘要:The problem of Person Re-identification (ReID) is to associate pedestrians captured from multiple non-overlapping cameras. It has many important applications in video surveillance such as person search or cross-camera tracking. Most existing person ReID approaches follow a supervised learning framework, in which a large number of labelled matching pairs are required for training. This severely limits their scalability in real-world applications. To overcome this limitation, we introduce a novel unsupervised cross-dataset transfer learning method to person ReID, which aims to transfer discriminative representations from the labeled source dataset collected from elsewhere to the unlabeled target dataset. The experimental results on several benchmarks demonstrate the proposed method can achieve state-of-the-art performances.

  • 嘉宾介绍:Peixi Peng received the B.S. degree of Mathematics and Applied Mathematics from Xi’an Jiaotong University in 2010. He received the ph.D. degree of Computer Applied Technology from National Engineering Laboratory for Video Technology of Peking University in 2017. At present, he is an assistant researcher in the Institute of Automation of the Chinese Academy of Sciences. His research interests include the machine learning and computer vision. As the first author, he has published more than 5 papers in the top international conferences and journals. Also, he was ranked as one of the best performers in NIST TRECVID SED tasks and IEEE PETS.

26. 彭 鹏 启元世界

  • 报告题目:启元决策智能平台与多智能体机器人竞赛

  • 内容摘要:近年来,以深度强化学习为代表的新一代的智能决策技术,在围棋、Dota2以及星际争霸、机器人等多个行业先后取得突破。但是,深度强化学习也由于其探索效率低、训练收敛性差以及复现难度大等问题饱受质疑。启元世界历时两年搭建的支持单智能体和多智能体决策训练平台,可同时训练上百个决策智能体,具备配合智能资源分配以及自动调参的元学习方法,使得智能体的能力Skill能稳定提升与叠加。本报告将以启元世界参加2018年NeuraIPS 的AI for prosthetics以及Pommerman比赛中所用的技术为例,介绍启元世界智能决策平台中包括持续学习(Continual Learning)以及多智能体博弈优化 (Multiagent Policy Optimization)等多项核心技术。

  • 嘉宾介绍:彭鹏,香港科技大学博士,前阿里巴巴算法专家,目前为启元世界研究科学家,专注于深度强化学习和智能决策的研究与应用。2016年,作为国内最早使用深度强化学习研究星际争霸的阿里认知计算实验室核心成员,与UCL合作发表BiCNet,受到DeepMind、牛津大学等国内外同行的引用与高度评价。

27. 齐路 数美科技

  • 报告题目:TBA

  • 内容摘要:TBA

  • 嘉宾介绍:TBA

28. 马利庄 上海交通大学人工智能研究院、华东师范大学计算机与软件学院

  • 报告题目:计算机视觉最新进展

  • 内容摘要:由数字化技术催生互联网、电子商务,再催生大数据云计算,从而催生深度学习技术、形成风起云涌的人工智能理论与应用。本报告从产学研创新合作的角度阐释了深度学习技术的理论突破,以及人工智能技术在语音技术、人脸识别、图像识别方面应用的重大突破,重点以计算机视觉相关的人脸识别与图像识别为例,展示人工智能技术无比广阔的应用前景,人工智能润物无声地渗透到我们生活的每个角落、改变社会的演变方式。

  • 嘉宾介绍: 马利庄,理学博士,博士生导师,国家杰出青年基金获得者,华东师范大学特聘教授、多媒体与视觉实验室主任,上海交通大学特聘教授、上海交通大学人工智能研究院副院长、上海中医药大学信息科学与技术中心主任(兼)、上海交大-商汤科技联合“深度学习计算机视觉”实验室主任、上海深度人工智能联合创新中心主任、中国人工智能学会理事、“智能CAD与数字艺术专委会”副主任、中国图像图形学会理事、“动画与数字娱乐专委会”主任;中国青年科技奖、国家教育部科技进步奖获得者;国家“百千万人才工程”(第一、二层次)首批人选。 

29. 钱若函 百度凤巢

  • 报告题目:大规模广告拍卖机制设计

  • 内容摘要:广告拍卖机制设计是大规模在线广告系统的基石,其目标是通过制定广告分配、计费策略,解决在多智能体环境中的多目标优化问题。本次报告剖析拍卖机制设计的一般问题和行业应用挑战,给出拍卖机制设计在在线广告拍卖领域的关键解决方案。

  • 嘉宾介绍:钱若函,百度凤巢拍卖机制技术负责人。主要研究领域包括算法博弈论、机制设计、深度学习强化学习等。推动凤巢从GSP机制升级到序列拍卖机制,实现凤巢拍卖的页面级别激励兼容和全局优化;推动实现凤巢基于深度强化学习的自动拍卖机制设计,解决复杂拍卖场景下多目标优化的机制问题。

30. 秦曾昌 Keep

  • 报告题目:运动科技与人工智能

  • 内容摘要:在无线互联网经济发达的时代,可以不离开沙发而触摸到整个世界。我们可以看电影、电视和娱乐节目,可以秒杀很多商品,可以在游戏的世界里面驰骋纵横,也可以打车和点外卖。科技的发展某种层面只关心人们的大脑,然而实际上人们的躯体与大脑一样重要,只有有了健康的体魄才有人的一切。 本报告将基于机器学习数据挖掘算法讨论Keep的运动科技与用户体验。

  • 嘉宾介绍:秦曾昌,Keep首席科学家,人工智能研究院院长;英国布里斯托(Bristol)大学硕士、博士;美国加州大学伯克利分校 (UC Berkeley) 博士后。曾在英国牛津 (Oxford) 大学与美国卡内基梅隆大学 (CMU) 做访问学者。主要研究方向为人工智能,曾在包括机器学习、不确定性建模、自然语言处理、多媒体检索、计算博弈与医疗影像分析等领域出版英文专著1本、论文集2本与专业论文近100篇,引用过千次。兼任果壳网科学顾问,曾参与我国第一次太空授课专家团。是国内科技创新大赛、机器人大赛、小小科学家等青少年科技创新比赛评委,出版翻译科普著作2本。

31. 邱从贤 阿里巴巴

  • 报告题目:Apache Flink赋能机器学习

  • 内容摘要:本报告基于Apache Flink赋能机器学习,包括特征提取、行为识别、模型训练、迭代计算、实时预测等。

  • 嘉宾介绍:邱从贤,Apache Flink Contributor,向社区贡献了状态数据多线程上传和下载的功能,序列化器迁移等相关代码,正在对状态存储做重大重构。目前任职阿里巴巴高级工程师,主要从事 Flink 中状态管理相关工作。

32. 宋士吉 清华大学自动化系

  • 报告题目:基于强化学习的深海机器人水下作业与运动控制方法

  • 内容摘要:深海机器人一直以来都是深海勘探的核心工具之一,搭配多种传感设备和作业工具可代替人完成危险且复杂的水下作业。但是,水下复杂的水动力学环境及感知环境给深海机器人的自主作业带来了巨大的挑战,为本领域研究提供了很多热点方向。本报告结合近几年来强化学习方法及其各应用领域取得的主要进展,重点阐述强化学习在深海机器人水下作业和运动控制两个领域的理论及应用成果,主要包括:(1)在水下机器人动力学模型缺失的条件下,基于强化学习方法的精准运动控制。(2)在递归神经网络和机器人好奇心机制下,基于强化学习方法的热液羽状流的追踪。(3)在复杂感知输入的水下作业环境下,基于分层强化学习结构的水下机器人作业控制及其应用。

  • 嘉宾介绍:宋士吉,清华大学自动化系教授、博士生导师。1996年获得哈尔滨工业大学基础数学专业博士学位。1996年至2000年,分别在中国海洋大学、东南大学两次完成博士后研究。长期致力于复杂生产线智能优化与调度方法、鲁棒随机分层优化建模与分析求解方法、机器学习理论方法及其应用等方向研究。担任IEEE Transactions on Systems, Man, and Cybernetics: Systems编委,国际期刊The Scientific World Journal: Operations Research编委;曾任《中国科学-信息科学》与《自动化学报》等期刊编委。在国内外重要学术期刊会议发表论文240余篇,其中IEEE Transactions 系列期刊长文、国内外著名期刊SCI检索论文120余篇,其中高被引论文5篇;论文在Web of Science中被他引超过1600次,已授权或申请发明专利22项。近五年来,主持国家自然科学基金钢铁联合基金重点项目、重大科学仪器研制项目、面上项目、科技部863项目、教育部博士点基金优先发展主题、中国大洋协会信息系统项目累计20余项。获得2018年中国人工智能学会自然科学一等奖、2016年教育部高等学校自然科学二等奖奖、2017年中国自动化学会教学成果一等奖。获得2006年江苏省自然科学一等奖、2007年教育部高等学校自然科学二等奖。

33. 宋双永 阿里小蜜

  • 报告题目:阿里小蜜中的情绪回复能力

  • 内容摘要:情感机器人,即用人工方法和技术赋予机器人以人类式的情感,使之具有表达、识别和理解喜乐哀怒,模仿、延伸和扩展人的情感的能力。同时,情绪理解能力和情绪回复能力是机器人在类人能力上的重要体现。本报告针对客户情绪安抚、情绪生成式语聊和基于情绪分析的客服服务质检,提出阿里小蜜的情绪回复能力解决方案。

  • 嘉宾介绍:宋双永,阿里巴巴小蜜情感语聊算法负责人,智能服务事业部算法专家,致力于智能对话中的情绪回复能力以及开放域语聊能力的算法研究和业务场景落地,在机器学习自然语言处理领域积累了多年的实战经验,发表了多篇学术文章和专利。

34. 孙立喆 宜人贷

  • 报告题目:数据服务平台建设

  • 内容摘要:本报告针对数据服务平台建设过程中的困难,通过搭建关键功能特性,建立宜人贷数据服务平台。

  • 嘉宾介绍:孙立喆,墨尔本皇家理工大学硕士,长期大数据平台建设以及数据工程等相关工作,目前就职于宜人贷,数据架构师,负责宜人贷数据服务平台的搭建工作。

35. 孙鑫伟 微软亚洲研究院

  • 报告题目:Generalized Split LBI and its Applications

  • 内容摘要:Abstract. In this talk, I will introduce a novel algorithm which aims to recover the signal with structural

  • sparsity under generalized linear model. It’s the combination of variable splitting and Linearized Bregman Iteration and can work with general loss function, we hence call it Generalized Split LBI (GSplit LBI). It’s proved to be equivalent to Mirror Descent Algorithm with specifically designed Bregman Distance. Rather than lasso which should pre-set a grid of regularization parameters, it can return a regularization solution path. In addition to such a simplicity, a path theory of model selection consistency can be ensured equipped with an early stopping and under weaker irrepresentable condition compared with generalized lasso. Furthermore, some l2 error bounds with Minimax Optimal Rate will also be introduced. Finally, I will present the applications of the proposed algorithm onto Alzheimer’s Disease and few-shot learning.

  • 嘉宾介绍:Xinwei Sun, Associate Researcher in Microsoft Research Asia. He received Phd from Peking University. During PhD, his research topics mainly focus on features selection in high dimensional data, statistical machine learning, with applications on medical imaging analysis, zero-shot learning, partial order ranking and deep learning. Recently, he is interested in applying statistics and optimization to theoretically understand the generalization power of existing deep learning models (e.g. CNN, ResNet and DenseNet). Such an understanding can provide insight for the development of new models, e.g. the compression of deep learning models, i.e., the propose of sparsity model with comparable predictive accuracy, reachability analysis, automatically tuning of hyper-parameters in deep learning models, etc.

36. 汪镭 同济大学电子与信息学院

  • 报告题目:算法作曲中的智能体验

  • 内容摘要:随着计算机的出现,计算机算法作曲应运而生。同样,算法作曲也是一系列的计算规则的集合,而目标则是将多个音乐片段加以合理组合,形成一个有机整体,给人以乐曲的美妙感受。算法作曲的最终目的,是试图使用某个形式化的过程,尽量使在当前计算平台的有限艺术能力条件下,利用其巨大的计算执行力,使进行音乐创作时的复杂人为介入程度达到最小,专注于艺术性的创作进程。目前在算法作曲领域的主要流行技术有:马尔科夫转换表、人工神经网络、音乐计算文法、遗传算法和随机过程等,各算法都有其自身的优点和问题。目前各类算法作曲主要存在的问题包括:音乐创作的风格问题替代;音乐知识的表达问题替代;创造性和人机交互问题实现;音乐作品的主客观评价问题等。我们针对以上问题,设计了一种新型的智能作曲系统,并通过仿真验证了该系统的可行性。首先,总结了自算法作曲诞生以来的典型作曲算法研究现状。分析典型作曲算法的优势与缺点。综合现有方法,给出了一种新型智能作曲系统的设计依据与总体框架模式。其次,基于隐马尔科夫模型的音乐知识表达模型构造及分析。总结了现有马尔科夫作曲算法的不足。基于隐马尔科夫模型,构建新型音乐结构学习与创作模 型,给出了参数训练过程。设计了基于隐马尔科夫模型的新型作曲算法。第三,回顾分析了算法作曲领域中对音乐评价的主流方法。给出了一种新颖的基于朴素贝叶斯分类的音乐评价方法。通过学习样本的数字分布特征,训练一个朴素贝叶斯分类器,根据分类结果,为待评价乐曲赋予一个量化的适应度函数值,减少作曲系统的人工参与程度。第四,设计基于交互式遗传算法的作品优化算法。以音乐合理性与用户需求为目标,构造新型的作品评价方法。利用交互式遗传算法对生成作品进行优化,使生成的作品更加符合音乐合理性,并可满足用户的个性需求,给出整个智能作曲系统框架,并用仿真实验验证该系统学习数据样本的有效性,生成符合音乐和理性知识,并满足用户需求的音乐作品。

  • 嘉宾介绍:汪镭,同济大学电子与信息学院教授,博士生导师,现任上海市科协委员会委员,国际电气与电子工程师学会(IEEE)上海分会副主席,中国人工智能学会理事兼自然计算及数字智能城市专业委员会秘书长,上海市人工智能学会理事兼秘书长,上海市微型电脑及应用学会理事兼副秘书长,上海市思维科学学会理事,中国自动化学会智能自动化专业委员会委员。

37. 王晓博 阿里大文娱

  • 报告题目:多模态视频分析技术研究

  • 内容摘要:TBA

  • 嘉宾介绍:王晓博,北京航空航天大学计算机学院数据挖掘方向博士。先后在百度搜狗商务搜索部门从事算法策略研发工作。2015年加入阿里组建猜你喜欢算法团队,将猜你喜欢打造为手淘第一大导购场景,成为淘宝平台导购流量分发的核心入口。2018年起负责优酷算法中心,组建认知实验室,推出了多模态搜索推荐引擎、视频理解与智能生成平台等系列产品。主要研究方向为大规模分布式机器学习算法、多模态交互搜索推荐系统、算法博弈论

38. 韦春阳 Hulu

  • 报告题目: 视频广告算法技术

  • 内容摘要:Hulu是一家美国的提供专业视频点播与直播的服务平台,商业广告是Hulu的重要变现手段之一。视频网站中的广告以合约担保式、品牌类广告为主,本报告运用机器学习人工智能技术,设计Hulu广告系统解决方案,包括精准广告定向、广告流量匹配、广告库存预估等,帮助广告业务更加高效的运转。

  • 嘉宾介绍:2012年从北京大学硕士毕业后加入Hulu,目前担任智能广告算法团队负责人。有6年的计算广告领域的从业经验,致力于利用机器学习人工智能技术来推动Hulu广告业务的发展,负责包括精准广告定向、广告流量匹配、广告库存预估、广告转化率优化等项目。

39. 魏雅文 小马智行

  • 报告题目:自动驾驶研发中的数据潜能挖掘

  • 内容摘要:TBA

  • 嘉宾介绍:魏雅文,小马智行数据总监。清华大学电子工程系学士,爱荷华州立大学计算机工程博士。毕业后在加州领英就职七年,是广告组的初创成员,担任构架师和工程项目lead, 领导并成功交付了多个大型工程项目,包括广告多币种,广告国际化,广告索引和服务,广告定位,商业帐户,广告审核,广告跟踪,预算控制,欺诈预防,客户服务工具,Feed流赞助内容,广告渲染引擎,和视频广告等等,为LinkedIn广告业务贡献了巨额收入。 后来加入Uber,负责实时调度部门多个工程团队,连接数乘客司机并建立可扩展性平台以支持Uber的多种商业业务。于2018年加入小马智行并负责数据团队,来解决无人车大数据带来的各种挑战。

40. 吴焦苏 中国科学院人工智能联盟标准组

  • 报告题目:Harmonic Gamedynamics

  • 内容摘要:TBA

  • 嘉宾介绍:John J.S. Wu is a member of Ethical Standards Group of Artificial Intelligence Alliance of Chinese Academy of Sciences (AIACAS) and an expert of “Artificial Intelligence Ethics” research program of the Academic Divisions of the Chinese Academy of Sciences (CASAD). His current research interests focus on Gamedynamics---an innovative area of mathematical foundation of artificial intelligence. Inspired by John von Neumann and Robert Aumann, he has been developing a general theoretical framework of the Strategic Correlativity Principle(SCP) and Graceful AI Theory over recent seventeen years. In addition to more than 30 articles and working papers, he is co-author of four books. His papers were cited by the scientists from Google,  Stanford University, Cornell University, Stockholm University, etc. He was an invited speaker and/or a keynote speaker of many conferences. He is a program committee member and also organized and/or co-organized a serial of top academic conferences. He serves as a member or council member of many scientific organizations.

41. 吴阳平 阿里云

  • 报告题目:HBase X-Pack赋能AI平台

  • 内容摘要:随着互联网的快速发展,产生了多种业务场景,这些业务场景需要多种数据库存储不同的数据,比如KV数据、时序数据、图数据以及时空数据等。维护数据库维护成本极高,因此本报告探索阿里云HBase X-Pack解决多种数据存储问题,赋能AI平台。

  • 嘉宾介绍:吴阳平,阿里云HBase X-Pack 首席架构师,中国HBase 技术社区负责人。多年大数据经验,对Hadoop、Spark、HBase等技术非常感兴趣。过往记忆大数据技术博客(https://www.iteblog.com/)博主。

42. 夏颉 阿里大文娱

  • 报告题目:流量效率最优化—大规模视频推荐在线决策算法

  • 内容摘要:在优酷的大规模视频推荐场景中,我们往往面临着一个基本问题:如何针对新入内容(长视频和短视频)进行有效地内容冷启动,提高宣发质量,实现流量效率最大化。针对这个问题,我们建立了优酷在线决策流量优化平台,一方面能够根据运营诉求实现了多场景多目标流量调控,满足新热大剧从宣发->分发不同阶段的不用运营诉求;另一方面,我们实现了海量短视频的高效率内容冷启动,保证了新产生内容快速透出的同时,大幅提升了线上流量的使用效率。

  • 嘉宾介绍:夏颉,浙江大学计算机学院CAD&CG国家重点实验室博士,发表国际顶级会议/期刊论文20余篇,担任NIPS、ICML、AAAI、IJCAI、CVPR等国际顶级学术会议程序委员会委员,及TPAMI、TIP、TNNLS、TKDE和TMM等国际顶级期刊审稿人;首届百度奖学金获奖者之一,先后在百度研究院和滴滴研究院担任大规模机器学习算法研发工作,2017年底加入阿里巴巴,当前主要负责优酷智能视频推荐和内容理解业务。

43. 谢广明 北京大学工学院

  • 报告题目:深度强化学习在仿生机器鱼的运动控制算法设计: 一个初步尝试

  • 内容摘要:仿生机器鱼以鱼类为仿生对象,在一定程度上复现了鱼类机动灵活的水中运动能力。但如何设计其运动控制算法,让其按照事先设定的意图运动,至今没有很好的解决方案。原因主要有两点:一是机器鱼自身的精确的动力学模型难以获得,二是始终存在复杂时变的流体环境干扰。我们尝试提出一套深度强化学习结合计算流体力学仿真的运动控制算法设计方案,以水下仿生机器人的路径跟踪问题作为典型案例,对所提出的方法进行有效性验证。

  • 嘉宾介绍:谢广明 北京大学工学院教授、博士生导师。先后主持包括重点项目在内的多项国家自然科学基金项目,参与多项973、863项目。先后获得国家自然科学奖二等奖、教育部自然科学奖一等奖等多项奖励。先后担任中国自动化学会机器人竞赛工作委员会副主任,中国系统仿真学会智能物联系统建模与仿真专业委员会委员、中国生产力促进协会服务机器人专业委员会委员等。是《Scientific Reports》等多个国际国内的编委。研究兴趣包括复杂系统动力学与控制,智能仿生机器人与多机器人协作等,发表SCI论文百余篇;2014-2018连续入围爱斯维尔中国高被引学者;获得二十余项发明专利。在科研之余,积极促进机器人产学研工作,是国际水中机器人大赛的创立者,国际水中机器人联盟主席,曾接受中央电视台《新闻联播》的采访报道,多次被包括中央电视台、北京电视台在内的各种媒体专访报道。

44. 熊超 滴滴AI Labs

  • 报告题目:出行场景智能客服的NLP技术

  • 内容摘要:AI在出行场景智能客服中发挥着不可或缺的作用。本报告针对智能客服机器人、热线IVR、智能路由以及智能辅助等场景,探索智能解决方案。

  • 嘉宾介绍:熊超,2010年毕业于北京航空航天大学模式识别与智能系统专业。毕业后加入腾讯从事搜索广告算法策略研发工作。2013年加入阿里巴巴从事智能人机交互方向。2017年加入滴滴,组建智能客服算法团队,主要研究方向为多轮对话,问答,智能辅助,强化学习和智能推荐。担任顶级期刊和学术会议,如TKDE,KDD等审稿人。多项智能客服领域技术专利发明人,专利覆盖多轮对话、问答、闲聊、智能预测等。

45. 徐潇然 Hulu

  • 报告题目:探究符号逻辑与深度学习的融合

  • 内容摘要:推理、知识图谱诞生于人工智能符号派阵营,深度学习则是神经网络在新时代的高峰。这看似水火不相容的对立,最终能否走向统一,在执彼此之手中会给AI带来一个什么样的未来?在令众生憧憬的道路上,还有哪些需要逾越的鸿沟?本报告从历史到当下,给出我们的答案。

  • 嘉宾介绍:徐潇然,毕业于北京大学智能科学系,2013年赴美国加州大学洛杉矶分校学习人工智能专业,两年博士学习后弃学回国创业,而后在360人工智能研究院做深度学习算法工程师,现在Hulu北京的研究员岗位上从事推荐推理方向的深度学习强化学习研究,研究点主要关注在具有可解释性的可微推理(Differentiable Reasoning)和随机推理(Stochastic Reasoning),先后提出了Backprop-Q随机计算图上的通用反向传播计算框架,和基于注意力流(Attention Flow)的可微推理模型。

46. 许家铭 中国科学院自动化研究所

  • 报告题目:语音交互中的鸡尾酒会问题和多模态认知

  • 内容摘要:智能语音交互近些年取得了重要进展,已经从“不可用”变为限定场景的“基本可用”,而目前制约其向泛场景“很好用”转换的两大技术瓶颈为语音交互前端的听觉感知和后端的语言认知。本报告围绕前后端的两大技术瓶颈展开,介绍借鉴类脑机制和进化博弈在听觉的鸡尾酒会问题和语言为核心的多模态认知方面的探索性成果,并进一步给出相关研究存在的问题以及可能的研究方向。

  • 嘉宾介绍:许家铭,中国科学院自动化研究所副研究员。主要研究方向为智能问答与人机对话。目前承担或参与国家及相关部委科研项目8项,包括国家自然科学基金、中国科学院战略性先导科技专项以及北京市科技重大项目等。在AAAI, IJCAI, ACL, EMNLP, COLING, NAACL以及Neural Networks等国际会议和期刊上发表论文30余篇。申请国家发明专利10项。目前兼职中文信息学会青年工作委员会委员,以及IEEE Trans, AAAI, ACL, COLING等期刊和会议程序委员会委员或审稿人。

47. 薛向阳,复旦大学计算机科学技术学院 

  • 报告题目:基于可学习深度先验的视觉概念解析

  • 内容摘要:深度学习在图像目标分类识别等一些特定任务上达到甚至超越了人的水平。然而,大多数成功的深度学习模型面临小样本、可解释性差等问题。与深度学习模型识别图像内容的机制不太一样,人在识别图像内容时,常将一幅图像场景分解为若干具体和抽象的视觉概念(物体),因为无论多复杂的图像场景都是由比较简单的视觉概念(物体)组合而成的。受此启发,最近有学者提出了用组合式隐变量来表示并解析图像场景。本报告将首先回顾视觉概念解析的最新研究进展,然后介绍我们最近提出的可学习深度先验方法,它能利用深度神经网络将组合式的隐变量转换为图像像素先验分布。研究表明,该先验分布学习了以往见过的视觉概念(物体),可帮助在未见过的场景中更好地完成视觉概念的解析,在合成图像数据实验上取得了良好性能。我们正努力将该方法用于自然图像场景解析,期望能缓解当前深度学习模型面临的难题。

  • 嘉宾介绍:薛向阳,复旦大学计算机科学技术学院教授。他当前研究领域为多媒体信息处理、计算机视觉深度学习等,主要关注视觉目标检测与识别方法。发表学术论文200余篇,其中包括CCF推荐A类会议长文及重要国际期刊论文60余篇,获2016年IEEE TMM最佳论文提名奖和2017年国际会议ICME最佳论文奖。他是中国计算机学会杰出会员、中国图像图形学学会常务理事。他还担任《计算机研究与发展》、《计算机科学与探索》等期刊编委。

48. 杨强 香港科技大学、微众银行

  • 报告题目:数据孤岛,AI 向善与联邦迁移学习

  • 内容摘要:「AI 向善」是一个重大的议题,是当天论坛要聚焦的对 AI 系统至关重要的数据治理问题:数据越多,AI 系统的表现就越好,而这样的话就会造成数据和 AI 的寡头,例如 Google 以及国内的BAT等大公司,拥有巨量数据。而与之相对的则是小公司所面临的小数据场景,例如法律、金融、医疗大部分应用场景都存在小数据和「数据孤岛」的问题。杨强教授从技术上提出了一些解决方案。

  • 嘉宾介绍:杨强,微众银行首席人工智能官,香港科技大学讲座教授及前计算机系主任,前华为诺亚方舟实验室主任,AAAI 国际人工智能协会常务理事,IJCAI 国际人工智能联合会理事会主席,香港人工智能机器人学会理事长,同时也是ACM 和 IEEE 在内的多个国际知名期刊的主编和学会的 Fellow。

49. 于建岗 绿湾科技

  • 报告题目:AutoML Platform的打造与落地

  • 内容摘要:Lvwan机器学习平台(Lvwan Focus)是绿湾自主研发的高效、简洁、易用的新一代机器学习平台。平台基于机器学习算法,为各行业提供一体化大数据解决方案。用户使用机器学习平台可以快速搭建机器学习算法模型,通过算法模型指导业务落地。机器学习平台具有可视化的界面、模块化算法因子、拖拽式的任务流以及灵活设置的算法参数,让用户通过简单的操作就可以完成模型的训练、评估和预测。平台适用于需要将机器学习应用于日常工作的用户,用户基于机器学习平台可以在短时间内搭建例如:商品推荐、金融风控、语义识别等业务模型。本talk将基于Lvwan Focus的架构设计与理念,提供行业AI解决方案。

  • 嘉宾介绍:于建岗博士,原美国微软总部架构师,百度主任架构师,科学家。于2007年在美国加州⼤学取得计算机专业博⼠学位,曾供职于美国微软公司总部从事互联⽹⼴告的机器学习⼯作;加入百度后主导设计上线了百度凤巢新⼀代点击率预估系统,是国内外⾸次利⽤⼤规模深度学习算法来做点击率预估的系统。

50. 詹坤林 58集团AILab

  • 报告题目:智能语音机器人提高人效

  • 内容摘要:智能语音机器人,即利用语音识别、语义理解和语音合成技术赋予机器多轮对话交互能力,使之能模拟真人与用户对话,识别和理解用户的会话意图,它被广泛应用于企业自动电话销售、产品推广、服务通知等多种业务场景,能为企业提高人效,节省大量人力成本。本报告将提出58同城智能语音机器人完整解决方案,提高销售、运营和客服上的人效。

  • 嘉宾介绍:詹坤林,58集团AI Lab负责人,算法高级架构师,负责推动AI技术在58生活服务行业的落地,为58集团打造全面AI能力。目前负责主要产品包括智能问答机器人、智能语音机器人、智能写稿机器人、AI算法平台等。硕士毕业于中国科学院大学,研究方向为数据挖掘,曾任腾讯高级工程师,负责微博、新闻推荐算法研发。

51. 张峥 上海纽约大学 AWS上海AI研究院

  • 报告题目:Deep Graph Made Easy (and faster)

  • 内容摘要:All real-world data has structures that are best described as graphs. If there is one data structure for deep learning algorithms, graph would be the foremost candidate. The graph structure can be either explicit, such in social networks, knowledge graphs, and protein-interaction networks, etc., or latent and implicit, as in the case of languages and images. Leveraging and discovering graph structures have many immediate applications and also serves as a futile ground for the next generation of algorithms.This talk begins with a general survey of deep graph learning, and then we will discuss a few new research work at AWS Shanghai AI Lab in this direction. We will introduce DGL, an open-source platform designed to accelerate research in this new emerging field, with its philosophy to support graph as the core abstraction and take care to maintain both forward (i.e. supporting new research ideas) and backward (i.e. integration with existing components) compatibility. DGL enables arbitrary message handling and mutation operators, flexible propagation rules, and is framework agnostic so as to leverage high-performance tensor, autograd operations, and other feature extraction modules already available in existing frameworks. DGL carefully handles the sparse and irregular graph structure, deals with graphs big and small which may change dynamically, fuses operations, and performs auto-batching, all to take advantages of modern hardware. DGL has been tested on a variety of models, including but not limited to the popular Graph Neural Networks (GNN) and its variants, with promising speed, memory footprint and scalability.

  • 嘉宾介绍:Zheng Zhang is Professor of Computer Science, NYU Shanghai; Global Network Professor, NYU. He also holds an affiliated appointment with the Department of Computer Science at the Courant Institute of Mathematical Sciences and with the Center for Data Science at NYU's campus in New York City. Prior to joining NYU Shanghai, he was the founder of the System Research Group in Microsoft Research Asia, where he served as Principle Researcher and research area manager. Before he moved to Beijing, he was project lead and member of technical staff in HP-Labs. He holds a PhD from the University of Illinois, Urbana-Champaign, an MS from University of Texas, Dallas, and a BS Fudan University.Zhang’s research interests are theories and practices of large-scale distributed computing and its intersection with machine learning, in particular deep-learning. He has published extensively in top system as well as machine learning conferences (OSDI, Eurosys, NSDI, NIPS, CVPR etc.), and is also known for his column “Zheng Zhang on Science,” which is published in Chinese Business.Zhang is a member of the Association for Computing Machinery and founder of the SIGOPS APSYS workshop and the CHINASYS research community. He served regularly as PC members of leading system conferences. During his tenures in industrial labs, he was awarded 40 patents and made numerous contributions to product lines. He has several Best Paper awards as well as awards for excellence from Microsoft and HP-Labs. Professor Zhang's works can be found on his Google Scholar Page (https://scholar.google.com.hk/citations?user=k0KiE4wAAAAJ&hl=en).Zhang was founder and advisor for DL platforms such as MXNet (https://mxnet.apache.org/), MinPy (https://github.com/dmlc/minpy) and most recently DGL (https://www.dgl.ai/), bringing deep learning practise to graph (see his github page (https://github.com/zzhang-cn)) As of fall of 2018, Professor Zhang is taking a leave of absence and has joined Amazon AWS, taking the role of Director of AWS Shanghai AI Lab.

52. 周国睿 阿里妈妈

  • 报告题目:电商数据下模型的挑战与发展

  • 内容摘要:CTR(点击率)预估是一个计算广告和推荐系统中的核心问题。近年来,随着硬件技术持续进步,深度学习技术飞速发展,伴随着互联网数据收集能力的提高,数据驱动模型为预估技术带来了革命性的改变。本报告,将从阿里妈妈定向广告预估技术演进的视角,回顾我们在预估技术深度学习化研究中所做的努力与探索,以及相应的代表性成果。同时分析现有广告/推荐系统的不足,展望下一代推荐/广告系统的挑战。

  • 嘉宾介绍:周国睿,北京邮电大学硕士。研究领域包括大规模机器学习自然语言处理、计算广告、推荐系统等。现负责定向广告预估方向模型算法研发,同时是阿里巴巴自研深度学习框架XDL核心开发者。研究成果发表于KDD/AAAI/CIKM等会议,其研究工作均落地于实际系统。

53. 周文彪 途家网

  • 报告题目:民宿推荐中的Embedding技术

  • 内容摘要:民宿越来越成为旅游消费的新热潮,作为国内最大的民宿平台,途家在应用AI技术进行个性化商品推荐方面进行了不少探索。民宿行业的数据,具有用户消费频次低,用户兴趣点不好描述等特点,基于内容和普通协同过滤的方法效果都不明显,受graphic embedding, word2vec的启发, 我们运用embedding技术有效建立了商品之间的相似关系,运用在物物相似推荐场景通过AB测试效果明显胜出。

  • 嘉宾介绍:周文彪,对机器学习算法在商业上的落地有浓厚兴趣,在智能客服,自动化审核和个性化推荐算法方面有较多实践。从15年开始先后在去哪儿网和途家网负责排序和推荐方面的算法工作;搭建去哪儿大搜猜你喜欢推荐系统和途家排序及推荐系统,为公司流量转化提升做出重要贡献。

54. 朱宏图 滴滴出行

  • 报告题目:AI for Market Place with Applications to Ride Sharing Business

  • 内容摘要:In this talk, we introduce a general AI for market place analytical framework with applications in ride sharing business. This framework integrates some fundamental statistical methods, including experiment design and causal inference, with modern machine learning methods, such as deep learning and reinforcement learning. This framework not only makes statistical inference on a particular policy, but also optimizes a set of policies for a complex system. For instance, we introduce a novel class of equilibrium metrics (EMs) to quantify spatial balance of dynamic demand and supply networks defined on the same graph. It is primarily motivated by measuring the local and global spatial coherence between demand and supply patterns in large- scale ride-sharing platforms, such as Uber. The two key com- ponents of EM are to formulate the spatial coherence problem as an unbalanced optimal transport problem and to develop an efficient linear programming algorithm to solve such transport problem. Moreover, our EM measures the local (or global) distance between demand and supply patterns after the optimal transport, while incorporating the related trans- porting cost. Moreover, we establish the causal inference framework for dynamic process in order to introduce a set of statistical methods for evaluating various polycies used in ride sharing business. In addition, we model the ride dispatching problem as a Markov Decision Process and propose learning solutions based on deep Q-networks with action search to optimize the dispatching policy for drivers on ride-sharing platforms.This is a joint work with Zhaodong Wang, Zhiwei (Tony) Qin, Xiaocheng Tang, Jieping Ye, Sikai Luo, and Fan Zhou.

  • 嘉宾介绍:Dr. Zhu joined DiDi in 2018 from his position of Endowed Bao-Shan Jing Professorship in Diagnostic Imaging and a tenured professor of biostatistics at MD Anderson Cancer Center and a tenured professor of biostatistics at University of North Carolina at Chapel Hill. Dr. Zhu is leading DiDi’s statistical cognitive team with AI scientists and engineers on the development of innovative solutions for the world’s largest transportation platform. Dr. Zhu got his Ph.D. degree in statistics from the Chinese University of Hong Kong in 2000. He is an internationally recognized expert in statistical learning, medical image analysis, precision medicine, biostatistics, artificial intelligence, and big data analytics. He has been an elected Fellow of American Statistical Association and Institute of Mathematical Statistics since 2011. He received an established investigator award from Cancer Prevention & Research Institute of Texas in 2016. He has published more than 250 papers in top journals, including Nature, Nature Neuroscience, PNAS, AOS, and JRSSB. He serves as a chair or area chair of top international conferences including AAAI and Information Processing in Medical Imaging, as well as an editorial board member of premier international journals, including Statistica Sinica, Annals of Statistics, and Journal of American Statistical Association.  

大会地点

  • 北京理工大学(中关村校区)

  • 中心教学楼一层、二层报告厅、7号楼报告厅、研究生院101报告厅

交通路线 

  1. 乘坐地铁 4 号线,在魏公村站下车,由 A 口出,从北京理工大学东门进入校园;

  2. 乘坐 563、645、运通 103 路在魏公村路东口站下车,从北理工小南门(或称东南门,附近有很多快递)进入校区;

  3. 乘坐 26、355、365 路等路线在三义庙站下车,从北理工北门进入校区。

进入校园以后,大家可以直接问可爱的同学或者导航到达,导航目的地为北京理工大学-中心教学楼。

主办单位

  • 中国科学院人工智能联盟标准组

  • 北京理工大学计算机学院

协办单位

  • 机器之心

  • DataFun

支持媒体

  • 中国科技网

识别下方二维码或点击阅读原文报名

入门北京理工大学人工智能大会
1
相关数据
AWS机构

亚马逊网络服务系统(英语:Amazon Web Services,缩写为AWS),由亚马逊公司所创建的云计算平台,提供许多远程Web服务。Amazon EC2与Amazon S3都架构在这个平台上。在2002年7月首次公开运作,提供其他网站及客户端(client-side)的服务。截至2007年7月,亚马逊公司宣称已经有330,000名开发者,曾经登录过这项服务。

相关技术
搜狗机构

搜狗成立于2003年,是中国搜索行业挑战者,AI领域的创新者。目前搜狗月活跃用户数仅次于BAT,是中国用户规模第四大互联网公司。2004年8月,搜狗推出搜狗搜索,现已成为中国第二大搜索引擎。2006年6月,推出搜狗输入法,重新定义了中文输入,目前搜狗输入法覆盖超5亿用户,是国内第一大中文输入法。2017年11月9日,搜狗在美国纽约证券交易所正式挂牌上市,股票交易代码为“SOGO”,开盘价为13.00美元,市值超50亿美元。

http://corp.sogou.com/
微软亚洲研究院机构

微软亚洲研究院于1998年在北京成立,是微软公司在亚太地区设立的基础及应用研究机构,也是微软在美国本土以外规模最大的一个研究院。微软亚洲研究院从事自然用户界面,智能多媒体,大数据与知识挖掘,人工智能,云和边缘计算,计算机科学基础等领域的研究,致力于推动计算机科学前沿发展,着眼下一代革命性技术的研究,助力微软实现长远发展战略。通过与微软产品部门紧密合作,微软亚洲研究院将众多创新技术转移到了微软的核心产品中,如Office、Windows、Azure、Bing、Visual Studio、Xbox Kinect以及小冰、Cortana和Microsoft Translator等人工智能产品。

https://www.msra.cn/
华为机构

华为成立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。华为的主要业务分布在无线、网络、软件、服务器、云计算、人工智能与大数据、安全、智能终端等领域,发布了5G端到端解决方案、智简网络、软件平台、面向行业的云解决方案、EI企业智能平台、新一代FusionServer V5服务器、HUAWEI Mate等系列智能手机、麒麟系列AI芯片等产品。目前华为拥有18万员工,36所联合创新中心,14所研究院/所/室,业务遍及170多个国家和地区。

http://www.huawei.com/cn
商汤科技机构

商汤科技成立于 2014 年,专注于计算机视觉和深度学习的原创技术,是中国领先的人工智能头部公司,估值超过 45 亿美金。以「坚持原创,让 AI 引领人类进步」为使命,商汤科技建立了国内顶级的自主研发的深度学习超算中心,并成为中国一流的人工智能算法供应商。商汤科技不仅在技术实力上领跑行业,商业营收亦领先同行业,在多个垂直领域的市场占有率居首位。目前,商汤科技已与国内外多个行业的 400 多家领军企业建立合作,包括 Qualcomm、英伟达、本田、中国移动、银联、万达、苏宁、海航、中央网信办、华为、小米、OPPO、vivo、微博、科大讯飞等知名企业及政府机构,涵盖安防、金融、智能手机、移动互联网、汽车、智慧零售、机器人等诸多行业,为其提供基于人脸识别、图像识别、视频分析、无人驾驶、医疗影像识别等技术的完整解决方案。

www.sensetime.com
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
网易机构

网易成立于1997年6月24日,是中国领先的互联网技术公司,为用户提供免费邮箱、游戏、搜索引擎服务,开设新闻、娱乐、体育等30多个内容频道,及博客、视频、论坛等互动交流,网聚人的力量。

https://www.163.com/
云知声机构

云知声成立于2012年,是一家专注物联网人工智能服务、拥有完全自主知识产权、世界顶尖智能语音识别技术的高新技术企业。总部位于北京,在上海、深圳、厦门设有分公司。自成立以来,发展迅速,备受人工智能行业及资本市场的广泛关注,累积融资近亿美元,合作伙伴数量也已经超过2万家 。

https://www.unisound.com/
刘铁岩人物

刘铁岩博士毕业于清华大学电子工程系。现任微软亚洲研究院主任研究员,互联网经济与计算广告学研究组负责人。他是美国计算机学会(ACM)、国际电子电气工程师学会(IEEE)、和中国计算机学会(CCF)的高级会员。中国科技大学和南开大学的客座教授。

杨强人物

杨强现任香港科技大学新明工程学讲席教授、计算机科学和工程学系主任,大数据研究所所长 。他是人工智能研究的国际专家和领军人物,在学术界和工业界做出了杰出的服务和贡献,尤其近些年为中国人工智能(AI)和数据挖掘(KDD)的发展起了重要引导和推动作用。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

增强现实技术

增强现实,是指透过摄影机影像的位置及角度精算并加上图像分析技术,让屏幕上的虚拟世界能够与现实世界场景进行结合与互动的技术。这种技术于1990年提出。随着随身电子产品运算能力的提升,增强现实的用途也越来越广。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

深度强化学习技术

强化学习(Reinforcement Learning)是主体(agent)通过与周围环境的交互来进行学习。强化学习主体(RL agent)每采取一次动作(action)就会得到一个相应的数值奖励(numerical reward),这个奖励表示此次动作的好坏。通过与环境的交互,综合考虑过去的经验(exploitation)和未知的探索(exploration),强化学习主体通过试错的方式(trial and error)学会如何采取下一步的动作,而无需人类显性地告诉它该采取哪个动作。强化学习主体的目标是学习通过执行一系列的动作来最大化累积的奖励(accumulated reward)。 一般来说,真实世界中的强化学习问题包括巨大的状态空间(state spaces)和动作空间(action spaces),传统的强化学习方法会受限于维数灾难(curse of dimensionality)。借助于深度学习中的神经网络,强化学习主体可以直接从原始输入数据(如游戏图像)中提取和学习特征知识,然后根据提取出的特征信息再利用传统的强化学习算法(如TD Learning,SARSA,Q-Learnin)学习控制策略(如游戏策略),而无需人工提取或启发式学习特征。这种结合了深度学习的强化学习方法称为深度强化学习。

信息检索技术

信息检索(IR)是基于用于查询检索信息的任务。流行的信息检索模型包括布尔模型、向量空间模型、概率模型和语言模型。信息检索最典型和最常见的应用是搜索引擎。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

网页搜索技术

Web搜索引擎是一种软件系统,旨在搜索万维网上的信息。 搜索结果通常以一系列结果呈现,通常称为搜索引擎结果页面(SERP)。 该信息可以是网页、图像和其他类型的文件的混合。一些搜索引擎还挖掘数据库或打开目录中可用的数据。 与仅由人工编辑器维护的网络目录不同,搜索引擎还通过在网络爬虫上运行算法来维护实时信息。 不能被网络搜索引擎搜索的因特网内容通常被描述为深度网络(deep web)。

协同过滤技术

协同过滤(英语:Collaborative Filtering),简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。协同过滤又可分为评比(rating)或者群体过滤(social filtering)。其后成为电子商务当中很重要的一环,即根据某顾客以往的购买行为以及从具有相似购买行为的顾客群的购买行为去推荐这个顾客其“可能喜欢的品项”,也就是借由社区的喜好提供个人化的信息、商品等的推荐服务。除了推荐之外,近年来也发展出数学运算让系统自动计算喜好的强弱进而去芜存菁使得过滤的内容更有依据,也许不是百分之百完全准确,但由于加入了强弱的评比让这个概念的应用更为广泛,除了电子商务之外尚有信息检索领域、网络个人影音柜、个人书架等的应用等。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

虚拟现实技术

虚拟现实,简称虚拟技术,也称虚拟环境,是利用电脑模拟产生一个三维空间的虚拟世界,提供用户关于视觉等感官的模拟,让用户感觉仿佛身历其境,可以及时、没有限制地观察三维空间内的事物。用户进行位置移动时,电脑可以立即进行复杂的运算,将精确的三维世界视频传回产生临场感。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

元学习技术

元学习是机器学习的一个子领域,是将自动学习算法应用于机器学习实验的元数据上。现在的 AI 系统可以通过大量时间和经验从头学习一项复杂技能。但是,我们如果想使智能体掌握多种技能、适应多种环境,则不应该从头开始在每一个环境中训练每一项技能,而是需要智能体通过对以往经验的再利用来学习如何学习多项新任务,因此我们不应该独立地训练每一个新任务。这种学习如何学习的方法,又叫元学习(meta-learning),是通往可持续学习多项新任务的多面智能体的必经之路。

随机过程技术

在概率论概念中,随机过程是随机变量的集合。若一随机系统的样本点是随机函数,则称此函数为样本函数,这一随机系统全部样本函数的集合是一个随机过程。实际应用中,样本函数的一般定义在时间域或者空间域。随机过程的实例如股票和汇率的波动、语音信号、视频信号、体温的变化,反对法随机运动如布朗运动、随机徘徊等等。

语音助理技术

虚拟助理(virtual assistant)是一种能替个人执行任务或服务的软件代理(software agent)。有时候“聊天机器人”泛指虚拟助理,亦或专指网络聊天使用的软件机器人(有时候更专指娱乐而非实用的网络聊天)。但也可以指一种职业,或者企业组织,其乃是透过网络执行远端服务。

运筹学技术

运筹学,是一门应用数学学科,利用统计学和数学模型等方法,去寻找复杂问题中的最佳或近似最佳的解答。运筹学经常用于解决现实生活中的复杂问题,特别是改善或优化现有系统的效率。研究运筹学的基础知识包括矩阵论和离散数学,在应用方面多与仓储、物流等领域相关。因此运筹学与应用数学、工业工程专业密切相关。

文本检索技术

文本检索(Text Retrieval)与图象检索、声音检索、图片检索等都是信息检索的一部分,是指根据文本内容,如关键字、语意等对文本集合进行检索、分类、过滤等。

知识库技术

知识库是用于知识管理的一种特殊的数据库,以便于有关领域知识的采集、整理以及提取。知识库中的知识源于领域专家,它是求解问题所需领域知识的集合,包括基本事实、规则和其它有关信息。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

机器人技术技术

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

推荐系统技术

推荐系统(RS)主要是指应用协同智能(collaborative intelligence)做推荐的技术。推荐系统的两大主流类型是基于内容的推荐系统和协同过滤(Collaborative Filtering)。另外还有基于知识的推荐系统(包括基于本体和基于案例的推荐系统)是一类特殊的推荐系统,这类系统更加注重知识表征和推理。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

门控循环单元技术

门控循环单元(GRU)是循环神经网络(RNN)中的一种门控机制,与其他门控机制相似,其旨在解决标准RNN中的梯度消失/爆炸问题并同时保留序列的长期信息。GRU在许多诸如语音识别的序列任务上与LSTM同样出色,不过它的参数比LSTM少,仅包含一个重置门(reset gate)和一个更新门(update gate)。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

视觉搜索技术

图搜索技术

在计算机科学中,图遍历(也称为图搜索)是指在图中访问(检查/或更新)每个顶点的过程。这样的遍历是按访问顶点的顺序进行分类的。比如,树遍历就是图遍历的一个特例。 与树遍历不同,图遍历可能需要多次访问某些顶点,因为在转换到一个已经被探索的顶点之前,它并不一定是已知的。随着图形变得越来越密集,这种冗余变得更加普遍,导致计算时间增加;随着图形变得越来越稀疏,相反的情况也成立。 因此,通常需要记住哪些顶点已经被算法探索过了,这样就可以尽可能少地重新访问顶点(或者在最坏的情况下,防止遍历无限延续)。这可以通过将图中的每个顶点与在遍历期间的“颜色”或“访问”状态相关联来完成,然后在算法访问每个顶点时检查和更新。如果顶点已经被访问过,它就被忽略了,路径就不再被继续了;否则,算法会检查/更新顶点,并继续它当前的路径。

朴素贝叶斯技术

朴素贝叶斯是一种构建分类器的简单方法。该分类器模型会给问题实例分配用特征值表示的类标签,类标签取自有限集合。它不是训练这种分类器的单一算法,而是一系列基于相同原理的算法:所有朴素贝叶斯分类器都假定样本每个特征与其他特征都不相关。举个例子,如果一种水果其具有红,圆,直径大概3英寸等特征,该水果可以被判定为是苹果。尽管这些特征相互依赖或者有些特征由其他特征决定,然而朴素贝叶斯分类器认为这些属性在判定该水果是否为苹果的概率分布上独立的。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

路径规划技术

路径规划是运动规划的主要研究内容之一。运动规划由路径规划和轨迹规划组成,连接起点位置和终点位置的序列点或曲线被称为路径,构成路径的策略则被称为路径规划。路径规划在很多领域都具有广泛的应用,如机器人的自主无碰行动;无人机的避障突防飞行等。

博弈论技术

博弈论,又译为对策论,或者赛局理论,应用数学的一个分支,1944年冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》,标志着现代系统博弈理论的的初步形成,因此他被称为“博弈论之父”。博弈论被认为是20世纪经济学最伟大的成果之一

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

MXNet技术

MXNet是开源的,用来训练部署深层神经网络的深度学习框架。它是可扩展的,允许快速模型训练,并灵活支持多种语言(C ++,Python,Julia,Matlab,JavaScript, Go,R,Scala,Perl,Wolfram语言)

word2vec技术

Word2vec,为一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。网络以词表现,并且需猜测相邻位置的输入词,在word2vec中词袋模型假设下,词的顺序是不重要的。 训练完成之后,word2vec模型可用来映射每个词到一个向量,可用来表示词对词之间的关系。该向量为神经网络之隐藏层。 Word2vec依赖skip-grams或连续词袋(CBOW)来建立神经词嵌入。Word2vec为托马斯·米科洛夫(Tomas Mikolov)在Google带领的研究团队创造。该算法渐渐被其他人所分析和解释。

信号处理技术

信号处理涉及到信号的分析、合成和修改。信号被宽泛地定义为传递“关于某种现象的行为或属性的信息(如声音、图像和生物测量)”的函数。例如,信号处理技术用于提高信号传输的保真度、存储效率和主观质量,并在测量信号中强调或检测感兴趣的组件。我们熟悉的语音、图像都可以看做是一种信号形式。因此,对于语音、图像的增强、降噪、识别等等操作本质上都是信号处理。

对话系统技术

对话系统大致被分成两类: 任务为导向的对话系统,帮助用户去完成特定任务,比如找商品,订住宿,订餐厅等。实现任务为导向的对话系统,主要有两类方式,流水线方法和端到端方法。非任务导向的对话系统,与用户进行互动并提供回答,简单的说,就是在开放领域的闲聊。实现非任务导向对话系统也主要可分为两类,生成方法和基于检索的方法。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

隐变量技术

在统计学中,隐变量或潜变量指的是不可观测的随机变量。隐变量可以通过使用数学模型依据观测得的数据被推断出来。

图像分类技术

图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

移动机器人技术

移动机器人是一种能够移动的自动机器。移动机器人具有在其环境中移动的能力,并且不固定到一个物理位置。移动机器人可以“自动”主要是指它们能够在没有物理或机电引导装置的情况下导航非受控环境。相比之下,传统的工业机器人或多或少都是固定的(stationary)机械臂或抓取组件。

百度机构

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://home.baidu.com/
腾讯机构

腾讯科技股份有限公司(港交所:700)是中国规模最大的互联网公司,1998年11月由马化腾、张志东、陈一丹、许晨晔、曾李青5位创始人共同创立,总部位于深圳南山区腾讯大厦。腾讯由即时通讯软件起家,业务拓展至社交、娱乐、金融、资讯、工具和平台等不同领域。目前,腾讯拥有中国国内使用人数最多的社交软件腾讯QQ和微信,以及中国国内最大的网络游戏社区腾讯游戏。在电子书领域 ,旗下有阅文集团,运营有QQ读书和微信读书。

http://www.tencent.com/
加州大学伯克利分校机构

加利福尼亚大学伯克利分校,简称加州大学伯克利分校,又常被译为加利福尼亚大学伯克莱分校,位于美国加利福尼亚州旧金山湾区伯克利市,是一所世界著名的公立研究型大学。其许多科系位于全球大学排行前十名,是世界上最负盛名的大学之一,常被誉为美国乃至世界最顶尖的公立大学。

https://www.berkeley.edu/
小米机构

小米是中国一家专注于智能硬件、智能家居以及软件开发的企业,于2010年4月6日成立,总部位于中国北京,截至2018年3月31日,员工人数近1.45万。 2010年8月及12月,小米发布了基于安卓系统深度定制的第三方固件MIUI及首款移动应用米聊。2011年8月16日,小米正式推出了其第一款硬件产品——小米手机(一代),开创了以互联网线上抢购高配置、低售价的智能手机销售模式。 通过旗下生态链品牌MIJIA(米家),小米的产品线从智能手机及耳机、移动电源等手机周边产品和音箱、手环等相关移动智能硬件,扩展到智能电视、机顶盒、路由器、空气净化器、电饭煲等家居消费产品。截至2018年3月底,小米已进入全球74个国家和地区的市场,并在其中15个市场智能手机出货量名列前五。 2012年,小米全资买入北京多看科技有限公司,进入电子书阅读领域。多看阅读是旗下网站,并有相应的App。2018年,业界传闻小米有计划生产电子阅读器。 2018年5月3日,小米正式向香港交易所提交IPO申请[6],于2018年7月9日以同股不同权的方式挂牌上市,并计划于7月23日纳入恒生综合指数。 2018年11月19日,美图公司与小米集团宣布达成战略合作伙伴关系,合作期限30年。

目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

Keep机构

Keep 致力于提供健身教学、跑步、骑行、交友、健康饮食指导及装备购买等一站式运动解决方案,持续打造「自由运动场」来帮助人们随时随地尽享运动。 Keep APP提供丰富的运动课程、社区交友、产品功能;Keepland线下城市运动空间,轻便的小团课精品课程使城市人群可以随时随地享受运动的乐趣;KeepKit智能硬件是部署「家庭」场景,硬件产品KeepKit连接运动与家庭场景,以内容为核心的智能运动产品平台,重塑家庭运动体验;KeepUp 是 Keep 的运动服饰品牌。年轻、酷感和运动是 KeepUp 一脉相承的品牌特点。

https://www.gotokeep.com/
移动端深度学习技术

现阶段的移动端 APP 主要通过以下两种模式来使用深度学习: online 方式:移动端做初步预处理,把数据传到服务器执行深度学习模型,优点是这个方式部署相对简单,将现成的框架(Caffe,Theano,MXNet,Torch) 做下封装就可以直接拿来用,服务器性能大, 能够处理比较大的模型,缺点是必须联网。 offline 方式:在服务器上进行训练的过程,在手机上进行预测的过程。 当前移动端的三大框架(Caffe2、TensorFlow Lite、Core ML)均使用 offline 方式,该方式可在无需网络连接的情况下确保用户数据的私密性。

暂无评论
暂无评论~