Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

全日程发布|Sora之后的视频生成技术与应用

说起 Sora,相信大家都不陌生。近一个多月内,关于 Sora 的讨论延伸到了各个角落,这个一直没有对外开放的视频生成模型,不仅让人惊艳,更让人焦虑。

作为持续关注 AI 技术前沿的团队,机器之心特别策划了视频生成技术与应用 — Sora 时代」的技术论坛。本次活动聚焦 Sora 发布后的技术创新、思考与应用实践,希望能帮助大家构建一个完整的视频生成知识图谱

面对扑面而来的 AI 视频生成,积极拥抱学习并敢于尝试,才能抓住技术潮流,破局而生。

期待 2024.04.13,在北京海淀区,和你相遇。

活动全日程图片

论坛报名通道已经开启,扫描海报中二维码可直达活动页面。

即日起至04月07日23:55,购票参会即可直减200元, 享受699元早鸟特惠门票(原价899元)。五人团购更有专属优惠,详见活动详情页。

机器之心 AI 技术论坛往期的参会者,请单独添加 Alice 微信,直达专属优惠链接。因场地座位数量限制,对 AI 视频生成感兴趣的朋友们,快来锁定入场席位吧。

另外,报名本期论坛会赠送上一期活动视频,两期内容互为补充,助力快速构建视频生成技术与应用的完整知识框架。

强大的嘉宾阵容

本次论坛的嘉宾阵容强大,我们邀请到了行业内的知名专家和一线技术负责人,带领大家一览视频生成领域的技术突破与未来发展。

图片

张俊林

中国中文信息学会理事,中科院软件所博士

目前担任新浪微博新技术研发负责人,此前在阿里巴巴担任资深技术专家,负责新技术团队。技术书籍《这就是搜索引擎:核心技术详解》、《大数据日知录:架构与算法》作者。

图片

朱思语

复旦大学 人工智能创新与产业研究院研究员,

长聘正教授、博士生导师

本科毕业于浙江大学,博士毕业于香港科技大学,师从著名华人计算机视觉学者权龙教授。在博士阶段,作为联合创始人创立了 Alituzre,并后来被苹果公司收购。2017 年至 2023 年,在阿里云人工智能实验室担任总监、教育科技总经理等职务。2023 年起,任职于复旦大学人工智能创新与产业研究院,担任研究员和博士生导师。
主要研究方向包括视频和三维生成式模型,涉及基于视觉的三维和视频的重建、生成、理解、方针和模拟。发表了 50 余篇高水平会议和期刊论文,包括 CVPR、 ICCV、ICLR 和 TPAMI 等计算机视觉机器学习领域。在 40 余个计算机视觉国际比赛和榜单上取得第一名。在阿里云领导开发了基于视觉的三维生成和视频感知技术体系,推动了较大规模的应用转化,服务于政府、零售、交通、地产、文旅和教育等行业的大型企业客户,带动数亿元的商业收入,服务过超过亿级用户。
图片曾妍

ByteDance Research 算法工程师

专注于视频生成和多模态预训练等领域的前沿研究。主导研发的模型为字节跳动视频生成、短视频审核、电商客服、今日头条、教育解题等业务提供了有力服务,并以第一作者身份将相关的八篇论文发表在 TPAMI, ICML, CVPR, ACL 等国际顶级会议和期刊,同时也担任了 TPAMI, ICML, NIPS, ICLR 等会议的审稿人。主导研发的 PixelDance 视频生成基础模型在业界首次实现了高动态性和稳定性的结合,并首次生成了3分钟的连续剧情动画。

图片

陈石

峰瑞资本 投资合伙人

专注于科技、软件、互联网、消费等领域的投资。加入峰瑞资本前,拥有 5 年阿里巴巴管理层经历,曾担任阿里巴巴移动事业群副总裁、阿里巴巴文化娱乐集团高管、优酷和 UC 国际班委,深度参与 UC、高德、优酷、土豆、神马搜索、UC 国际等产品线的业务决策和管理执行。
15+ 年连续创业,作为核心管理团队成员深度参与 UC(全球最大第三方手机浏览器,2014 年被阿里巴巴收购)和拉卡拉(中国知名第三方支付公司,SZ:300773)的创业过程,分别担任副总裁和 CTO;曾经是一名快乐的程序员,用户增长专家,科技热爱者。
拥有北京航空航天大学机电工程系本科和硕士学历。2023 年获评 EqualOcean「2023年出海全球化投资TOP30人」、甲子光年「2022-2023 年度人工智能与大数据最佳投资人TOP20」。

图片

杨欢

零一万物 高级算法专家

上海交通大学博士。2019 年加入微软亚洲研究院,主要研究视觉生成与增强领域。在职期间于顶级会议期刊发表文章近 30 余篇,多项研究成果转化到微软的核心产品。主导研发 MMDiffusion,VideoFactory,MovieFactory 等多项视频生成相关工作,收集了最大的公开视频生成数据集 HD-VG-130M。2023 年加入零一万物,负责多模态生成领域相关的研发工作。

图片

高一钊

智子引擎 CEO

中国人民大学高瓴人工智能学院博士。多模态大模型专家,发表多篇顶级期刊、会议论文,曾带领多人团队完成文澜大模型训练。全程参与智子引擎相关模型、产品的开发与推广。

图片

王耀晖

上海人工智能实验室 研究员

法国国家信息与自动化研究所(Inria)博士,致力于基于大规模机器学习视频生成技术的研究。在计算机视觉机器学习的顶级会议与期刊上发表论文 30 余篇,近期代表工作包括 LaVie,SEINE,AnimateDiff,Latte 等一系列视频扩散模型。
图片
卞正达

潞晨科技 CTO

毕业于新加坡国立大学,曾在全球超算最顶尖会议 SC 上发表一作论文,拥有 7 年高性能 AI 系统经验,Colossal-AI 系统核心开发者。

图片

童同

中移动信息技术有限公司 算法技术负责人

中国科学院自动化研究所模式识别与智能系统专业博士,中国移动首批“金种子”计划入选者,负责多模态大模型、数字人、智能体等领域研发工作,共发表论文 12 篇、公司专利 12 项、软著 4 项。

论坛亮点

  • 赠送永久观看上一期「视频生成前沿研究与应用」论坛活动视频及课件(上期活动已购请联系 Alice 扣减,本期购买后记得找 Alice 兑换上一期视频)

  • 永久观看本期「视频生成技术与应用 - Sora 时代」论坛活动会后视频及课件

  • 汇聚高校教授及产业界重磅技术专家,掌握最新技术,拓宽技术视野

  • 和技术大牛面对面交流,会后深度连接

  • 覆盖核心技术拆解、明星产品最佳实践、技术未来探讨及展望

  • 全流程助力学习:会前会后学习资料大礼包

  • 加入视频生成高质量技术交流社群,及时跟进行业前沿技术与资讯

  • 机器之心旗下相关付费活动享购票八五折优惠

技术交流社群

为了方便技术交流,我们也特意建立了视频生成技术交流群,欢迎关心 Sora、视频生成和多模态大模型的技术从业者扫码加入对话,深入交流技术细节和行业观察。

图片


关于本次活动商务合作、团购、发票、内容等相关问题,欢迎添加本场活动负责人 Alice 或通过邮件进行咨询。 
微信:15650753618
邮箱:jiayaning@jiqizhixin.com

关于发票:报名成功后,可于活动结束后,在活动行 App 上自行申请发票,发票为电子版增值税普票,开票成功后会发送到报名邮箱中。

成为论坛志愿者:参与活动现场的具体事项执行,如签到、引导、秩序管理等,包工作餐。在校学生优先。有意者请联系 Alice。
产业视频生成Sora
相关数据
微软亚洲研究院机构

微软亚洲研究院于1998年在北京成立,是微软公司在亚太地区设立的基础及应用研究机构,也是微软在美国本土以外规模最大的一个研究院。微软亚洲研究院从事自然用户界面、智能多媒体、大数据与知识挖掘、人工智能、云和边缘计算、计算机科学基础等领域的研究,致力于推动计算机科学前沿发展,着眼下一代革命性技术的创新,助力微软实现长远发展战略。

http://www.msra.cn
字节跳动机构

北京字节跳动科技有限公司成立于2012年,是最早将人工智能应用于移动互联网场景的科技企业之一,是中国北京的一家信息科技公司,地址位于北京市海淀区知春路甲48号。其独立研发的“今日头条”客户端,通过海量信息采集、深度数据挖掘和用户行为分析,为用户智能推荐个性化信息,从而开创了一种全新的新闻阅读模式

https://bytedance.com
复旦大学机构

复旦大学(Fudan University),简称“复旦”,位于中国上海,由中华人民共和国教育部直属,中央直管副部级建制,国家双一流(A类)、985工程、211工程建设高校,入选珠峰计划、111计划、2011计划、卓越医生教育培养计划、卓越法律人才教育培养计划、国家建设高水平大学公派研究生项目,九校联盟(C9)、中国大学校长联谊会、东亚研究型大学协会、环太平洋大学协会的重要成员,是一所世界知名、国内顶尖的全国重点大学。

相关技术
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

阿里云机构

阿里云创立于2009年,是全球领先的云计算及人工智能科技公司,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。 阿里云服务着制造、金融、政务、交通、医疗、电信、能源等众多领域的领军企业,包括中国联通、12306、中石化、中石油、飞利浦、华大基因等大型企业客户,以及微博、知乎、锤子科技等明星互联网公司。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录。 阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。 2014年,阿里云曾帮助用户抵御全球互联网史上最大的DDoS攻击,峰值流量达到每秒453.8Gb 。在Sort Benchmark 2016 排序竞赛 CloudSort项目中,阿里云以1.44$/TB的排序花费打破了AWS保持的4.51$/TB纪录。在Sort Benchmark 2015,阿里云利用自研的分布式计算平台ODPS,377秒完成100TB数据排序,刷新了Apache Spark 1406秒的世界纪录。 2018年9月22日,2018杭州·云栖大会上阿里云宣布成立全球交付中心。

https://www.aliyun.com/about?spm=5176.12825654.7y9jhqsfz.76.e9392c4afbC15r
阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。

https://www.alibabagroup.com/
机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
视频生成技术

视频生成是指利用深度学习等技术生成视频的任务。

推荐文章
暂无评论
暂无评论~