Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

机器之心编辑部报道

大神李沐加入AI大模型创业,导师Alex Smola是创始人

在 ChatGPT、大模型备受关注的今天,华人 AI 学者李沐创业的消息吸引了大家的眼球。

消息首先媒体「亲爱的数据」爆出。

「我们正在构建一些大的东西…… 请持续关注。如果你想从事可扩展基础模型方面的工作,请联系我。」

这是前亚马逊机器学习总监 Alex Smola 在领英上更新的一些内容。资料显示,他已于 2023 年 2 月离开亚马逊,然后参与创办了一家名为 Boson.ai 的公司并担任 CEO。

图片

图片

据称,一同参与创业的可能还有亚马逊首席科学家李沐。不过,现在李沐并没有官宣加入的消息,我们只能从新公司的 GitHub 项目和一些推特帖子中找到一些蛛丝马迹。

图片

链接:https://github.com/boson-ai/homepage

图片

目前该公司的网站还在建设中,但其目标已经明确:在搞通用的大模型。

图片

Alex Smola 是全球机器学习领域著名科学家,卡耐基梅隆大学教授,畅销机器学习著作《动手学深度学习》的主要作者,迄今共发表了几百篇论文和多本学术专著,在全球范围享有盛誉。

在亚马逊,Alex Smola 领导着机器学习大学团队,此团队负责向每个人教授机器学习。同时,他还管理着 AutoGluon(一种易于使用的高质量 AutoML 工具)、DGL(深度图神经网络)、D2L.ai《动手学深度学习》项目、计算机视觉工具箱、NLP(自然语言处理套件)、深度学习编译器和 MXNet 框架团队等。

图片

李沐,2008 年毕业于上海交通大学计算机系(计算机系 ACM 班),大学期间曾在微软亚洲研究院担任实习生。2011 年 4 月 - 2012 年 8 月,李沐在百度担任高级研究员,后进入卡耐基梅隆大学读博,师从 Alex Smola 和 Dave Andersen。2017 年 CMU 博士毕业后,李沐加入亚马逊成为资深首席科学家,是深度学习框架 MXNet 的主要贡献者之一。

图片

李沐和 Alex Smola、Aston Zhang 等人共同撰写了《动手学深度学习》。最近两年,他一直通过视频向大家介绍各种 AI 知识,制作了几十篇论文的精读课程。很多同学已经养成了跟着李沐精读论文的习惯。

图片

李沐博士在 B 站的账号是「跟李沐学 AI」:https://space.bilibili.com/1567748478

2017 年,李沐曾在文章《博士这五年》中,介绍了自己的求学经历。后来他又写了《工作这五年》。不知创业后的李沐,会为我们带来哪些更精彩的故事。


参考内容:https://boson.ai/
产业大模型李沐
相关数据
微软亚洲研究院机构

微软亚洲研究院于1998年在北京成立,是微软公司在亚太地区设立的基础及应用研究机构,也是微软在美国本土以外规模最大的一个研究院。微软亚洲研究院从事自然用户界面、智能多媒体、大数据与知识挖掘、人工智能、云和边缘计算、计算机科学基础等领域的研究,致力于推动计算机科学前沿发展,着眼下一代革命性技术的创新,助力微软实现长远发展战略。

http://www.msra.cn
李沐人物

李沐,2008年毕业于上海交通大学计算机系,大学期间,曾在微软亚洲研究院担任实习生。2017年博士毕业后,李沐加入亚马逊任AI主任科学家。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

图神经网络技术

图网络即可以在社交网络或其它基于图形数据上运行的一般深度学习架构,它是一种基于图结构的广义神经网络。图网络一般是将底层图形作为计算图,并通过在整张图上传递、转换和聚合节点特征信息,从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微预测层的输入,并用于节点分类或预测节点之间的连接,完整的模型可以通过端到端的方式训练。

MXNet技术

MXNet是开源的,用来训练部署深层神经网络的深度学习框架。它是可扩展的,允许快速模型训练,并灵活支持多种语言(C ++,Python,Julia,Matlab,JavaScript, Go,R,Scala,Perl,Wolfram语言)

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

推荐文章
暂无评论
暂无评论~