Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

AI大模型团队Colossal-AI破局创新,火热招募中!

公司简介


潞晨科技致力于解放 AI 生产力,通过高效多维并行、异构内存管理、大规模优化库、自适应任务调度等自研技术,打造面向大模型时代的通用深度学习系统 Colossal-AI ,高效促进 AI 大模型落地应用,助力企业低成本实现 AI 智能化产业升级。

公司核心成员来自美国加州伯克利、斯坦福、清华、北大、新加坡国立、南洋理工大学等世界一流高校,在国际顶级学术刊物或会议共发表论文近百篇,曾在谷歌、微软、NVIDIA、IBM英特尔等头部科技公司任职,在高性能计算,人工智能,分布式系统方面已有十余年的技术积累,对核心技术、行业理解、产品落地等方面有卓越优势。

近日,潞晨科技宣布完成数亿元的 A 轮融资,主要用于团队扩张和业务拓展。

更多详情🔎可了解:https://mp.weixin.qq.com/s/9PTIDIu9mmPtfK6km9xZqA。 

招聘类型:社招、校招、实习招;

岗位 Base:北京、上海、新加坡;

联系邮箱:hr@hpcaitech.com。

潞晨为员工创造舒适和灵感迸发的工作场所,提供一个高效和创造性的工作环境。

图片




图片



图片

潞晨科技办公环境。

如果你对 AI 大模型的开发和应用充满热情,请阅读以下招聘要求和职责,并提交你的简历,加入他们,共同探索创新的 AI 解决方案,挑战技术的极限,解放AI生产力!

在招岗位

  • AI 大模型训练研发工程师
  • AI 大模型算法工程师
  • AI 大模型推理工程师
  • 云计算研发工程师

岗位详情

AI 大模型训练研发工程师

岗位职责:

  1. 参与 ColossalAI 分布式深度学习系统的开发,负责设计、实现以及优化各类分布式训练技术;
  2. 参与 Colossal-AI 与各类社区项目(比如 PyTorch Lightning, Hugging Face)的集成;
  3. 维护开源社区,参与社区用户互动以及维护开源项目基础设施。

任职要求:

  1. 精通 PyTorch,了解 Tensorflow/Caffe 等任意一种深度学习框架,并掌握 DeepSpeed/NVIDIA Megatron/Ray 等分布式训练框架;
  2. 熟悉 BERT/GPT/Diffusion 等当前热门的 CV/NLP/Audio 模型,有百亿 / 千亿大模型分布式训练经验;
  3. 了解并行计算、CUDA、网络通信、系统优化、集群硬件架构等 HPC 相关的知识;
  4. 具备良好的编程能力,熟练掌握 Python,掌握 C++、数据结构和算法设计,熟悉 Linux / Unix 系统和 Shell 编程,熟练使用 Git;
  5. 至少一年以上的 AI 分布式系统研发相关经验,计算机、人工智能机器学习等相关专业硕士及以上学历,有丰富相关经历的本科生也可以投递。

加分项:

  • 知名开源项目贡献者;
  • 了解深度学习编译器;
  • 获得过编程竞赛奖项;
  • 在顶级会议发表过高质量系统方向的论文。

AI 大模型算法工程师

岗位职责:

  1. 熟悉 AI 算法原理或 AI 应用系统;
  2. 从事 NLP / 多模态相关机器学习 / 深度学习等技术的研究与应用,包括且不限于对话系统信息抽取、文档摘要、文本生成等;
  3. 探索自然语言、多模态技术在业务中的落地和创新,并迅速进行转化;
  4. 研究、实现业界最先进的多语言 NLP / 多模态大模型。

任职要求:

  1. 深度学习对话系统文本分析文本生成等实际项目经验,熟悉深度学习自然语言处理方向的相关算法、框架和工具链 (Pytorch, Huggingface),有生成类任务实际项目经验优先;
  2. 熟悉 BERT / GPT-3 / Bloom / LLaMa 等 NLP 大模型,有百亿 / 千亿大模型训练调优经验、Prompt 设计经验者优先;
  3. 具备良好的编程能力,熟练掌握 Python、数据结构和算法设计,熟悉 Linux / Unix 系统和 Shell 编程,熟练使用 Git;
  4. 计算机、自然语言处理人工智能机器学习等相关专业硕士及以上学历;
  5. 至少 2 年以上自然语言处理相关经验,熟悉自然语言处理机器学习深度学习强化学习等相关算法,对自然语言处理方向有较深和全面的认识。

加分项:

  1. 有分布式集群,单机多卡,多机多卡 NLP 大模型预训练,微调及推理经验者优先;
  2. 具备英文专业文献阅读能力,能自觉跟踪发展现状,理解算法原理,并进行落地实现,有 NLP 领域高水平 paper 者优先。

AI 大模型推理工程师

岗位职责:

  1. 针对 Colossal-AI 深度学习框架算子层的优化,完成深度学习算子在 CUDA 上的实现;
  2. 负责和参与机器学习推理引擎的架构设计、系统开发、高性能优化,打造 AI 大模型的基础设施平台。

任职要求:

  1. 本科及以上学历,计算机、数学等相关专业;
  2. 熟练掌握 C/C++,具有良好的工程能力、编程习惯、以及沟通能力;
  3. 熟练掌握 GPU 平台的高性能计算优化技巧;
  4. 2 年以上 CUDA/triton 编程工作经验者优先,深入了解 Transformer、LLM 模型者优先考虑。

加分项:

  1. 深入了解量化推理者优先;
  2. 有 TVM、TensorRT 等推理平台优化经验者优先;
  3. 了解并行推理技术的优先;

云计算研发工程师

岗位职责:

  1. 负责人工智能云平台核心模块开发,包括训练服务,推理服务。涉及前后端开发。
  2. 负责基础设施搭建,如 CI/CD 等,实现云端产品部署 pipeline,支持快速部署产 Demo。
  3. 负责云平台管理及性能优化。

任职要求:

  1. 熟悉 AWS、Azure、Google Cloud、阿里云等相关云厂商;
  2. 熟悉各类常见的分布式框架以及 kubernetes 开发,如 flink、spark、kafka、redis、docker、k8s、terraform 等 ,有 kubernetes operator/crds 开发经验者优先;
  3. 熟悉 C++ 编程、Python 编程或者 Go 语言编程,有大型软件编程经验,如:分布式系统、操作系统、编译器、数据库等软件开发经验优先;
  4. 熟悉 AI 算法原理或 AI 应用系统;

特别说明:上述岗位JD对于特别优秀的校招、实习招候选人工作年限可以放宽要求,不做特定限制。
产业招聘
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

文本分析技术

文本分析是指对文本的表示及其特征项的选取;文本分析是文本挖掘、信息检索的一个基本问题,它把从文本中抽取出的特征词进行量化来表示文本信息。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

对话系统技术

对话系统大致被分成两类: 任务为导向的对话系统,帮助用户去完成特定任务,比如找商品,订住宿,订餐厅等。实现任务为导向的对话系统,主要有两类方式,流水线方法和端到端方法。非任务导向的对话系统,与用户进行互动并提供回答,简单的说,就是在开放领域的闲聊。实现非任务导向对话系统也主要可分为两类,生成方法和基于检索的方法。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

推理引擎技术

推理机是实施问题求解的核心执行机构,常见于专家系统。它是对知识进行解释的程序,根据知识的语义,对按一定策略找到的知识进行解释执行,并把结果记录到动态库的适当空间中去。

信息抽取技术

信息/数据抽取是指从非结构化或半结构化文档中提取结构化信息的技术。信息抽取有两部分:命名实体识别(目标是识别和分类真实世界里的知名实体)和关系提取(目标是提取实体之间的语义关系)。概率模型/分类器可以帮助实现这些任务。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

阿里云机构

阿里云创立于2009年,是全球领先的云计算及人工智能科技公司,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。 阿里云服务着制造、金融、政务、交通、医疗、电信、能源等众多领域的领军企业,包括中国联通、12306、中石化、中石油、飞利浦、华大基因等大型企业客户,以及微博、知乎、锤子科技等明星互联网公司。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录。 阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。 2014年,阿里云曾帮助用户抵御全球互联网史上最大的DDoS攻击,峰值流量达到每秒453.8Gb 。在Sort Benchmark 2016 排序竞赛 CloudSort项目中,阿里云以1.44$/TB的排序花费打破了AWS保持的4.51$/TB纪录。在Sort Benchmark 2015,阿里云利用自研的分布式计算平台ODPS,377秒完成100TB数据排序,刷新了Apache Spark 1406秒的世界纪录。 2018年9月22日,2018杭州·云栖大会上阿里云宣布成立全球交付中心。

https://www.aliyun.com/about?spm=5176.12825654.7y9jhqsfz.76.e9392c4afbC15r
文本生成技术

文本生成是生成文本的任务,其目的是使人类书写文本难以区分。

Audi机构

奥迪是一间德国跨国豪华汽车制造商,主要从事豪华和高性能汽车制造业。总部位于德国巴伐利亚州的英戈尔施塔特。是大众集团的成员。奥迪与德国品牌宝马和梅赛德斯-奔驰一起,是世界上最畅销的豪华汽车品牌之一。

http://www.audi.com/
量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

推荐文章
暂无评论
暂无评论~