Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

机器之心编辑部机器之心报道

信通院最新AI人才竞争力报告:百度7大领域全面「一骑绝尘」

人才不够厚,搞什么大模型!

21世纪什么最贵?人才!随着人工智能迎来「iPhone时刻」,AI人才的稀缺性越发凸显。近日,在2023中国互联网大会的知识产权与创新论坛上,中国信息通信研究院知识产权与创新发展中心发布了《中国人工智能产业创新人才竞争力报告(2023年)》,百度在众多大厂和顶级高校的评比中,以85.5分的领先优势,勇夺“AI产业创新人才”冠军。在7大领域(预训练大模型、深度学习自然语言处理知识图谱,智能语音、计算机视觉、自动驾驶),均排名第一,体现了深厚的人才积淀和技术储备。

专利产出是产业人才竞争力的重要表征。该报告以全球公开专利数据库的数据为依据,分别选取近十年、近三年的专利申请量和发明专利授权量数据。深入挖掘团队专利数据信息,通过加权计算获得最终竞争力分数。其中,人才团队的“成果规模”和“创新能力”是最重要的两项评价指标,团队的成长性、技术影响力、市场影响力、知识产权保护能力和团队规模被赋予了次级重要的权重。

一、科技大厂人才密度领先,且聚集效果明显,百度大幅度领先

百度、腾讯、华为三家大厂占据产业人才竞争力TOP3。百度团队竞争力分值高达85.5分,在成果规模和创新力两个重要小项上遥遥领先。百度公司首席技术官王海峰博士是自然语言处理领域世界上最具影响力的国际学术组织ACL(Association for Computational Linguistics)历史上首位华人主席、ACL亚太分会创始主席、ACL Fellow,IEEE Fellow、CAAI Fellow及国际欧亚科学院院士。百度团队发明专利在申请国际同族专利数量、专利权利保护范围方面均处于高水平,与其他大厂相比,分数遥遥领先。

二、百度在人工智能7项关键技术竞争力排名中全部获得第一名,在预训练大模型、深度学习、自然语音处理、知识图谱计算机视觉领域优势明显

1.预训练大模型:百度2019年推出了产业级文心大模型,模型参数规模、训练数据模态以及产业应用方面不断升级,构建了业界规模最大的产业大模型体系。2023年3月推出知识增强大语言模型「文心一言」,具备跨模态、跨语言的深度语义理解与生成能力,具有文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五大能力。百度大模型研发团队竞争力分值达到88.3分,在预训练大模型的创新成果、创新能力和团队规模上领先于国内其他企业。

2.深度学习作为重度投入深度学习10年的头部大厂,百度在创新保护能力、拓展技术和市场影响力方面全面领先。百度公司深度学习团队发明专利申请量和发明授权量均领先于国内其他企业,其深度学习相关发明专利超过5000件,发明授权专利量超过1300件,近三年的申请量占到总申请量84%以上,团队的成长性强,团队竞争力分值达到88.4分,位列第一。

3.自然语言处理作为全球第一个发布类ChatGPT产品的科技大厂。百度在大语言模型最核心的自然语言处理领域拥有着绝对优势。百度在自然语言处理领域发明专利申请数量超过2100件,授权发明数量接近千件,平均每件专利的发明人数量高于业内平均值,近几年的发明专利申请量占到总量的58%,百度在自然语言处理领域拥有雄厚的研究基础和极具期待的成长性。

4.知识图谱报告指出,百度团队的竞争力分值达到83.7分,位列第一。百度公司知识图谱团队发明专利申请量1500件,发明授权专利量约580件,近三年的申请量占到总申请量60.9%。而知识图谱正是文心大模型特色能力“知识增强”的核心支撑。

5.计算机视觉计算机视觉是应用落地较早、较为成熟的人工智能关键技术之一,同时也是多模态大模型所需具备的核心能力。百度经过长期的积累,在技术影响力、市场认可和知识产权保护方面突出,专利平均被引用的次数有1.2次。

6.其他领域:在智能语音、自动驾驶等其他AI相关领域,百度依然以绝对优势获得榜首位置。

国内智能语音领域企业团队竞争指标对比

国内自动驾驶领域企业团队竞争指标对比 


三、“芯片-框架-模型-应用”端到端优化,稳定的人才与专利护航,文心大模型成功超越ChatGPT3.5,拿下国内第一

百度早在2019年就推出文心大模型的1.0版本,在保持核心团队稳定的前提下,经过多年的高投入发展,成功登顶国内大模型第一的宝座。近日,全球领先的IT市场研究和咨询公司IDC最新发布《AI大模型技术能力评估报告,2023》,百度文心大模型拿下12项指标的7个满分,综合评分绝对第一。代表技术实力的“算法模型”更是获得了唯一一个满分。作为大模型技术的突破者和应用引领者,飞桨与文心的协同优化,让文心大模型3.5最新版本的模型效果提升50%,训练速度提升2倍,推理速度提升30倍。

IDC《AI大模型技术能力评估报告,2023》


四、最强的人才、最好的技术,成就最大的产业应用规模。

文心一言拥有中国最大产业应用规模,源于产业实践,服务于产业实践。大模型已经到了产业落地的关键期,不再单单的比拼参数,目前已经到了比拼应用的阶段。百度在业内首次提出了行业大模型的落地思路,联合国家电网、浦发银行、泰康、吉利、哈尔滨市、深圳燃气、TCL、上海辞书出版社等企业单位,合作发布了11个行业大模型,是业内最早和广泛深入推动行业大模型的厂商。据介绍,文心大模型已经拥有中国最大的产业应用规模,目前有15万家企业申请接入文心一言测试。百度智能云与300多家生态伙伴,在超过400个场景中已取得相当不错的测试效果。

在“大模型即将改变世界”的历史机遇面前,百度将持续加强人才资源建设和能力储备,不断探索大模型的能力上限,用最好的技术参与全球竞争,用最好的产品服务全社会。


产业分析百度
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

推荐文章
暂无评论
暂无评论~