疫情预测、学者数据、学术成果、政策地图,清华大学AMiner团队上线一系列疫情相关AI大数据产品

2019 年末,新型冠状病毒在中国武汉爆发,并迅速蔓延全国,引起了国人乃至全世界的广泛关注。

近日,清华大学计算机系 AMiner 团队利用 AI+大数据,上线了一系列疫情相关产品,包括新型冠状病毒疫情趋势预测新型冠状病毒高关注度专家学者分析新型冠状病毒肺炎学术成果时间线,以及新型冠状病毒肺炎疫情惠民惠企政策地图等,各位感兴趣的读者,可以通过下方链接和二维码进行访问。 

疫情预测

从 2019 年 12 月底爆发的新型冠状病毒肺炎疫情,已经持续了近两个月时间,人们也变得越来越恐慌和焦虑。疫情的拐点到底什么时候才会到来?疫情要到什么时候才能彻底过去?是现在大家最关心的问题。

AMiner 团队和智谱.AI 联合推出的新型冠状病毒疫情趋势预测模型,以官方公布历史数据为基础,引入医疗隔离和大众防疫因素,以智能 AI 算法预测确诊病例数量的变化趋势。

根据湖北省 2 月 12 日将临床诊断病例纳入确诊病例这一变化,本模型在原有医疗隔离和大众防疫因素的基础上,引入了新的感染期和诊断期因素。以潜伏期中位数 3 天和诊断期中位数 5 天为依据,将 12 日临床诊断确诊病例 13332 例按正态分布到近期确诊日期上。

而根据该预测模型,到本月下旬,全国每日新增确诊数量将大幅降到 100 以内,而到 3 月初,这一数字有望变成个位数。

学者数据

AMiner 平台收集融合了新冠病毒相关专家学者近 30 余年的科研行为数据,使用人工智能技术从学术影响力、研究兴趣、合作者网络等多个维度对多位全球高关注度专家学者的学术水平进行了深度分析。

其中,奋战在抗疫一线的钟南山和李兰娟两位院士,都曾在 SARS 的防治中取得了重要成果,不仅对疫情防治做出了巨大贡献,相关学术成果也尤为突出。AMiner 分析显示钟南山院士累计发表论文 360 余篇,研究兴趣包括哮喘、生物医学、慢性阻塞性肺疾病、传染病学等领域,其中在传染病学领域学术成就超越了 95% 的学者;李兰娟院士共发表论文 500 余篇,被引用数高达 1 万余次,在耐药监测和抗微生物剂领域学术成就分别超越了 99% 和 98% 的学者。

在这次疫情期间,还有一些国际顶级专家学者为中国抗击疫情助力而被大众所认知,比如国际顶级医学专家 W. Ian Lipkin,在传染病、免疫学等领域具有极高的学术影响力,而 Anthony S. Fauci 教授的研究兴趣包括病毒复制、医药学、传染病学等领域,学术影响力 H 指数高达 155;

此外,深陷抢发论文事件的高福院士,以及武汉病毒研究所所长王延轶,也受到了舆论的广泛关注。从学术角度来看,高福院士科研成果极为丰硕,具有 8 个院士头衔,H 指数为 32,论文被引量近 5000 次;而王延轶所长的学术影响力则相对较弱,发表论文 40 余篇,作者排名靠后的论文居多,但是学术活跃度值高达近 200。

学术成果时间线

新冠病毒肺炎疫情相关学术成果时间线,是基于 AMiner 平台专家、论文数据和舆情平台资讯数据,通过数据挖掘结合人工筛选,以时间轴的方式聚合当前最新和重点学术研究成果,包括公开在期刊杂志上发表和预印刷的论文、专家公开发表的研究观点和疫情相关的学术事件,为疫情和冠状病毒相关领域研究的学者和产业从业者提供 NCP 相关的学术情报。


数据来源及处理方式

  1. 专家、文献数据——AMiner 平台,从主流期刊和预印刷平台获取最新文献成果,通过 title、abstract、Keywords 主关键词和扩展关键词搜索相关文献,并通过期刊、年份、作者等维度筛选相对重要文献。

  2. 文献分析数据——智谱学术头条工作组解读,邀请新冠病毒研究领域外部专家对重要文章做解读以及收集其他媒体对文献的解读。

  3. 专家论点——抓取主流学术媒体和权威新闻媒体上公开发表或专家采访报道,并人工筛选;

  4. 学术事件数据——从权威渠道抓取针对疫情学术界和社会在科技和学术相关领域内采取的重点措施、方案,发布的政策文件,并人工筛选。

  5. 数据聚合——以上三类数据以时间轴的方式按照发表时间依次展示,形成学术研究演变脉络。

功能说明

  1. 数据更新:每日对论文、观点和事件三类信息做自动抓取,人工筛选后更新至时间线上显示;

  2. 成果展示类型:可以通过勾选对论文、论点和事件三类数据选择是否做单独展示或混合显示;

  3. 详情查看:论文添加链接,点击跳转到 AMiner 论文详情页;论点和事件添加链接,点击跳转到源网页;

  4. PC 端和移动端同时适配

惠民惠企政策地图

新冠病毒肺炎疫情惠民惠企政策地图,通过收录和可视化展示疫情下各级政府和组织根据自己情况制定和发布的惠民惠企政策,在展示上通过搜索、地图的方式便于用户快速查找,同时提供按照时间、省份维度的统计,为中心企业主、政策制定和管理者提供有效信息和参看依据。

数据来源及处理方式

政策数据主要来源于从国务院到县市各级政府门户网站公开发布的信息,对政策的发布时间、覆盖地区、主要内容做标签化处理和关系映射后,结构化存储,便于展示和检索。

功能说明

  1. 数据更新:每日对各级政府发布政策做自动抓取,人工筛选后更新至地图上显示,并录入统计结果;

  2. 政策搜索:通过关键字对地区、政策文件名做检索,按时间倒序展示;

  3. 地图查询:根据各地发布政策的数量在地图上差色显示,通过选中地区可以展示该地区发布的各类政策

  4. 详情查看:政策添加链接,点击跳转点击跳转到源网页。

  5. 政策数据统计:按照发布时间提供发布趋势的统计,按照归属地区提供各省份的统计

详细页面网址:

新型冠状病毒疫情趋势预测:

https://2019-ncov.aminer.cn/data

新型冠状病毒高关注度专家学者分析

https://2019-ncov.aminer.cn/

新型冠状病毒肺炎学术成果时间线

https://www.aminer.cn/2019-ncov-pubs-timeline

新型冠状病毒肺炎疫情惠民惠企政策地图

https://zhengce.aminer.cn/

AMiner学术头条
AMiner学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
产业AI清华疫情预测数据挖掘AMiner清华大学
相关数据
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

映射技术

映射指的是具有某种特殊结构的函数,或泛指类函数思想的范畴论中的态射。 逻辑和图论中也有一些不太常规的用法。其数学定义为:两个非空集合A与B间存在着对应关系f,而且对于A中的每一个元素x,B中总有有唯一的一个元素y与它对应,就这种对应为从A到B的映射,记作f:A→B。其中,y称为元素x在映射f下的象,记作:y=f(x)。x称为y关于映射f的原象*。*集合A中所有元素的象的集合称为映射f的值域,记作f(A)。同样的,在机器学习中,映射就是输入与输出之间的对应关系。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

推荐文章
暂无评论
暂无评论~