AI每日精选
AI每日精选 | 骑驴找马 : 利用深度强化学习模型定位新物体 / 人工智能控制成群无人驾驶飞机监视欧洲境内非法活动
研究与技术
ICLR 2019 | 骑驴找马:利用深度强化学习模型定位新物体
这是一篇被ICLR 2019 接收的论文《VISUAL SEMANTIC NAVIGATION USING SCENE PRIORS》。该论文讨论了如何利用场景先验知识 (scene priors)来定位一个新场景(novel scene)中未曾见过的物体(unseen objects)。举例来说,在「厨房」这一场景中,有一张图片显示「苹果」在冰箱的储物架上,同为水果的物体,如「橙子」,会出现在场景的哪个位置呢?论文提出了用基于强化学习的方法来定位「橙子」。
实证研究:网络宽度对随机梯度下降和泛化的影响
本篇论文《The Effect of Network Width on Stochastic Gradient Descent and Generalization: an Empirical Study 》研究了由随机梯度下降发现的最终参数如何受到过参数化的影响。研究者通过增加基线网络中的通道数生成几类模型,并进行大规模超参数搜索以探究测试误差如何依赖于学习率、批大小和网络宽度。研究者发现,最优SGD超参数取决于“归一化噪声尺度”,而这正是批大小、学习率和初始化条件的一种函数。在缺少批归一化的情况下,最优归一化噪声尺度与网络宽度成正比。网络宽度越大,最优噪声尺度越高,测试准确率也就越高。这些观察结果适用于MLP、ConvNet、ResNet以及其他两种不同的参数化方案(“Standard”和“NTK”)。研究者观察到用于ResNet的批归一化也有类似趋势。然而,由于最大的稳定学习率受限,与最优归一化噪声尺度保持一致的最大批大小随宽度的降低而下降。
从Densebox到Dubox:更快、性能更优、更易部署的anchor-free目标检测
论文《DuBox: No-Prior Box Objection Detection via Residual Dual Scale Detectors》介绍了一种新的一步检测方法Dubox,它可以在没有先验框的情况下检测物体。设计的双尺度残差单元具有多尺度特性,使双尺度检测器不再独立运行。高层检测器学习低层检测器的餐叉。Dubox增强了启发式引导的能力,进一步使第一尺度探测器能够最大限度地检测小目标,第二尺度探测器能够检测第一尺度探测器无法识别的目标。此外,对于每一个比例探测器,采用新的classification-regression strap loss,使检测过程不基于先验框。结合这些策略,检测算法在速度和精度方面取得了优异的性能。通过对VOC、COCO目标检测基准的大量实验,证实了该算法的有效性。
研究人员提出基于人工智能的病理学全滑动诊断方法
尽管计算机辅助诊断(CAD)快速增长,但全滑动病理诊断的应用仍然不太符合现实情况。研究人员们在《自然》杂志上提出了一种新的由人工智能驱动的病理学全滑动诊断方法,以提供可解释的相关诊断。该方法将人类诊断推理过程自动化,并将 gigapixels 直接解读为一系列可解释的预测以提供第二意见,从而鼓励临床达成共识。研究人员通过使用收集到的913例膀胱癌患者代表全片数据实例,研究人员所提出的研究方法匹配了 17 名病理学家在尿路上的皮癌诊断。 研究人员坚信该方法以一种创新且可靠的方法提供了临床诊断建议,并且可以作为下一代人工智能增强 CAD 技术用于诊断病理学低成本部署。
芬兰研究人员添加音频数据帮助AI在3D迷宫中到达目的地
视觉是人类在导航世界时依赖的主要感觉之一,但声音可能同样重要。目前已有研究表明,人们可以学习如何在音频信号的音量,方向和速度上找到微妙的线索。受此启发,东芬兰大学的科学家最近提出新研究,论文名为「自主智能体受益于听力?」,研究中提出的人工智能系统能通过声音为视觉数据提供补充信息。研究人员说道,初步结果表明,这种方法可以提高智能体在3D迷宫中完成目标的能力。 「只使用视觉信息进行学习对于学习智能体说并不总是那么容易,」作者写道。 「例如,在有很多房间且智能体和目标之间没有直接视线支持的情况下,智能体很难仅使用视觉信息到达目标......因此,使用音频功能可以提供有价值的信息。“(venturebeat)
亚马逊新技术博客,展望汽车语音服务的未来
机器之心获悉,亚马逊发布新技术博客,文章针对汽车语音服务的未来做了详细的解析。以下为主要观点总结:首先,大多数美国消费者希望在汽车中使用语音技术。在年轻一代中尤其如此:在X世代,Y世代和Z世代中,超过80%的受访者表示他们希望在他们的汽车中提供某种语音服务。 其次,熟悉家庭中的语音技术正在塑造对车辆语音的期望。对Y世代来说,选择具有同一品牌的家庭语音服务的人最多:83%的受访者有兴趣在他们的下一辆车上拥有相同品牌的家庭语音服务。 第三,年轻一代可能比他们对特定车辆品牌更忠诚于他们的语音服务。 74%的Y世代和79%的Z世代受访者表示他们肯定或可能通过品牌语音服务可用性来改变购车决定。这表明汽车制造商应该在车辆内部提供多种智能语音选项。
微软研究人员引入「害怕」助AI更安全地驾驶
近日,微软研究人员正在给人工智能程序中提供添加焦虑的粗略模拟,以帮助相应程序能在驾驶任务中表现更佳。科学家们将传感器放在人的手指上,以记录人类在驾驶模拟器中的脉搏振幅,作为一种唤醒的量度。随后利用算法使用以上记录,以四个人之间分配80分钟的形式,来学习预测普通人的脉冲幅度。然后,当模型在虚拟环境中学习驾驶时,它会使用这些「害怕」信号作为指导:如果一个人会在这里感到害怕,模型随之也会做出反应,「我做错了」使用这种方法的AI仍然会遇到撞车的经历从而学会相应的安全驾驶技能,但是有了恐惧因素的加入,其可以减百分之二十五的碰撞。研究人员进一步地研究这种唤醒是否仅仅是对墙壁距离粗略计算而做出的反应,因此他们训练了另一种人工智能来驱动使用的为墙壁而不是害怕。最终,引入「恐惧」被证明更有用,该论文假设道,出现以上现象的原因可能是因为编码而有了更丰富的可能是因为它编码了更丰富的期望,其中还可能包括转向过快时的惊慌感受。
吴恩达公司新博客:一文看懂神经网络初始化
Deeplearning.ai 最近发表了一篇关于神经网络初始化的博客。初始化可以对训练深度神经网络的收敛产生重大影响。 简单的初始化方案可以加速训练,同时需要注意避免常见的陷阱。 Deeplearning.ai 的这篇文章包含了以下四个部分:有效初始化的重要性;爆炸或消失梯度的问题 什么是正确的初始化?;Xavier 初始化的数学证明。
MIT 新研究:无线运动跟踪系统收集健康和行为数据
MIT 的研究人员正在利用信号反射为科学家和护理人员提供有关人们行为和健康的宝贵见解。 该系统称为 Marko,将低功率射频(RF)信号发送到环境中。 如果信号从移动的人体反弹,信号将返回系统并进行某些更改。 然后,新算法分析这些改变的反射并将它们与特定个体相关联。 在上周计算系统人类因素会议上发表的一篇论文中,MIT 的研究人员证明了该系统能够仅基于无线信号区分个体 - 并揭示了一些有用的行为模式。
加州伯克利大学新研究:开放世界中的大规模长尾识别
加州伯克利大学近日发表了最新的研究,开发了一种集成的开放式长尾 OLTR 算法,该算法将图像映射到特征空间,使得视觉概念可以基于尊重封闭世界分类的学习度量而容易地彼此相关,同时承认开放世界的新颖性。动态元嵌入结合了直接图像特征和相关的记忆特征,其特征规范表明了对已知类的熟悉程度。
德克萨斯奥斯汀分校及亚马逊研究团队提出深度预测模型 DeepGLO
机器之心消息,来自德克萨斯奥斯汀分校以及亚马逊的研究人员们发表了一篇关于进行高位时间序列预测的深度神经网络方法的研究论文。研究人员在论文中表示,预测高维时间序列在需求预测以及财务预测等许多应用中起着至关重要的作用。然而,目前大部文献都是一维研究,即使在整个数据集上进行训练,单个维度的未来预测也主要取决于相同维度的过去值。研究人员在本文中提出了一种在全球范围内进行思考然后在当地采取行动的深度预测模型 DeepGLO 来解决这一问题。作为一种混合模型,DeepGLO 将由时间深度网络规范化的全局矩阵分解模型与捕获特定于每个维度的模式的局部深度时间模型相结合。实验结果证明,该模型在不同数据集上都表现优异。
行业动态
北京亦庄年内将建成超过200个5G基站,实现5G全域覆盖
今年,北京经济技术开发区(北京亦庄)将建成超过200个5G基站,实现5G全域覆盖。目前,该开发区已拥有铁塔通讯基站299个,同时筛选建设2085根智慧路灯杆支撑5G时代无人驾驶。同时,北京智能车联产业创新中心正在进行基于5G的无人驾驶汽车试验,京东方、施耐德等数十家公司正在以5G网络环境为基础推动数字工厂、数字车间再升级。(北京日报)
上海发布2019年人工智能领域项目指南
5月13日,上海市人民政府官网发布消息称,为加快建设具有全球影响力的科技创新中心等目的,上海市科学技术委员会特发布2019年度人工智能领域项目指南。研究方向包括面向常识学习的超高维机器学习、新一代机器学习、人工智能关键共性技术赋能交通领域、人工智能关键共性技术赋能卫生健康领域及人工智能关键共性技术赋能社区这五大领域。(中证网)
美国食品和药物管理局批准首次AI胸部X光检查
日前,美国食品和药物管理局已对AI警报给予510(k)许可,以便及时发现胸部X光片中肺部塌陷。该批准是首个基于人工智能的胸部X光解决方案,其可以帮助医生通过世界上最常用的成像模式之一进行更快速的诊断。 Zebra Medical Vision是一家位于以色列的深度学习成像分析公司,获得了FDA对HealthPNX的批准,后者使用AI来提示气胸的发现,气胸可能导致肺部完全塌陷和可能致命的并发症。据该公司称,这种情况难以诊断,其晚期诊断或误诊则在每年会影响约74,000名美国人。 「在我们进行的临床验证研究中,Zebra-Med的急性CXR气胸和CT脑出血产品显示出有望大幅缩短周转时间并使得放射科医师更有信心地做出诊断」阿尔伯特成像主席Terence Matalon博士表示。(AIinHealthcare )
大公司新闻
华为打通全球首个5G语音+视频VoNR通话
5月14日消息,在IMT-2020(5G) 推进组组织的中国5G增强技术研发试验中,华为使用Mate 20X 5G版手机,打通了全球首个5G SA网络下的VoNR通话,包括语音和视频。VoNR是5GSA网络架构下的基本语音解决方案,本次通话基于IMT-2020(5G)推进组统一组织下华为搭建的5G网络,两部手机所在地相距超过60公里。(凤凰科技)
中国联通智能城市研究院在雄安新区揭牌
5月10日,中国联通智能城市研究院在雄安新区揭牌。该研究院将按照联通全方位参与雄安新区数字智能城市规划建设的定位与目标,以5G+AI赋能新区智能城市建设,推动新技术、新应用在雄安新区先行示范。中国联通智能城市研究院于今年4月注册成立,是中国联通在雄安新区注册的第一家集团直属研发咨询机构。
英伟达AI技术开始着手分析英国公共卫生系统的医疗扫描
近日,英伟达和伦敦国王学院联手建立和培训人工智能平台,为英国各地的医院解读放射扫描。这一合作伙伴关系是英国第一个开发人工智能系统,旨在为整个英国公共卫生系统 - 国家健康服务(NHS)开发,跨越多种临床途径,包括肿瘤学,心脏病学和神经病学,以及遍布全国的患者身上的患者数据。该人工智能联合项目是伦敦医学影像和人工智能人工智能中心的一部分,该中心于今年2月正式启用。作为英国政府工业战略挑战基金的一部分,该中心计划培训人工智能系统,不仅要处理医学影像信息,还要处理更广泛的患者数据。其希望利用AI为从业者提高效率和准确性,从而提高整个英国患者的诊断速度和护理的适当性。(newatlas)
英伟达计算平台为对冲基金关键算法提供超过 6,000 倍的加速
英伟达的AI平台正在提供超过 6,000 倍的加速度,用于运行对冲基金行业用于对交易策略的回溯测试进行基准测试的算法。这种巨大的 GPU 加速将对金融服务行业产生重大影响。 英伟达使用了 STAC-A3 展示了其计算平台的能力,STAC-A3 是用于回溯交易算法的金融服务行业基准套件,用于确定策略如何对历史数据执行。 使用运行加速 Python 库的 NVIDIA DGX-2 系统,英伟达打破了之前的几个 STAC-A3 基准测试结果,在一个案例中,在规定的 60 分钟测试期内,在 50 台仪器上运行了 2000 万次模拟,而之前的记录为 3,200 次模拟。
YouTube 推出 Bumper Machine, 利用机器学习自动创建 6 秒钟广告
即 YouTube 2016 年推出六秒钟「Bumper」广告格式后,该公司近日推出一款基于机器学习技术的新工具,帮助广告商从较长的广告中自动创建 6 秒钟的「Bumper」广告。YouTube 目前正在进行该工具 Alpha 版本测试,后续会进行 Beta 版测试并最终推出正式版本。据了解,该工具将在五月对广告商开放使用。(TechCrunch)
亚马逊推出订单打包机器,替代人类员工实现仓库自动化
据了解,亚马逊正计划推出打包机器来完成数千名员工的工作自动化,以增加客户订单。两名项目相关人员向媒体透露,亚马逊已于近几年开始在几个仓库中试用打包机器来扫描传送带上的货物,并在几秒钟内将货物打包进指定的包装盒中。亚马逊正在考虑在几十个仓库中分别安装两台机器,每台机器有望替代 24 个工作角色来完成通常需要 2000 多名员工协作才能完成的工作任务。一旦施行该计划,亚马逊计划在两年内收回在每台机器上所花费的 100 万美元以及相关运营费用。(路透社)
投融资
科钛机器人完成数千万元Pre-A轮融资
5月14日消息,专注于企业内部物流工业车辆的科钛机器人宣布完成数千万元Pre-A轮融资,由珪璋创投独家参投。对于该轮融资的规划,科钛机器人董事长林志赟表示,本轮融资主要用于科钛机器人的市场推广、销售以及技术研发两个方面。(亿欧)
AI物流公司Locus获2200万美元投资
印度软件公司Locus为路线优化和其他供应链应用提供人工智能解决方案,该公司目前已获得2200万美元的支持,并计划进一步扩展到北美和东南亚的新市场。 B轮融资由风险投资公司Falcon Edge Capital和Tiger Global Management领投,之前的投资者Exfinity Venture Partners和Blume Ventures亦有参与。该公司表示,Locus此前在2016年的A轮融资中筹集275万美元,在2018年筹集了400万美元的Pre-B轮资金,总投资额约为2700万美元。 这一消息标志着其最新注入的风险投资将进入供应链AI行业,以及JDA软件集团的Blue Yonder部门,FourKite的货运到达预测引擎,Noodle.ai与计算机零售商戴尔的合作,SAP AG的物流ERP, Infor的Coleman AI平台等。(dcvelocity)
产品与应用
人工智能控制成群无人驾驶飞机监视欧洲境内非法活动
欧盟正在资助一项实验以确保边界有成群无人机巡逻海陆空。这项耗资770万英镑的多年工程,被称为Roborder,依靠大量无人驾驶车辆,包括大型潜水器到小型飞行四轮车,来检测和识别走私者和贩运者的非法跨境犯罪分子。这些无人机将配备一系列复杂的传感器来定位和拍摄可能的非法活动,但不会被武装或授权拦截嫌疑人。相反,信息将被传送回控制室,从那里派遣人员进行逮捕。
AI帮助餐厅链选择新店地址
华尔街日报今日报道,餐厅连锁店正在使用人工智能来帮助决定在新店在哪选址。 帮助零售商挑选地址的软件应用程序已存在多年,但它们主要是映射工具,辅以有限数量的数据点,例如人口统计信息和流量模式。目前,总部位于达拉斯的位置管理软件供应商Tango Analytics的总裁兼首席执行官Pranav Tyagi表示,他们能够基于过去的数据集和简化的统计模型,并设计出相应的预测功能。新的基于AI的选址工具通常需要实时接收各种数据集,包括内部信息,如现有商店的位置,销售,竞争对手的商店和计划商店的所需大小;另有公共数据,例如社区的人口统计和收入,交通和街道模式;以及社交媒体活动等第三方数据,对于餐厅而言,还需要包括关于健康饮食区域中的地理标记帖子的数量。 据介绍,机器学习能够分析该信息和现有商店的销售业绩,预测出新选址的销售潜力,可以详尽到城市街区。 Tyagi先生说:“它可以将一个位置以1到100得分的形式呈现出来,”机器学习模型能告知这个新选址可能的销售额会是多少。
登录
后评论
暂无评论~
登录
去登录
文章库
PRO会员通讯
SOTA!模型
AI 好好用
文章库
PRO通讯会员
SOTA!模型
AI 好好用
登录