专题

早报

AI每日精选 | 「史上最强GAN图像生成器」BigGAN的demo出了!/ 谷歌开源新AI模型,语音区分准确率高达92%

周一至周六晚上 9:00,你需要知道的AI大事汇总    

产品与应用

「史上最强GAN图像生成器」BigGAN的demo出了!

机器之心11月13日消息,DeepMind 放出了 BigGAN 的拿来即用 TF Hub demo,可以在 Colab 上运行图像生成和图像插值任务。据悉,BigGAN 一经提出即引起了大量关注,被称为「史上最强 GAN 图像生成器」。该研究的创新点是将正交正则化的思想引入 GAN,通过对输入先验分布 z 的适时截断大大提升了 GAN 的生成性能,在 ImageNet 数据集下 Inception Score 竟然比当前最好 GAN 模型 SAGAN 提高了 100 多分(接近 2 倍)!

1460万个目标检测边界框:谷歌开源Open Images V4数据集

Open Images 是谷歌开源的一个大型数据集,包含大约 900 万张图像,这些图像用图像级别的标签和目标边界框进行了标注。最近,谷歌发表论文《The Open Images Dataset V4: Unified image classification, object detection, and visual relationship detection at scale》,发布了该数据集的第四个版本——Open Images V4,图像数量增加到 920 万,其训练集包含 1460 万个边界框,用于标识从属于 600 个目标类别的 174 万张图像中的目标,这使它成为了现有的含有目标位置标注的最大数据集。

DeepMindAI公布BigGAN模型生成器

DeepMindAI今天在社交网络推特上称,早先发表的「用于高保真自然图像合成的大规模生成对抗网络训练」论文中BigGAN模型生成器现能通过TF Hub 获得。该论文研究中曾证明了生成式对抗网络受过训练之后能在保证保真度的同时模拟自然图像。DeepMindAI 这项研究同时也实现了BigGAN模型在ImageNet中创造了新的性能水平。(twitter)

MIT人工智能实验室推出可微分蒙特卡罗光线追踪器,采用边缘采样算法

机器之心获悉,MIT人工智能实验室于今日发表新论文《Differentiable Monte Carlo Ray Tracing through Edge Sampling》,推出一个通用的可微分射线追踪器,MIT表示这是第一个能够计算渲染图像上标量函数衍生物的综合解决方案,且该团队采用了一种新颖的边缘采样算法,它直接对由不连续被积函数的导数引入的狄拉克δ函数进行采样。MIT称,计算梯度的能力对于优化、逆问题和深度学习至关重要。该团队的方法可以在几秒到几分钟的时间内生成梯度,具体取决于场景复杂度和所需精度。

中山大学刘奕志团队创建机器学习模型,预测中国青少年10年内的近视度数变化与高度近视风险

近日,来自中山大学中山眼科中心的刘奕志教授团队利用机器学习技术及验光数据,创建了一个机器学习模型,来预测中国青少年10年内的近视度数变化与高度近视风险。该研究成果的原创论文已经在国际医学杂志《PLoS Medicine》官网首页进行了发表。如果能够早期预测其发展规律,通过增加户外活动等早期干预手段,就可减缓近视眼的出现及发展,同时降低高度近视的风险。  

据悉,从2005年到2015年这十年的时间里,中山眼科中心研究团队共集合八家医疗机构的数据,收集了125万次随访验光结果,这些数据来自于12.9万名6岁至20岁的青少年,地域分布以南方省份为主,并辐射全国。在这些数据的基础上,刘奕志教授团队利用年龄、验光球镜数值(SE)和过去的年进展率(APR)来训练了一个随机森林算法,从而预测未来十年内高度近视的发病情况。  

对算法模型的测试结果显示,该模型可对近视进展趋势进行个体化预测,3年内准确率达90%,10年内准确率80%以上,也可提前8年有效预测高度近视,为近视眼的精准干预提供了科学依据。目前,这套模型已在AI医生身上植入,进入调试阶段。

驭势科技携手上汽通用五菱交付业内首款智能泊车产品

上汽通用五菱与驭势科技在柳州莲花山庄举行了主题为「新时代 新出行」的宝骏 E200 智能泊车交付,暨上汽通用五菱-驭势科技战略合作签约仪式,共同开启智能驾驶新时代,迎接全新的出行方式。此举是业内首款 L4 级无人驾驶-智能泊车产品的落地交付,也是中国无人驾驶技术迈向大规模商业化落地的第一步。 

当用户需要用车时,不需要像以往一样在停车场内寻找车辆,只需打开 APP,选择一键用车,车辆便会自动点火上电,顺利驾驶出泊车位,并且行驶到用户所在的上车点。整个停车和召车的过程,只需通过 APP 下达指令,车辆远程接受命令后执行,在驾驶过程中,车辆会自动避障,规划合适的自动行驶路线。 

此次由上汽通用五菱和驭势科技共同开发完成的智能泊车方案,不依赖于高成本的激光雷达,而是采用了摄像头和超声波传感器的组合。摄像头用于车辆的定位,同时与超声波传感器共同判断障碍物。驭势科技自主研发的 HMI 人机交互系统将手机端收到的指令传递到云端,云端再将指令传输到车端,车辆展开自动泊车。

电子设计自动化公司Cadence发布Tensilica DNA100、Tensilica HiFi5 DSP

近日,全球领先的电子设计自动化公司Cadence陆续发布了两款全新产品:首款深度神经网络加速器AI处理器IP Tensilica DNA 100;面向音频和语音处理的DSP Tensilica HiFi5。  

在今日于北京举办的Tensilica系列新产品发布暨AI研讨会上,Cadence公司IP事业部Tensilica资深产品总监Lazaar Louis与Cadence公司IP事业部Tensilica技术营销总监分别对此两款产品进行了介绍:

1.Tensilica DNA 100处理器IP是Cadence首款深度神经网络加速器(DNA)AI处理器IP,能够为终端侧(on-device)AI提供业界领先的性能与能效。无论小至0.5 还是大到数百TeraMAC(TMAC),均可实现高性能和高能效。DNA 100处理器非常适用于自动驾驶汽车(AV)、ADAS、监视、机器人、无人机、增强现实(AR)/虚拟现实(VR)、智能手机、智能家居和物联网领域的设备端神经网络推理应用。较其他采用相似阵列尺寸大小的乘法累加运算(MAC)解决方案,DNA 100处理器性能提升达4.7倍,每瓦特性能提升高达2.3倍。  

2.Tensilica HiFi 5 音频/语音数字信号处理器IP则是Cadence Tensilica HiFi DSP系列的最新及最高性能的产品成员。这一产品系列是全球最广泛使用的音频/声音/语音处理器,拥有全球最完善的生态系统,截至目前在全球有超过100家软件合作伙伴,支持超过225个经过验证的软件包。目前,全球超过80家领先半导体公司和系统OEM厂商选择了Tensilica HiFi DSP,将其用于音频、声音和语音产品,目前Tensilica HiFi DSP每年出货量超过10亿。

研究与技术

谷歌开源新AI模型,语音区分准确率高达92%

近日,谷歌 AI 研究部门的研究者发表论文《Fully Supervised Speaker Diarization》,该论文描述了一种新的 AI 系统,它能以 9 2% 的准确率识别出每个人声音的专属模式。 

这套系统涉及到 Speaker diarization 任务,即需要标注出「谁」从「什么时候」到「什么时候」在说话,将语音样本分割成独特的、同构片段的过程。强大的 AI 系统必须能够将新的演讲者发音与它以前从未遇到过的语音片段关联起来。 

论文中称,研究人员把核心算法放在数据集 NIST SRE 2000 CALLHOME 上验证,最后得出的在线分类错误率(DER)低至 7.6%。Google 研究人员的新方法是通过递归神经网络(RNN)模拟说话者的输入,只要开始发言,每个说话者都会建立一个属于他的 RNN 模型,然后在过程中,不断更新相应的 RNN 状态。

NIPS 2018:MIT新研究参透批归一化原理

批归一化(BatchNorm)是一种广泛采用的技术,用于更快速、更稳定地训练深度神经网络(DNN)。尽管应用广泛,但 BatchNorm 有效的确切原因我们尚不清楚。人们普遍认为,这种效果源于在训练过程中控制层输入分布的变化来减少所谓的「内部协方差偏移」。但MIT的研究者近日发表论文《How Does Batch Normalization Help Optimization?》,研究发现二者并无关系。研究者证明 BatchNorm 以一种基础的方式影响着网络的训练:它使相关优化问题的解空间更平滑了。这确保梯度更具预测性,从而允许使用更大范围的学习率,实现更快的网络收敛。该研究提供这些发现的经验性证明和理论依据。据悉,该论文已被 NIPS 2018 接收。

烧脑!CMU、北大等合著论文真的找到了神经网络的全局最优解

近日,CMU、北大和 MIT 的研究者发表论文《Gradient Descent Finds Global Minima of Deep Neural Networks》,该论文证明了对于具有残差连接的深度超参数神经网络(ResNet),梯度下降可以在多项式时间内实现零训练损失。研究者的分析依赖于神经网络架构引入的格拉姆矩阵的多项式结构。这种结构帮助研究者证明格拉姆矩阵在训练过程中的稳定性,而且这种稳定性意味着梯度下降算法的全局最优性。

加州大学伯克利分校研究员提出基于深度强化学习的星际争霸II模块化架构

机器之心获悉,加州大学伯克利分校研究团队近日发表论文《Modular Architecture for StarCraft II with Deep Reinforcement Learning 》提出了一个基于深度强化学习的星际争霸 II 模块化结构。该体系结构在多个模块之间分配责任,每个模块控制游戏的一个方面,例如构建顺序选择或策略。研究员应用深度强化学习技术来训练模块化代理中的两个模块中的两个,并进行自我游戏,在 Zerg vs. Zerg 比赛中对抗「Harder」(5 级)内置暴雪机器人获得 94%或 87%的赢率。

大公司

西门子在阿布扎比开设中心,为石油和天然气行业开发人工智能技术

德国科技巨头西门子在阿布扎比开设新中心,为水和石油天然气行业的区域客户开发基于数字和人工智能的解决方案,作为5亿美元投资计划的一部分,以扩大其在中东地区的影响力。新中心是阿联酋第二个将使用该公司基于云的开放式物联网(IoT)操作系统MindSphere的中心。西门子在全球拥有20个MindSphere应用中心,旨在为其物联网和人工智能技术开发新的商业模式和工业应用。(thenational)

百度智能驾驶业务或被分拆,今年信息流营收目标300亿

据了解,作为陆奇就职百度期间最为看重的两大人工智能业务之一,百度智能驾驶业务被重新列入分拆计划。不仅仅是计划拆分智能驾驶业务,半年以来百度对于「主航道」的瘦身和重磅押注信息流都表明百度对陆奇路线的修正仍在继续。知情人士称,百度今年对信息流的营收目标已调高至 300 亿左右,今年完成 200 亿左右的营收应该没什么问题。(腾讯潜望)

英特尔正加紧推出新5G调制解调器

据外媒报道,英特尔正在加紧推出新的5G调制解调器XMM 8160,计划在半年内推出。其无线部分现在将于2019年下半年完成,并承诺为手机、PC和家庭宽带提供高达6Gbps的速度。 它也支持LTE和早期技术,因此设备制造商不需要有两个芯片消耗额外的空间和电池寿命。

商飞与腾讯云共推大飞机智能制造,在5G、大数据、AI领域进行合作

近日,中国商飞上海飞机制造有限公司(简称「上飞公司」)与腾讯云签订战略合作协议。协议的签订标志着双方在民机智能制造领域达成重要共识,将共同推进云计算、大数据、人工智能和 5G 等前沿技术在航空工业及相关上下游领域的广泛应用,共同组建联合工作小组,开展在航空工业及相关上下游领域的项目合作及应用试点,探索 5G 智能制造中的网络安全与信息安全合作机会,开展相关领域的 5G 外场试验验证,共建 5G 外场试验网和应用示范。 在 5G 工业互联网领域政策方面,双方将共同进行产业推动、标准化和开源项目、社区推进等。通过联合培养针对工业行业领域的 5G 技术工程师、系统集成应用工程师,开展面向工业行业领域的 5G 人工智能应用相关培训,为相关技术领域输送高精尖人才。

资本

Vista以19.4亿美元的价格收购Apptio

11月13日,Vista Equity Partners宣布以19.4亿美元的价格收购Apptio,代表股东溢价53%。Vista以每股38美元的价格收购了Apptio,该公司帮助公司管理和了解他们在混合IT环境中的云支出,该环境中有资产在本地和云端。 该公司成立于2007年,正值云计算开始腾飞,并高速发展。 (techcrunch)

区块链公司EVAIO计划向FF投资9亿美元

近日,电动汽车区块链公司 EVAIO 已与法拉第未来(以下简称:FF)、美国投资银行 Stifel 进行了接洽,EVAIO希望在三年内通过STO方式投资FF总计 9 亿美元,具体投资细节还未完全确定。由于资金短缺,FF 的 2018 年量产目标遥遥无期,此前已出现裁员和全员降薪的举动。如果能与EVAIO 达成合作,FF 的资金压力将得到部分缓解。  

据悉,本次的投资主体 EVAIO(原名EVA.IO,全称 Electric Vehicle Application In&Out)成立于 2017 年,与特斯拉有很深的渊源。EVAIO的CEO Patrick De Potter 是特斯拉的第 185 号员工、前欧洲区领导成员之一,其核心团队也基本由前特斯拉高管及员工组成。(36氪)

Kofax以4亿美元现金收购Nuance的成像部门

11月13日,Kofax和Nuance宣布Kofax将以4亿美元的现金收购Nuance的成像部门,预计将于2019年第一季度完成。此次收购对于Kofax来说是一个值得注意的举动 - 去年Thoma Bravo以15亿美元的价格收购了Kofax,并让它继续在机器人过程自动化(RPA)领域开展业务。这是一个使用机器学习、计算机视觉等技术实现过去由人类完成的重复或平凡的后台任务。 Nuance的成像部门去年占其收入的约11%,并且已经表示将对其业务进行若干改变以使其合理化并专注于更有利可图的运营。 如今,其50亿美元业务中最大的部分是医疗保健解决方案、企业和汽车。(techcrunch)

金融产品智选平台CashCash获数百万美元A轮融资,创世伙伴领投

11月13日消息,金融产品智选平台CashCash宣布近日完成由创世伙伴资本(CCV)领投,清科创投和真格基金跟投的数百万美元A轮融资,老股东融360等继续加码支持。2018年2月,CashCash完成融360、梅花创投数百万美元Pre-A轮投资。本轮融资将用于完善平台及社区体系,增加用户规模和数据积累。 

据了解,CashCash自 2017 年年底上线,上线十天就做到了 Google Play 商店印尼当地金融产品下载量的首位,并逐步发展了金融产品社区、助贷客服板块,拥有大量的金融产品详细评论和对比内容,已成为印尼最大的金融产品智能搜索和推荐平台。专注并坚持做服务和社区,尤其注重贷前服务,是CashCash能够脱颖而出的重要原因之一。

「沃享科技」获「明源云」数千万元A轮融资,为购物中心提供智慧商业解决方案

近日,智慧商业解决方案提供商沃享科技获得数千万元A轮融资,投资方为明源云。  

本轮融资后,沃享科技将会在技术方面加大投入:一是人脸识别应用、移动端便利化、行业数据源协同等方面的技术创新,以及在数据打通的基础上加速人工智能的商业应用;二是团队会尝试把互联网的先进技术体系带入购物中心,加强其运营能力。  

据悉,沃享科技成立于2013年,是一家智慧商业解决方案提供商,主要为购物中心提供完整的智慧商业运营工具,实现会员、积分、卡券、数据、运营一体化,提升管理效率。

行业动态

加拿大汽车协会利用人工智能预测车辆故障,提供道路援助

加拿大汽车协会(CAA)日前表示,协会内部已开发出一项基于人工智能的新预测分析技术「Gen 2」,它将能够在车辆发生故障之前将援助卡车送到特定地点。「Gen 2」的预测技术是一种专有的机器学习算法,它使用历史数据、天气和湿度指示器,以及实时交通和 GPS 信息。加拿大汽车协会表示,Gen 2 系统已于 2018 年 1 月在安大略省进行试点。

欧盟新非个人数据法规出台,旨在推进人工智能等新兴技术

近日,由成员国政府首脑组成的欧盟理事会已经制定了一系列新规则,以减少欧盟内部非个人数据自由流动的障碍。据官方声明称,新规则的推行「旨在促进数据经济和跨境自动系统和人工智能等新兴技术的发展」。(computerweekly.com)

英国陆军进行大规模机器人测试

据每日邮报报道,英国陆军已开始对战场机器人进行前所未有的大规模测试。据英国政府称,这次被称为「2018年自治战士」的活动将持续约四周,并将在陆地环境中突破技术和军事能力的界限。此次活动将在战场模拟中测试一系列原型机器人和自动系统(RAS)。 这些将包括无人驾驶坦克车辆、远程机器人精确制导目标和自主地面再补给车辆,旨在减少战斗期间部队的危险。

Strategy Analytics:今年Q3全球智能音箱出货量达2270万部

Strategy Analytics的研究报告指出,今年Q3全球智能音箱出货量同比增长197%,达到2270万部,并在本年最后一个季度有望超过1亿台的使用量。亚马逊以32%的市场份额仍排名第一,其次是谷歌占23%。中国的百度的份额从2018年Q2的1%增加到2018年Q3度的8%。

网曝华为麒麟980的双核NPU采用寒武纪授权核心,而非自研

近日,寒武纪在官网发布了一篇关于寒武纪与华为方面合作情况介绍的文章,证实了华为麒麟980采用的双核NPU(神经元网络处理单元)采用的依然是来自寒武纪的核心授权,而非自家研制的昇腾310或昇腾910核心。从麒麟970开始,华为开始在自家芯片中加入NPU,来加强手机的AI计算能力,主要体现在用户习惯学习和图像识别领域。

据悉,寒武纪智能是一家成立于2015年的独立芯片公司,孵化自中科院计算所,拥有终端AI处理器IP和云端高性能AI芯片两条产品线。华为麒麟980处理器被首先应用在最新发布的Mate 20系列手机上。麒麟980采用和苹果A12一样的7nm制程工艺、双核NPU,使得Mate 20在AI Benchmark上排名第一。

中科院将在港设立院属机构,着力打造医疗和人工智能科研平台

11 月 8 日,香港特别行政区行政长官林郑月娥与中国科学院院长、党组书记白春礼,在香港分别代表特区政府和中科院签署备忘录,确定中科院将在香港设立院属机构,推动中科院广州生物医药与健康研究院和中科院自动化研究所分别落户将于香港科学园建设的「医疗科技创新平台」和「人工智能及机械人科技创新平台」,开展研发工作。

天猫双11机器智能崛起,一个机器人顶70万真人

根据天猫方面的数据,双 11 全天,「阿里小蜜」承担了全平台 98%的客服咨询量,涉及活动规则、购物车、退款申请等海量问题,这相当于 70 万人工客服一天的工作量。同样交出「吓一跳」成绩的还有 AI 机器翻译。 

通过速卖通 AliExpress、东南亚电商平台 Lazada 等阿里海外经济体,由阿里巴巴达摩院开发的 AI 机器翻译平台总共执行了超过 10 亿次的跨语言翻译服务。该平台支持英语、西班牙语等 21 种语言的 AI 翻译,还包括土耳其语、俄罗斯语等人类翻译奇缺的小语种,已经覆盖了世界绝大多数国家与人口。在 AI 翻译的支持下,仅用 41 分钟,AliExpress 就完成了 100 万笔支付订单,Lazada 则开场一小时里就产生超过 120 万笔订单。 

此外,在双 11 期间开张的阿里无人酒店,从入住到服务全程没有任何人工操作,所有事情都依靠 AI 完成。菜鸟拥有 700 多个机器人的物流仓库也在双 11 前投入使用,阿里人工智能实验室研发的收餐机器人「谷神星」也在盒马机器人餐厅正式「上岗」,节省了餐厅服务员 80%的劳动量。

意法半导体CEO:公司专注这四大终端市场

在日前举办的与国内媒体的首次交流会上,意法半导体CEO Jean-Marc Chery强调,「我将带领ST在四大终端市场继续前进」。他所说的大终端市场分别是汽车、工业、个人电子产品和通信设备、计算机和外设。 

按照Jean-Marc Chery的说法,意法半导体之所以聚焦着四大市场,主要看中了这四个市场在未来的巨大成长力。从他提供的数据中我们可以看到,意法所聚焦的汽车、工业、个人电子产品和通信设备计算机及外设四个市场未来三年年的复合增长率将会分别达到6%、7%、2%和11%,而这些成长动能则是来自于现在正在快速发展智能驾驶、智慧工业、智能家居与智慧城市和智能产品等市场的推动。而通过提早布局,ST也在这些市场占有了一席之地。

双11消费电子行业的销量第一为智能音箱天猫精灵

官方数据显示,双11当天,消费电子行业冠军首次花落智能音箱行业,而非过去以手机为主的传统消费电子产品。在天猫双11预售期间,天猫精灵AI智能音箱的销量就已经超过100万台。据市场机构Canalys发布的调研报告,天猫精灵销量在中国市场连续四个季度排名第一。本次双11,天猫精灵智能生活产品在销售领域获得28项第一。

早报AI每日精选
暂无评论
暂无评论~

登录后评论