数据分析起家的海云数据,还想向唇语识别冲刺

再次谈起公司发展的下一步时,冯一村难掩兴奋。


作为海云数据创始人兼 CEO,不仅是因为其自主研发的唇语识别技术,提高英文识别准确率,更重要的是,冯一村找到了唇语识别的变现之道。


「唇语识别能帮助聋哑人、老人交流,裁定体育赛事语言暴力。在公安领域,也具有颠覆意义。」冯一村分析。因为大量视频只有图像,没有声音,如能识别视频中犯罪嫌疑人的讲话内容,将会提高刑侦效率。


正因如此,冯一村说,海云数据未来将不遗余力地投入唇语识别的研究。


成立于 2013 年的海云数据,以数据可视化分析起家,旗下数据可视化分析平台「图易」具备 12 层神经网络,分布式 GPU,可实现数据自动匹配,并能通过智能数据实现深度学习。当冯一村无意中发现,企业内部研究院将唇语识别加入现有的数据可视分析系统,他很快意识到,这个尝试对现有业务的突破具有重要价值。


2016 年 12 月,海云数据联合重庆公安科研所研究唇语识别。


640-7.jpeg

海云唇语识别测试


冯一村介绍,唇语识别是典型的 AI 应用,集机器视觉与自然语言处理,从图像中连续识别出人脸,并提取此人连续的口型变化特征,将其输入模型,识别出讲话人口型对应的发音,从而计算出可能性最大的表达语句。而成熟的唇语识别系统需要建立在大量人脸特征样本的基础之上,通过带记忆的深度神经网络,保证结果的最大准确性。


在 2017 年 3 月的亚洲大数据可视分析峰会上,海云数据在正式发布唇语识别技术时称,其由 1 万小时新闻式唇语节目训练而成的唇语识别 AI,英文识别准确率达 80%,中文准确率达到 71%。不过,冯一村认为,「若要投入实战,准确率需要 90% 甚至 95% 以上。」


640-8.jpeg

1 万小时新闻类节目进行唇语识别训练


更早一些时候,一则唇语识别 AI 超过人类专家的消息还曾刷屏研究界。2016 年 11 月,牛津大学工程科学系与谷歌母公司 Alphabet 下属公司 DeepMind 合作进行唇语识别开发,选择英国 BBC 5000 个小时的电视节目,总共 118000 个句子作为训练素材,最终结果是相比人类专家 12.4% 的准确率,AI 的准确率为 46.8%。


但对一家商业化公司来说,缩小准确率差距的前提下找准方向也同样重要。「AI 要在特定领域解决特定问题,初创企业更需要找准细分领域。」冯一村分析他的业务逻辑,「我们做唇语识别,至少公安、政法委、军队、教育四个行业可以应用。」


冯一村尤其看好唇语识别在公安领域的应用,因为这是海云数据的优势。事实上,海云数据正是发家于此。


众所周知,城市交通卡口处都有摄像头,但大量摄像头的背后需要公安指挥中心部署更多警力监控视频。而海云数据的数据可视化分析技术则能有效改善这类状况,通过将卡口处的视频、犯罪分子的数据、户籍数据、车辆数据等实时呈现在同一个平台,公安人员能直观了解卡口数据、警力部署、出警信息、犯罪线索等信息,既能实时判断警力部署、犯罪分子行动轨迹等情况,还能降低人力成本,提高效率。


为了深入理解公安业务,海云数据聘请了老专家,他们熟悉公安业务系统,从业经验长达数十年。正是如此,海云数据占据了公安领域三分之一的市场份额。


实际上,海云数据并非第一天就做数据可视化分析,也并非第一天就将公安领域确定为目标。从创业之初的数据新闻,到数据可视化,再到奠定核心竞争力的数据可视化分析,海云数据花了两年试错。


冯一村表示,传统的数据可视化是将数据以图形、图表等形式呈现,强调结果的呈现效果,而数据可视化分析能实时有效地表达过程数据,可以实时分析,实时决策。


2015 年 6 月,冯一村重新确定技术方向——数据可视化分析,并将目标瞄向公安领域。「大数据可视化分析业务要产生商业价值,就需要与行业结合,落地业务层。」冯一村如此表示。而这需要真实有效的数据,同一领域不同客户的业务逻辑也不能有太大差异,从而易于标准化并实现快速复制。公安领域就符合这样的标准,举个例子,北京与重庆的公安系统,业务都是刑侦,无太大变化。


由此,海云数据建立了对 B 端客户收取管理服务费的营收模式,冯一村称,找到准确方向的海云数据很快就实现了盈利,并在公安领域站稳脚跟。


2015 年 11 月,海云数据在此前的底层架构基础上,发布可视化分析平台「图易 4.0」,经过迭代,「图易 5.0」已具有一定 AI 智能,覆盖 323 种数据源,651 个 API 接口,318729TB 数据量,涵盖 20 多种行业。而基于图易,海云数据已推出「智航顺」、「智警」、「金智」、「医智佳」、「智胜」等细分领域产品。


如今,海云数据团队成员已达 300 多人,服务将近 90 家客户,其中 76 家是世界 500 强企业,覆盖行业也早已突破公安、民航等达到 13 个。


而在冯一村的规划中,2017 年,海云数据将拓展全新行业,发力大交通、大公安、军民融合以及智慧城市四大领域。技术方向上,则双管齐下,在深耕数据可视化分析的同时,继续向唇语识别冲刺。


海云数据融资进展:


  • 2013 年 4 月,种子资金 20 万,投资人为海量创始人郝玺龙。

  • 2014 年 4 月,天使投资 300 万,投资机构为华创盛景。

  • 2015 年 4 月,Pre-A 轮 1500 万元,投资机构为东方富海。

  • 2016 年 3 月,A 轮 1 亿元,上古资本(华创盛景创始人李汉生主导的另一家投资机构)领投,东方富海跟投。

产业计算机视觉产业创业公司海云数据唇语识别NLP
返回顶部