重组一年,印象笔记要用AI变成3亿人的「第二大脑」

印象笔记CEO唐毅:AI在知识管理工具中的落地,目前没有一个完整的答案。

撰文 | 太浪

7月18日,在印象笔记七周年线下发布会的现场,印象笔记立下了「成为中国3亿人的首屏应用」的小目标。

印象笔记CEO唐毅表示,除了要成为管理个人信息的智能助手,印象笔记还要成为提高团队效率的企业工具,以及富集高价值信息的内容平台。 

印象笔记CEO 唐毅

印象笔记源自于2008年发布的多功能笔记类应用——Evernote;去年6月,宣布完成重组。作为Evernote已在中国独立运营近6年的品牌,印象笔记成为由中方控股的中美合资独立运营实体,并获红杉宽带跨境数字产业基金首轮亿元以上投资。

「3亿」目标的实现,依赖于一款「逐步成为『第二大脑』的产品」。印象笔记将是人工智能深度学习加持的「第二大脑」。

在唐毅的设想中,这样一款产品,「一定是有思考、有交流、有分享的」,「脑子里面存了很多内容,它会管时间、管任务、管内容,但是也会思考、会联想、会创意。」

简单理解就是:机器想问题,而不是人想问题。

在当前的产品层面上,用户最有体感的AI功能应该是OCR文字识别。

据介绍,他们的OCR识别支持中文、英文、或是手写文字,可以拍照识别,也可以对手机中的照片、截图或是原有笔记中的图片做 OCR 批量处理。这个功能目前仅在iOS端上线。

要成为用户的「第二大脑」,还是一个愿景。为了实现这一愿景,印象笔记成立了研究院,着眼于研究和利用AI和分布式领域的前沿技术来增强现有产品的功能,同时拓展未来能力的边界。

他们还与清华大学人工智能研究院知识智能研究中心一起,探索知识图谱技术与印象笔记产品的融合。

推模块化编辑器, 为知识图谱建立打基础

编辑器自从上世纪末在浏览器中呈现以来,形态未产生明显变化。印象笔记的编辑器也常年遭受用户的吐槽。

终于,在发布会前,印象笔记网页版开启全新的「模块化编辑器」(下一代编辑器)公测。

在印象笔记APP中,笔记本组-笔记本-笔记,是构成知识库的3个基础层级。升级为「模块化编辑器」后,印象笔记内容存储的最小粒度由笔记变为笔记内的内容模块,比如文字段落、图片、视频、表格、其他附件等。

根据展示,在这个编辑器中,用户不仅可以在任意位置上插入模块,也可以任意拖拽和嵌套模块,比如,把文本拖到表格里,把表格里的文本拖出来。

有点被这个功能惊艳到 

印象笔记的技术人员还赋予了模块语义上的结构,也对编辑器的架构做了插件化处理,不仅能让创作者在完成创作后任意替换其中的任一模块,也方便印象笔记未来在各个领域的技术创新的接入,甚至接入外部的AI能力。

比如,未来如果出现了新的内容样式,只需在编辑器中增加相应模块的语义描述,在视觉上增加交互的行为。

 一个包含分级标题、段落、图片和表格模块的语义模型定义

印象笔记研究院院长常诚表示,未来,他们还将实现编辑视图与内容的分离。也就是将视图层与数据层分离,以在可视化方向上做更多探索;

同时,让用户在编辑器内的各种操作都精确对应到其笔记的数据的状态视图,从而更精确地记录用户的行为,为编辑器的扩展能力提供数据支撑。 

常诚表示,下一代编辑器是实现知识图谱一个非常重要的基础,也承载着印象笔记未来在各个技术领域创新的关键一环。未来,他们将在模块化编辑器上增加更多智能模块。

印象笔记研究院院长 常诚

常诚说,知识图谱的本质是语义网络,是基于图的存储,用户在编辑器中的任意操作,就相当于在图结构中对节点和边的权重和属性做调整。

模块化编辑器作为知识图谱的基础,可以构建网状存储,为笔记智能应用提供新一代基础设施支撑。 

模块化编辑器和人机交互相结合,有助于打造个人的知识图谱。将个人知识图谱与外部知识图谱(比如清华的知识图谱)相关联,能进一步增强个人的知识体系。

在清华大学人工智能研究院知识智能研究中心主任李涓子看来,知识图谱将是未来人工智能发展的基础设施,印象笔记作为最大的非结构化数据沉淀平台之一,里面包含了文本、图片、音频等内容,而且,内容之间做了紧密的关联,因此,印象笔记在下一代人工智能发展中潜力巨大。

清华大学人工智能研究院知识智能研究中心主任 李涓子

目前,印象笔记正与清华大学人工智能研究院知识智能研究中心一起探索,看如何将清华大学的知识图谱技术与印象笔记的产品相融合。

当被问及印象笔记将AI在产品中落地中遇到的难点时,唐毅表示,这个问题是一边深耕、一边研究需求、看技术发展。

「具体而言,对非结构化数据的深度理解、语义理解与数据挖掘,与他们相关性很强。但是,与清华大学的合作目前处于研究层面,还没有产品化。」

他相信,人的经验知识和纯数据machine learning之间的结合,是能够获取知识和可以让智能得到增强的最好方式。但是有成熟的思考方法,并不意味着就一定会有思考的结果,因为会不断地思考。

而且,还有其他一系列事情需要思考,比如,挖掘用户的数据是否经过了用户的同意?如何平衡挖掘用户数据与保护用户隐私间的关系?

AI在印象笔记产品中的落地,「目前没有一个完整的答案,这是一个不断推进的过程。」唐毅说。

产业计算机视觉分布式计算技术知识表征智能物联网通用人工智能自然语言处理知识图谱
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

权重技术

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

知识库技术

知识库是用于知识管理的一种特殊的数据库,以便于有关领域知识的采集、整理以及提取。知识库中的知识源于领域专家,它是求解问题所需领域知识的集合,包括基本事实、规则和其它有关信息。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

语义网技术

语义网是由万维网联盟的蒂姆·伯纳斯-李在1998年提出的一个概念,它的核心是:通过给万维网上的文档蒂姆加能够被计算机所理解的语义,从而使整个互联网成为一个通用的信息交换媒介。语义万维网通过使用标准、置标语言和相关的处理工具来扩展万维网的能力。

语义网络技术

语义网络常常用作知识表示的一种形式。它其实是一种有向图;其中,顶点代表的是概念,而边则表示的是这些概念之间的语义关系。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

联想机构

联想集团是1984年中国科学院计算技术研究所投资20万元人民币,由11名科技人员创办,是中国的一家在信息产业内多元化发展的大型企业集团,和富有创新性的国际化的科技公司。 从1996年开始,联想电脑销量一直位居中国国内市场首位;2005年,联想集团收购IBM PC(Personal computer,个人电脑)事业部;2013年,联想电脑销售量升居世界第一,成为全球最大的PC生产厂商。2014年10月,联想集团宣布了该公司已经完成对摩托罗拉移动的收购。 作为全球电脑市场的领导企业,联想从事开发、制造并销售可靠的、安全易用的技术产品及优质专业的服务,帮助全球客户和合作伙伴取得成功。联想公司主要生产台式电脑、服务器、笔记本电脑、智能电视、打印机、掌上电脑、主板、手机、一体机电脑等商品。 自2014年4月1日起, 联想集团成立了四个新的、相对独立的业务集团,分别是PC业务集团、移动业务集团、企业级业务集团、云服务业务集团。2016年8月,全国工商联发布“2016中国民营企业500强”榜单,联想名列第四。 2018年12月,世界品牌实验室编制的《2018世界品牌500强》揭晓,排名第102。

李涓子人物

李涓子,博士,清华大学长聘教授,博士生导师。中国中文信息学会语言与知识计算专委会主任。研究方向为知识工程、语义Web和文本挖掘。

推荐文章
暂无评论
暂无评论~