斯坦福博士李纪为成立 AI 金融公司香侬科技,获红杉中国数千万天使投资

李纪为博士是近期涌现出的著名青年 AI 学者之一,在 2017 年 7 月份博士毕业之后不久,机器之心就对他进行了独家专访,并与他探讨了 NLP 研究、博士生涯等问题。历经半年,李纪为博士在大公司招揽与创业之间,毅然选择了创业,加入了 AI 创业大军。

 


李纪为等人成立的人工智能金融公司「香侬科技」Shannon.AI,刚刚获得红杉中国数千万天使轮融资。

  • 香侬科技官方网站:http://shannon.ai/

李纪为博士期间研究方向是人工智能的一个重要分支——自然语言处理(NLP),他是第一位仅用三年时间就获得了斯坦福大学计算机科学博士学位的人。在三年的博士生涯中,他的多篇论文被各类顶级会议接收,他也是自然语言处理领域引用量最高的博士生之一。据统计,ICLR 2017 上李纪为有三篇论文被大会接收,其中两篇为第一作者;在 EMNLP 2017 上,他有两篇论文被大会接收,同样均为第一作者。

李纪为此前在接受机器之心专访时曾经表示,「如果有合适的机会,创业当然非常有可能。」如今看来,李博士最终还是选择创业,他告诉机器之心,经过半年的准备,他与两名大学同学共同创立了 AI 金融公司——香侬科技,专注于利用 NLP 技术提取、分析金融信息,为广大投资者提供有效、准确、全面的投资信息。据了解,香侬科技已经获得红杉中国数千万元人民币天使轮投资。

在投资消息发布前,机器之心对李纪为博士进行了专访,了解其创立的香侬科技、AI 金融、NLP 等方面的问题。


李纪为博士(右)接受了机器之心编辑的专访。

机器之心:恭喜公司天使轮融资成功,目前你的感觉如何?

李纪为:创业是一种全新的体验。在创业时,你能遇见到不同的人和事儿,无时无刻不在刷新着你对周围世界的认识。不管是金融从业者(一级市场、二级市场、投行、券商等等),投资人,还是科研界学霸、工程大牛、产品经理等,他们所带有的与生俱来的职业嗅觉与理念,都值得我们学习很久很久。这是一个非常有意思的过程,每天都有新的东西需要学习、新的挑战。

这有一点像我刚开始读博士的感觉——每天早上都是带着对一天的憧憬起床。我非常愿意用「有意思」这个词来形容现在的生活。团队每天都在学习和成长过程中,这也是最令人鼓舞的。

机器之心:能否简单介绍一下新成立的公司?

李纪为:香侬科技-名称来自于信息论创始人克劳德·香侬(Claude Shannon)。

这来源于一种情怀,在 CMU 学习的时候仔细拜读过他在 50 年代那篇划时代的论文「Prediction and entropy of printed English」. 当时我在 CMU 的老师 Eduard Hovy 一直想用这篇文章里面的概念来定义不同 NLP 问题的难度,所以就让我去读这篇文章。这是一篇具有时代意义的文章,香侬与他的太太 Betty Shannon 完成了重要的实验:给定英文一段话,告诉前面出现的字母,然后去猜下一个字母是什么。这是一个划时代的研究,它在语言上定义了信息熵的概念:语言的不确定性决定于熵的大小。现代很多的 NLP 的理论都是和它有关的。在 NLP 的问题中,你能猜得多准,基本定义了这个问题的难度。我也很崇拜他,这就是为什么我们将创业公司取名为 Shannon。

注册公司时我惊奇地发现,Shannon.AI 这个域名竟然还没有被注册,当时真的高兴手舞足蹈。

同时,这个名字听起来也给人一种温暖的感觉,它有点像吴语里的「想你」(此处大笑)。

公司成立于北京,目前位于中关村。筹备方面,是从今年 11 月份开始正式推进这家公司的成立。从我的角度来讲,我也在加入大公司与创业之间犹豫了很久,直到去年九月份,随着几位合伙人陆续到位,我们就开始了各项事务的筹备。

机器之心:可否透漏首轮融资得到了哪些投资机构的投资?

李纪为:本轮天使融资为红杉中国基金独家,融资金额为数千万人民币。

机器之心:这是一家 AI 金融领域的创业公司,它将面向哪些类型的业务?为什么会选择金融这个方向?

李纪为:我们希望人们能够快捷、简单、准确全面地获取自己想要的金融信息。让信息为大众所用是我们的愿景。

我们是这样思考的:互联网 1.0 时代让世界更公平了,它就像广播、电视一样,是一个里程碑。互联网让人们获取信息的机会变得平等了,曾经只有少数人可以接触到的信息现在可以为大众所有。但从另一个角度来看,互联网时代的来临也制造了巨量的信息。现在,在很多事情上使用简单的搜索方法已经很难找到你想要的信息了。这又把互联网 1.0(以门户网站、搜索为典型)为我们带来的这份平等给部分抵消了——信息太多,无从查找,只有某些特定的人群才知道去哪里找到有用的信息。

在金融领域中,让信息能更容易地为大众所获取是一个很有意义的方向。在国内,随着国民生活水平的提高,投资需求正在逐渐升温,越来越多的人们正在将眼光伸向股票、基金,甚至债券、期货等二级市场方向上的投资。

然而,目前无论对于机构投资者,还是我们这样的个人而言,传统方式的信息渠道能够解决的问题还是太少了。最简单的一件事:现在我想搜索一下「最近有哪些上市公司的董事长正被证监会调查?」这是一个很明确的问题,也是对于市场行情非常重要的事情。还有很多其他事,我们是无法找到现成信息的,如果必须要找的话,我们必须一个一个地从不同信息源之中的信息里进行提取出来,自己进行分析。

我们希望能够构建一个面对投资者的智能解决方案,来解决投资上对于信息的需求。能够通过用算法来解决这些问题。

机器之心:对你们来说,大陆的金融市场与海外(尤其是美国)有哪些不同?

李纪为:美国的二级市场中,机构资金占比 90%,个人投资者习惯于把钱给机构托管;而在国内的股市里,散户占据一大部分,由于信息的不对称,甚至由于无法找到有效的信息获取渠道,很多投资者会处于相对不公平的劣势位置。我们所做的就是解决这一问题,让所有人都能够获得信息。

机器之心:香侬科技的创始团队构成是什么样的?

李纪为:我们的核心创始团队为三人,我的博士专业是计算机科学(自然语言处理),另两人均为金融领域背景, 都是我大学同学。沈盛杰本科毕业于北京大学物理学院,硕士毕业于光华管理学院,曾在对冲基金 Magnetar Capital 和中信证券等公司工作,主要负责金融数据处理,衍生品定价和交易策略研究等工作。另一位创始人何豪杰是国内二级市场资深研究员,长期从事行业和上市公司研究,曾就职于招商基金和私募基金星石投资等公司。


香侬科技创始核心成员,(图中左至右)沈盛杰、李纪为、何豪杰

机器之心:选择这个方向创业,是否意味着金融行业已经到了进入 AI 时代的节点?

李纪为:我坚信 AI 会革命化地改变很多行业,金融便是其中的一个。但这并不意味这这次革命会在一夜之间发生,它可能需要一段很长的时间,可能 3-5 年,也可能是 5-10 年,甚至更长。深度学习从爆发到今天仅仅经历了五、六年的时间,而纵观人类科技的发展历史,具有重要意义的新科技都经历了更长的发展。技术和传统行业结合,慢慢地改变一个行业,会是一个漫长的过程。这个过程不仅仅是解决曾经的旧需求,而是在迭代中创造新的需求,新需求的创造恰恰是个慢慢发掘的过程。

我坚信人工智能逐渐会给很多行业带来变革。我认为,并不是 AI 造就了如今的时代,而是如今的时代催生了 AI 的发展:我们现在的工作正变得更加复杂,信息量变得更大。随着海量数据的产生,我们有了更多的需求去分析、理解,去提取我们想要的东西。我们每天都在用头条、滴滴、饿了么、美团这样的应用,大量的需求意味着我们需要一种高效的工具来分析、整合其中产生的数据,让人们能够简便地运用其中的知识。所以其实是社会需求推动了 AI,AI 反过来再推动了社会的变革。

站在金融的角度上,我们需要用新的方法来满足用户的需求,同时也可能会不断发现、甚至改变用户的需求,这是一个长期的过程。

机器之心:本轮融资过后,公司是否会开始进一步的团队建设,主要会招募哪些方向的人才?

李纪为:当然需要人工智能和深度学习方面的人才。不过,如何让实验室的深度学习技术落地,真正走进千家万户,这是一个全维度的任务。公司也希望招募更多前后端、数据库等方面有经验的工程师,以及产品经理、运维、UI 设计方面的大牛,大家把各自的特长相结合,互相促进,互相学习,得到一个真正可以造福行业的 AI 工具。

机器之心:此前有关人工智能学界与金融行业的一条重磅新闻是邓力加盟对冲基金巨头 Citadel,我们知道,邓力也研究自然语言处理(NLP)。NLP 与金融领域的契合点在哪些方面上?

李纪为:邓力老师去 Citadel 是机器学习最近的一个大新闻了。

NLP 与金融领域契合点主要是两点,一种是帮助你收集信息。一种是帮你做决策。

帮你做决策就是帮你做交易。第二步要比第一步更难。我们目前专注于收集信息方面,做投资决策还需要时间和技术的积淀,它将是未来可能发展的方向。


机器之心:机器学习作为量化交易方法的方向之一,在交易中有哪些应用?

李纪为:举一个例子,美国最著名的对冲基金——文艺复兴的两位 Co-CEO,Bob Mercer 与 Peter Brown。他们在自然语言处理(NLP)领域里也曾是风云人物。他们在上世纪 90 年代初把统计机器学习引入到了 NLP,革命性地改变了这个领域。直到深度学习火热之前,他们提出的方法一直是 NLP 里的主流。他们在 1994 年提出的 IBM model 在机器翻译领域盛行了 20 年,直到最近两年才被神经网络的 seq2seq+attention 超越。有人笑谈,那个年代,他们把 NLP 玩儿坏了(此处大笑)。

后来他们都加盟了文艺复兴对冲基金,成为了用机器学习做量化投资的风云人物。

值得一提的是,Peter Brown 是深度学习先驱 Geoffrey Hinton 门下第一个毕业的博士,1987 年博士毕业于 CMU。

所以说机器学习在量化投资里的应用由来已久,很多量化投资都在应用机器学习、统计学习的算法。随着原微软研究院资深研究员邓力老师这样的学者加入金融领域,神经网络作为一种人工智能中流行的方法也被金融界人士拿来开始尝试于投资(量化模型)。但由于金融界是一个倾向于不公开新成果的行业,所以目前我们了解的不多。

产业李纪为斯坦福大学北京大学产业金融NLP
1