Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

蛋酱报道

ChatGPT时代,很想问问AI这些金融难题何解?

自从去年 ChatGPT 横空出世,这款 AI 对话机器人俨然成为了全球最热门的的技术话题。

近日,佛罗里达大学的两位学者公布了一项最新研究,他们将 ChatGPT 融合在投资模型中以预测股市的走势,投资回报率能达到惊人的 500%。根据论文内容的介绍,模型首先会用 ChatGPT 深度分析上市公司发布的新闻标题、内容确定是好消息还是坏消息,然后对这些内容进行评级,再通过复杂的计算公式制成「ChatGPT 指数」,结合公司的实时股价进行比对,以验证 ChatGPT 的分析能力。

当然,面向变幻莫测的金融走势,打造出「AI 巴菲特」并没有那么容易。就目前来说,像「ChatGPT 指数」这种新方法只能作为决策过程中的一种参考。

不过,在金融投资领域,使用 AI 技术辅助决策确实是一个比较热门的方向,并且衍生出了一个专门的名词:量化交易。以基金趋势模拟预测为例,AI 能够对大量历史业绩等数据进行深入的分析,从中提取有用的特征,构建出具备高度泛化能力和市场动态适应能力的模型,从而在波动的市场条件下持续保持良好的预测表现。

量化模型需要具备对金融场景的深度理解能力,进行投资者情感分析和市场情绪预测,而这显然是 ChatGPT 所擅长的。半年来,在 ChatGPT 类产品的启发和推动下,量化交易和 AI 技术之间的火花进一步迸发。

与此同时,我们更关心的是,这场 ChatGPT 风暴又将如何从全局角度推动 AI 技术在金融领域的落地?

金融智能,走到哪一步了?

近年来,AI 技术在金融领域的运用正在不断加深,为金融行业的风控、营销、投顾、管理等业务注入了数字化的血液,为银行、保险、基金、券商等金融机构实现数智化转型提供了引擎动能。

从行业研判、投顾服务、保险理赔、到信贷风控,这些我们熟知的金融业务场景,背后都有机器学习计算机视觉自然语言处理等多项技术作为支撑。每一个应用场景衍生出的挑战是不同的,涉及到的技术方向也不尽相同。这些年,AI 技术也在持续演进,小样本学习、可信 AI、可解释 AI、AIGC 等新工具陆续涌现,尤其去年底,大模型技术彻底改变了人工智能技术的前沿图景,大模型能说会道的语言能力、压缩大量领域常识的知识能力,对数字化专业工具的推理调度能力无疑在金融行业里有广阔的应用空间,给我们带来挑战的同时,也打开了创新的可能空间。

那么,这些人工智能的新技术、新方法会在金融领域有何创新应用?此处,我们可以选择「金融数据验真」、「金融数据理解」、「金融场景理解」三个方向来谈谈最近的变化。

首先谈谈「金融数据验真」。数字金融业务的本质是基于数据和信息流转的价值交换,这些数据和信息的真实性和可靠性因此构成数字金融业务能否顺利进行的关键。例如,在数字支付场景下,用户支付凭证的真实性和可验证性直接关系到支付的安全和效率;在数字借贷场景下,借款人提供的个人借贷资料的真实性和可验证性则是判断其还款能力和风险等级的基础。

因此,在各类数字金融交易中,各类凭证和文档的验真手段是必不可少的,以保证其真实性和可靠性。特别是对非标文档篡改检测的探索,一直是工业界和学术界的重要研究方向。

金融文档中的文本包含大量重要和敏感信息,句子中的任何一个小改动都可能扭曲其承载的整体语义。随着 NLP 文本处理技术的发展,黑灰产业在欺诈、营销或其他非法活动中,利用计算机进行的虚假信息篡改愈演愈烈,因此,预防文档中的文本被篡改是至关重要的。

此前,图像篡改检测的技术研究对象集中于自然场景图像,大多依赖于物体边缘或表面相对明显的视觉篡改线索,而在文档中几乎不存在这种线索。原因如下:

  • 一是文档图像中的文本篡改方法相当多样:有的是拼接,即从一个图像中复制区域并粘贴到其他图像上;有的是复制 - 移动,即改变图像中物体的空间位置;还有的是生成,即用视觉上合理但不同的内容替换图像中的区域。

  • 二是篡改文本相比场景图像来说更加隐蔽。被篡改的文本区域可能非常小,比如一个段落中的一个字符;而且被篡改的区域和周围环境之间的对比度可能非常低,文档的图像大多具有相同的背景颜色,且文本通常具有相同的字体和大小。

相对来说,文本篡改检测方法的发展却还不够成熟。目前业界有一些是针对类如身份证、营业执照等结构化文档的算法工作,对于金融领域常见的各类资质证书、合同、报告等非结构化的文档篡改,传统的检测系统往往难以进行判定及修改内容定位。

针对文档图像篡改的检测难题,学术界提出了各种方法。有研究者引入神经网络(GNN),在图注意力机制的帮助下检测文档图像中的篡改区域,但这种方法只对比较清晰、整洁的文件有良好的效果,比如如扫描文件。也有研究者使用双流 Faster-RCNN 网络,对图像进行端到端的训练以检测给定的篡改图像区域,然而这种类型的篡改线索大多存在于生成性篡改中,却很难在非常小的复制粘贴篡改中被找到。

在上述方法的启发下,文档篡改检测确实取得了很大进展。不过现有方法在遇到各种文档的复杂场景时,仍缺乏足够的鲁棒性和跨领域的泛化能力,还需进一步探索。

第二个值得关注的方向是「金融数据理解」。在理财、信贷、保险等现实金融业务场景中,提供金融业务服务的主体不仅要理解用户提供的多种模态数据,比如信贷自证材料数据、宠物险的宠物图片等,同时也需要结合领域结构化、非结构的数据生产出专业、可控的理财、保险、行研知识来解答用户的问题,为用户提供全流程数字化的金融服务。这一领域涉及的技术是众多的,计算机视觉自然语言处理与生成、AIGC 等等。

从理解层面看,金融场景非结构化数据占比高,且种类多样,形态多样,异构性明显,比如信贷场景用户自证数据,行业认知研究的行业研报、公司财报,以及保险条款等等,多样性的文档结构、差异化的上下文语义环境带来对非结构化文档的知识结构化任务的挑战。同时,金融场景文档的专业性还导致了标注成本高、单一场景的样本量不足等问题。

在 ChatGPT 引燃 AI 圈之后,其背后的关键技术 In-context learning、Instruction tuning 和 CoT 引起了学术界高度关注,这些技术的巧妙运用,大幅增强了模型的通用性以及对下游任务的理解能力。也正因此,基于指令驱动的 NLP 多任务统一建模成为主赛道,零样本、小样本的场景性能得到极大提升。今年 3 月,能够识图的 GPT-4 发布,又让很多人惊艳了一番,并让更多人看到了「大模型×多模态」的巨大潜力。这些最新的技术方案,同样可以用于解决上述金融业务场景的数据理解挑战。

从生成层面看,随着金融科技的不断发展和应用,金融服务的专业度日益提高,对于内容生产的专业性和合规性也提出了更高的要求。一项特别的挑战在于,专业的知识和金融逻辑是金融领域内容生产的核心要求。但这恰恰对当前流行的 ChatGPT 型大模型构成较大挑战,大模型产出的内容要在金融领域真正应用,需要确保输出内容合规(符合监管要求)、专业(符合金融逻辑),严谨(不出现知识幻觉等事实性错误)。金融内容的智能生产,需要大模型的可信可控,能以合规、专业、严谨的标准对外输出。

此外,基于「金融场景理解」的技术应用命题也非常受到关注。AI 技术的革新,同样为这一方向的落地带来了加速度。就比如上文提到的「量化交易」,无论一位投资者采取什么样的投资策略,金融市场的波动都是可以依靠统计方法和编程预期的,专业的投资者往往会尝试预估自身的整体回报。此前已有许多基于计算机的算法和模型用于金融市场交易,时序信息提取、图学习、模型集成等机器学习技术在该类任务中均展现了巨大的应用价值。

从原理上说,「市场价格的波动受到理性和人类行为的共同影响」一引自《阿尔法经济学》,投资者不可避免地要对新闻资讯做出自己的判断和响应。比如,一位投资者发现苹果公司的股票价格会在出货量飙升之后出现大幅波动,如果想探寻其中的规律,投资者就可以构建一个模型,在苹果公司在股票市场的走势历史数据中寻找这种模式,并根据规律去决策。

通常来说,从越多的新闻中获取有效的事件表征,量化模型就越能辅助投资者采取更合理的决策。近年来,一些研究开始应用自然语言处理(NLP)技术来学习新闻事件的神经网络表征并基于此构建事件驱动的交易策略。

从去年开始,以 ChatGPT 为代表的大模型产品也成为了投资者寄予厚望的对象。大模型可以处理大量异构数据,如股票交易数据、宏观经济数据、公司财务报告等,同时还可以处理非结构化数据,如新闻报道、社交媒体信息等,全面提高预测结果的准确性。

国内首套综合类金融科技榜单发布

面向这些金融智能领域的前沿技术命题,不管是学界还是业界,都抱有浓厚的探索兴趣,以往也有很多赛事和榜单围绕此类命题展开,并收获了广泛关注。

为了推动金融智能领域的潜力发掘,在 CCF 指导下,6 月 19 日,蚂蚁集团旗下的蚂蚁财富、蚂蚁保和网商银行公布了国内首套金融科技榜单(算法竞技比赛) AFAC2023 金融智能挑战赛,浙江大学、上海交通大学、西安交通大学、中央财经大学、蚂蚁技术研究院和天池平台联合发起和举办。

大赛官网:https://tianchi.aliyun.com/specials/promotion/AntFinTechAIChallenge

值得注意的是,这是国内第一份从解决应用问题出发的综合金融科技榜单,填补了市场的空白。

蚂蚁集团副总裁、蚂蚁集团财富保险事业群 CTO、蚂蚁金融技术委员会主席王晓航表示:「作为一家金融科技公司,蚂蚁希望通过这场大赛,鼓励参赛者从行业最前沿、最有挑战性的具体问题着手,探索各种创新的模型和算法,为关注金融科技的年轻人提供一个平台,共同探讨人工智能技术在金融领域的创新前景。」

三大核心方向,六大赛题

结合自身运营经验,蚂蚁围绕国内金融场景应用中的核心技术命题,设置了三大核心方向的六个子赛题:

图片

图片

图片

榜单涵盖通用机器学习计算机视觉自然语言处理等多个算法领域,面向全球开放,高等院校、科研单位、互联网企业等人员均可报名参赛。

该项赛事请到了清华大学计算机系教授唐杰作为大赛主席,以及来自北京大学、上海交通大学、浙江大学、复旦大学、中国人民大学、西安交通大学、中山大学、天津大学、中央财经大学和华东师范大学等高校的数十位教授组成专家评审委员会。通过在线排行榜自动评测与院校教授、行业专家评审结合的方式选拔优秀技术人才或团队。

赛程安排

目前,只需登录比赛平台官网,完成个人信息注册,即可报名参赛。

感兴趣的选手可单人成队或最多不超过 3 人组队参赛,每位选手只能加入一支队伍,每队可选多个赛题参赛。

  • 报名认证:2023 年 6 月 19 日 - 7 月 31 日,UTC+8

  • 比赛时间:2023 年 6 月 19 日 - 8 月 4 日,UTC+8

最终,成绩排名前 6 名的队伍需提交比赛代码与技术报告:

  • 报告提交:2023 年 8 月 11 日,UTC+8

这场比赛将在 8 月底和 9 月完成线下评审和颁奖。夺取冠军的团队将获得 5 万元人民币的奖金,亚军奖金为 2 万元人民币,季军奖金为 1 万元人民币,此外还将享受以下福利:

1. 绿色通道:优秀选手有机会获得 Offer 绿色通道,入职蚂蚁金融技术团队。

2. 荣誉证书:获奖选手均获得大赛荣誉证书。

3. 线下颁奖:获奖选手将受邀参加在上海举办的颁奖典礼,与学界、行业大咖面对面交流。

图片

对了,在报名阶段,推荐小伙伴参赛成功的选手还有机会获得大赛礼品~

图片

想了解更多比赛细节?请查看下图:

图片

入门金融ChatGPT
相关数据
清华大学机构

清华大学(Tsinghua University),简称“清华”,由中华人民共和国教育部直属,中央直管副部级建制,位列“211工程”、“985工程”、“世界一流大学和一流学科”,入选“基础学科拔尖学生培养试验计划”、“高等学校创新能力提升计划”、“高等学校学科创新引智计划”,为九校联盟、中国大学校长联谊会、东亚研究型大学协会、亚洲大学联盟、环太平洋大学联盟、清华—剑桥—MIT低碳大学联盟成员,被誉为“红色工程师的摇篮”。 清华大学的前身清华学堂始建于1911年,因水木清华而得名,是清政府设立的留美预备学校,其建校的资金源于1908年美国退还的部分庚子赔款。1912年更名为清华学校。1928年更名为国立清华大学。1937年抗日战争全面爆发后南迁长沙,与北京大学、南开大学组建国立长沙临时大学,1938年迁至昆明改名为国立西南联合大学。1946年迁回清华园。1949年中华人民共和国成立,清华大学进入了新的发展阶段。1952年全国高等学校院系调整后成为多科性工业大学。1978年以来逐步恢复和发展为综合性的研究型大学。

http://www.tsinghua.edu.cn/
相关技术
复旦大学机构

复旦大学(Fudan University),简称“复旦”,位于中国上海,由中华人民共和国教育部直属,中央直管副部级建制,国家双一流(A类)、985工程、211工程建设高校,入选珠峰计划、111计划、2011计划、卓越医生教育培养计划、卓越法律人才教育培养计划、国家建设高水平大学公派研究生项目,九校联盟(C9)、中国大学校长联谊会、东亚研究型大学协会、环太平洋大学协会的重要成员,是一所世界知名、国内顶尖的全国重点大学。

相关技术
唐杰人物

唐杰是清华大学计算机系副教授。他以学术社交网络搜索系统Arnetminer而闻名,该系统于2006年3月推出,目前已吸引来自220个国家的2,766,356次独立IP访问。他的研究兴趣包括社交网络和数据挖掘。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

注意力机制技术

我们可以粗略地把神经注意机制类比成一个可以专注于输入内容的某一子集(或特征)的神经网络. 注意力机制最早是由 DeepMind 为图像分类提出的,这让「神经网络在执行预测任务时可以更多关注输入中的相关部分,更少关注不相关的部分」。当解码器生成一个用于构成目标句子的词时,源句子中仅有少部分是相关的;因此,可以应用一个基于内容的注意力机制来根据源句子动态地生成一个(加权的)语境向量(context vector), 然后网络会根据这个语境向量而不是某个固定长度的向量来预测词。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

图神经网络技术

图网络即可以在社交网络或其它基于图形数据上运行的一般深度学习架构,它是一种基于图结构的广义神经网络。图网络一般是将底层图形作为计算图,并通过在整张图上传递、转换和聚合节点特征信息,从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微预测层的输入,并用于节点分类或预测节点之间的连接,完整的模型可以通过端到端的方式训练。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

蚂蚁集团机构

蚂蚁集团是移动支付平台支付宝的母公司,也是全球领先的金融科技开放平台,致力于以科技和创新推动包括金融服务业在内的全球现代服务业的数字化升级,携手合作伙伴为消费者和小微企业提供普惠、绿色、可持续的服务,为世界带来微小而美好的改变。

http://www.antgroup.com
小样本学习技术

人类非常擅长通过极少量的样本识别一个新物体,比如小孩子只需要书中的一些图片就可以认识什么是“斑马”,什么是“犀牛”。在人类的快速学习能力的启发下,研究人员希望机器学习模型在学习了一定类别的大量数据后,对于新的类别,只需要少量的样本就能快速学习,这就是 Few-shot Learning 要解决的问题。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

北京大学机构

北京大学创办于1898年,初名京师大学堂,是中国第一所国立综合性大学,也是当时中国最高教育行政机关。辛亥革命后,于1912年改为现名。2000年4月3日,北京大学与原北京医科大学合并,组建了新的北京大学。原北京医科大学的前身是国立北京医学专门学校,创建于1912年10月26日。20世纪三、四十年代,学校一度名为北平大学医学院,并于1946年7月并入北京大学。1952年在全国高校院系调整中,北京大学医学院脱离北京大学,独立为北京医学院。1985年更名为北京医科大学,1996年成为国家首批“211工程”重点支持的医科大学。两校合并进一步拓宽了北京大学的学科结构,为促进医学与人文社会科学及理科的结合,改革医学教育奠定了基础。

官网,http://www.pku.edu.cn/
推荐文章
暂无评论
暂无评论~