Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

小红书技术REDtech转载

这几年让你大呼惊人的AI应用,都离不开这项技术

AI好像也更加懂人类,越来越接近“人的智能”。

近两年,人工智能的应用越来越 “卷” 了,每隔一段时间就会出现一个让人大呼 “respect” 的技术。

AI 好像也更加懂人类,越来越接近“人的智能”。

就好比今年高考期间被各大科技媒体反复拿来讲的 AI 高考的案例。如今的 “AI 做题家” 不光能参加高考,还能挑战本科生甚至研究生。比如,来自 OpenAI 的 Codex 在麻省理工学院的高数课程题目中正确率达到了 81.1%,说能比肩顶尖学府本科生水平也不为过。
图片
像 AI 实时翻译这种能力尽管之前翻车的不少,但对于它的商业化,行业的预期非常明确。在跨国会议中看到不同国家的参会者,操着不同的语言,无障碍进行交流的场景,已经不是遥不可及的想象。
图片
聊天机器人的表现也不再仅仅是机械式的一问一答,有的已经可以感知情感,能分析情绪并给出相应的反馈。让虚拟偶像具备情感陪伴的能力也是大热的落地方向之一。

这些应用的背后都离不开自然语言处理(NLP)技术的不断精进。

再说说前不久被科技圈津津乐道的“东方名画”——虎戴 VR。脑洞大开的外国网友,不按套路向谷歌人工智能作画系统 Imagen,输送了指令:给宋代的东方老虎佩戴 VR。结果产生了一系列毫无违和感的作品,谁看了都得说一声:谷歌,牛 X!
图片
Imagen 是目前人工智能多模态理解与创作的集大成者,但这套模型对人类指令的精准识别和理解,背后发挥作用的同样是 NLP

可以说,要让人工智能更像“人的智能”,就躲不开语言理解和语言处理这个大热的方向。

NLP 领域目前有哪些亟待突破的技术问题?长文本的语言处理的技术难点在哪里?面向开放域问答的自适应信息检索如何精益求精?NLP 技术如何在小红书这样的复杂 UGC 内容社区中应用和落地?

想要得到这些问题的解答,你一定不能错过小红书技术团队出品的《REDtech 来了》系列第三期技术直播。8 月 5 日 19:00,小红书将邀请业内顶尖专家和大家一同探讨“自然语言处理的前沿与实践”。

图片

除了张岳、庞亮两位学界大牛的分享干货满满之外,小红书社区搜索文本理解负责人曾书和小红书技术模型负责人王树森分享的小红书所面临的 NLP 问题和实践将会是第一手的工业界案例分享,同样不容错过。

图片

作为国内独树一帜的内容社区,截至 2021 年 10 月,小红书 APP 月活跃用户数已经超过 2 亿。小红书最大的特色在于其社区内容以 UGC 为主,且内容多以音视频 + 图文的多模态呈现,这对文本和内容的理解提出了更高的要求。

小红书对于用户内容去中心化的分发机制,也决定了在算法中对内容本身的理解占据了更大的比重,而不是简单依赖于对用户行为的分析。

海量 UGC 内容还带来了非标化的问题,最常见的案例就是对比喻义和引申义的理解。

当一个用户看到一片令人心旷神怡的草地,他拍下照片并记录“仿佛置身于塞尔达旷野之息”。算法该如何理解这里的这篇笔记的核心内容,如何判断哪些用户会喜欢这篇笔记?

再比如在一篇旅行笔记中,用户把一座海边的渔村称作 “福建小希腊”,当其他用户用“希腊” 作为关键词搜索时,这篇笔记是否该出现,何时出现——这背后都是复杂的 NLP 问题。

对于这些问题,小红书会尝试哪些更好的解决方式?小红书的业务场景和数据还可以孕育哪些令人激动的技术问题?相信在 8 月 5 日晚的这场直播中也将找到答案。
图片

直播收看攻略:

时间:2022 年 8 月 5 日(周五)19:00-21:00

直播平台:关注【小红书技术 REDtech 】视频号,预约直播,不见不散。(直播也将在抖音与 B 站同步进行,搜索“小红书技术 REDtech ”)

扫描下方二维码进入直播交流群,将第一时间获取直播链接及开播提醒。
图片
我们将在微信群内发布嘉宾演讲精华和抽奖活动, 参与互动提问还有机会被嘉宾 pick 解答哦。
入门NLPREDtech小红书
相关数据
信息检索技术

信息检索(IR)是基于用于查询检索信息的任务。流行的信息检索模型包括布尔模型、向量空间模型、概率模型和语言模型。信息检索最典型和最常见的应用是搜索引擎。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

推荐文章
暂无评论
暂无评论~