Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

AI在用| 万万没想到,科技论文还能这么读

机器之能报道

编辑:Cardinal

以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。

因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。   

我们也欢迎读者投稿亲自实践的创新型用例。

Claude 3 具有非常大的内存( 200k 上下文窗口)和很强的调用准确性,它的上下文能力也因此成为最受欢迎、应用最广的技能。我们介绍过如何利用这种能力,没时间收听播客也能获取核心内容。今天,我们再介绍一个新技能,帮助技术小白快速 get 最新、最前沿的科技成果。

图片Claude 3 七大亮点能力。我们已经介绍过视觉、长文本能力的用例。

案例示范来自 X 用户 @genie0309。因为投资需要,这位科技投资人经常阅读有关人工智能技术论文,加上人工智能技术迭代也快,非技术出身的科技小白如何快速、准确提炼论文中的核心信息就显得格外重要。

该用户与 Claude 3  Opus 合作,打造出一个超级提示模板。将苹果公司最新发布的有关 ReALM 论文作为用例,亲测好用。(至于如何与大模型磨合出一个优质的提示,我们之前也详细示范过。)

图片

  • 案例地址:
    https://twitter.com/genie0309/status/1775218832883552408

超级提示模板如下:

Claude,我是一个对人工智能技术有极大兴趣的(你的身份或职业),但是没有相关的技术背景。我想请你帮我深入理解一篇最新发表的 AI 研究论文,以便更好地把握该领域的发展趋势和商业机会。请从以下几个方面对论文进行详细解读:

1. 论文的研究目标是什么?想要解决什么实际问题?这个问题对于产业发展有什么重要意义?
2. 论文提出了哪些新的思路、方法或模型?跟之前的方法相比有什么特点和优势?请尽可能参考论文中的细节进行分析。
3. 论文通过什么实验来验证所提出方法的有效性?实验是如何设计的?实验数据和结果如何?请引用关键数据加以说明。
4. 论文的研究成果将给业界带来什么影响?有哪些潜在的应用场景和商业机会?作为XXX我应该关注哪些方面?
5. 未来在该研究方向上还有哪些值得进一步探索的问题和挑战?这可能催生出什么新的技术和投资机会?
6. 从 critical thinking 的视角看,这篇论文还存在哪些不足及缺失?又有哪些需要进一步验证和存疑的?
7. 作为非技术背景的读者,我应该从这篇论文中学到什么,有哪些启发?你认为我还需要补充了解哪些背景知识?

请用1000-1500字左右的篇幅,对论文进行深入解读。在讲述过程中,请多引用论文中的细节内容、关键数据和实验结果,帮助我清楚地理解论文的创新性贡献。同时也请从技术和商业的角度,分析其给AI领域和产业界带来的影响。如果论文中有一些技术概念我可能不太了解,也请给出通俗的解释。

在回答格式上,请注意以下几点:

1. 用三级标题对应以上六个问题,清晰划分不同部分
2. 使用 Markdown 格式,适当加入列表、加粗等排版元素
3. 引用原文时请使用blockquote的引用格式
4. 关键术语首次出现时请加粗
5. 使用中文书写,学术名词可以用英文补充
6. 适当插入图表,帮助理解论文内容

谢谢!”

下面是 Claude 3  Opus 返回的结果:

图片图片图片来自@genie0309

效果不错啊。二话不说,我们赶紧测试一下这套模板。出于对机器人的兴趣,我们选择了最新一期 Science Robotics 的论文,主要讲述人和机器人表情同步的问题,至于文章具体解决了啥问题?科研价值是什么?还是要让模型来总结。

图片

图片因为论文关于机器人领域,我们根据自己的需求对上述模板做了细微调整。最后提示如下:

Claude,我是一个对机器人技术有极大兴趣的媒体从业者,但是没有相关的技术背景。我想请你帮我深入理解一篇最新发表的机器人技术研究论文,以便更好地把握该领域的技术发展。请从以下几个方面对论文进行详细解读:

1. 论文的研究目标是什么?想要解决什么实际问题?这个问题对于产业发展有什么重要意义?
2. 论文提出了哪些新的思路、方法或模型?跟之前的方法相比有什么特点和优势?请尽可能参考论文中的细节进行分析。
3. 论文通过什么实验来验证所提出方法的有效性?实验是如何设计的?实验数据和结果如何?请引用关键数据加以说明。
4. 论文的研究成果将给业界带来什么影响?有哪些潜在的应用场景和商业机会?作为媒体从业者的我应该关注哪些方面?
5. 未来在该研究方向上还有哪些值得进一步探索的问题和挑战?这可能催生出什么新的技术和投资机会?
6. 从 critical thinking 的视角看,这篇论文还存在哪些不足及缺失?又有哪些需要进一步验证和存疑的?
7. 作为非技术背景的读者,我应该从这篇论文中学到什么,有哪些启发?你认为我还需要补充了解哪些背景知识?

请用1000-1500字左右的篇幅,对论文进行深入解读。在讲述过程中,请多引用论文中的细节内容、关键数据和实验结果,帮助我清楚地理解论文的创新性贡献。同时也请从技术和商业的角度,分析其给AI领域和产业界带来的影响。如果论文中有一些技术概念我可能不太了解,也请给出通俗的解释。

在回答格式上,请注意以下几点:

1. 用三级标题对应以上7个问题,清晰划分不同部分
2. 使用 Markdown 格式,适当加入列表、加粗等排版元素
3. 引用原文时请使用blockquote的引用格式
4. 关键术语首次出现时请加粗
5. 使用中文书写,学术名词可以用英文补充
6. 适当插入图表,帮助理解论文内容

谢谢!”

以下是 Claude 3  Opus 返回的结果,完全够用了啊!

图片

图片

图片

图片

图片来自机器之能

另一篇 Science Robotics 论文探讨了著名四足机器人 ANYmal 的最新进展。我们使用相同的提示,很快获得了对这篇论文的深度见解。

图片

这是 Claude 3 Opus 输出的结果:

图片

图片

图片

图片来自机器之能

最后,再举一个非常现实的例子。就在昨天,AI 大神、OpenAI 的联合创始人 Andrej Karpathy 用 C 语言成功实现了 GPT-2( CPU, fp32 )的训练。作为一个外行文科生,如何快速掌握这个项目的价值和具体内容呢?

图片

幸好,大神将项目全部内容写在了一个文档中,我们可以借鉴上述模板让大模型解读这份文档。根据我们的阅读目的,修改后的提示如下:

Claude,我是一个对人工智能技术有极大兴趣的媒体编辑,但是没有相关的技术背景。我想请你帮我深入理解一篇最新发表的技术文章,以便更好地把握该领域的发展趋势和商业机会。请从以下几个方面对论文进行详细解读:

1. 文章的研究目标是什么?想要解决什么实际问题?这个问题对于产业发展有什么重要意义?
2. 文章提出了哪些新的思路、方法或模型? 它的创新之处在哪里?有什么独特优势?请尽可能参考论文中的细节进行分析。
3. 文章通过什么实验来验证所提出方法的有效性?实验是如何设计的?实验数据和结果如何?请引用关键数据加以说明。
4. 这个成果对训练大型语言模型的意义是什么?重要吗?将给业界带来什么影响?有哪些潜在的应用场景和商业机会?作为媒体记者的我应该关注哪些方面?
5. 未来在该研究方向上还有哪些值得进一步探索的问题和挑战?这可能催生出什么新的技术和投资机会?
6. 从 critical thinking 的视角看,这篇文章还存在哪些不足及缺失?又有哪些需要进一步验证和存疑的?
7. 作为非技术背景的读者,我应该从这篇文章中学到什么,有哪些启发?你认为我还需要补充了解哪些背景知识?

请用1000-1500字左右的篇幅,对论文进行深入解读。在讲述过程中,请多引用文章中的细节内容、关键数据和实验结果,帮助我清楚地理解论文的创新性贡献。同时也请从技术和商业的角度,分析其给AI领域和产业界带来的影响。如果论文中有一些技术概念我可能不太了解,也请给出通俗的解释。

在回答格式上,请注意以下几点:

1. 用三级标题对应以上7个问题,清晰划分不同部分
2. 使用Markdown格式,适当加入列表、加粗等排版元素
3. 引用原文时请使用blockquote的引用格式
4. 关键术语首次出现时请加粗
5. 使用中文书写,学术名词可以用英文补充
6. 适当插入图表,帮助理解论文内容

谢谢!”

这是 Claude 3 Opus 返回的结果:

图片

图片

图片

图片

图片

是不是很惊讶大模型的表现?如果换做人工,没有大半天功夫,根本写不出来上述大段文字。以后我们会通过新专栏带来更多 AIGC 案例演示,也欢迎大家留言评论并给出改进建议。

产业语言模型机器学习人工智能
1
相关数据
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

机器人技术技术

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

GPT-2技术

GPT-2是OpenAI于2019年2月发布的基于 transformer 的大型语言模型,包含 15 亿参数、在一个 800 万网页数据集上训练而成。据介绍,该模型是对 GPT 模型的直接扩展,在超出 10 倍的数据量上进行训练,参数量也多出了 10 倍。在性能方面,该模型能够生产连贯的文本段落,在许多语言建模基准上取得了 SOTA 表现。而且该模型在没有任务特定训练的情况下,能够做到初步的阅读理解、机器翻译、问答和自动摘要。

推荐文章
暂无评论
暂无评论~