学术咖作者

XiaoIce Band:流行音乐的旋律与编曲生成框架 | KDD论文推荐

国际知识发现与数据挖掘大会(ACM SIGKDD Conference on Knowledge Discovery and Data Mining,简称SIGKDD)是数据挖掘领域的顶级国际会议。我们将持续对近年KDD的部分论文进行解读。

KDD 2018共收到投稿论文1479篇,其中研究性论文983篇,应用数据科学论文496篇,均创下新高。本文选取了KDD 2018最佳学生论文奖获奖论文进行介绍:

  • 论文题目

XiaoIce Band:A Melody and Arrangement Generation Framework for Pop Music

  • 作者

Hongyuan Zhu、Qi Liu、Nicholas Jing Yuan、Chuan Qin、Jiawei Li、Kun Zhang、Guang Zhou、Furu Wei、Yuanchun Xu、Enhong Chen

  • 会议/年份

SIGKDD 2018

  • 链接(点击阅读原文也可获取)

https://www.aminer.cn/archive/xiaoice-band-a-melody-and arrangement-generation-framework-for-pop music/5b67b45517c44aac1c8607e9

  • Abstract

With the development of knowledge of music composition and the recent increase in demand, an increasing number of companies and research institutes have begun to study the automatic generation of music. However, previous models have limitations when applying to song generation, which requires both the melody and arrangement. Besides, many critical factors related to the quality of a song such as chord progression and rhythm patterns are not well addressed. In particular, the problem of how to ensure the harmony of multi-track music is still underexplored. To this end, we present a focused study on pop music generation, in which we take both chord and rhythm influence of melody generation and the harmony of music arrangement into consideration. We propose an end-to-end melody and arrangement generation framework, called XiaoIce Band, which generates a melody track with several accompany tracks played by several types of instruments. Specifically, we devise a Chord based Rhythm and Melody Cross-Generation Model (CRMCG) to generate melody with chord progressions. Then, we propose a Multi-Instrument Co-Arrangement Model (MICA) using multi-task learning for multi-track music arrangement. Finally, we conduct extensive experiments on a real-world dataset, where the results demonstrate the effectiveness of XiaoIce Band.

  • 摘要

音乐对人们的生活有着重要的影响。然而,创作音乐需要大量的专业知识和技能。近年来,如何利用机器学习技术自动进行音乐创作成为人工智能领域的热门话题。由于音乐元素的复杂性,如歌曲不同的和弦进行、乐段中结构鲜明的节奏型、不同特性的音轨(乐器)需要保持和谐一致等,使得高质量的单音轨作曲、多音轨编曲算法的设计充满了挑战性与特殊性。为此,论文基于深度神经网络多任务学习等方法,从历史音乐数据(如十万多首歌曲)中学习音乐的音程关系、结构以及各种乐器的演绎特色,设计了一种基于和弦的节奏和旋律交叉的生成模型(CRMCG)来产生带有和弦进行的旋律;更进一步,通过构建多个任务(即多个音轨,乐器序列)关联模型,为乐器的相互配合搭建了信息交互的桥梁,实现了一种多乐器联合编曲模型(MICA)。

AMiner学术头条
AMiner学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
理论多任务学习深度神经网络音乐机器学习数据挖掘KDD 2018论文
1
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

生成模型技术

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。

多任务学习技术

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

推荐文章
暂无评论
暂无评论~