机器学习增强的电子商务平台用户行为预测

党的十九大报告指出,要“推动互联网、大数据、人工智能和实体经济深度融合”,这为电子商务发展指明了方向.如今以淘宝、京东为代表的电商品牌给消费者带来巨大方便、高效的消费模式,同时运营成本相较于实体经济更低。随着机器学习的发展,利用海量用户消费数据,结合数据挖掘、深度学习等先进算法,精确分析用户购买、退货等行为从而使得电子商务平台体验升级吸引更多客户量以及购买量。本文研究了基于不同数据挖掘及学习算法的用户行为预测系统的关键技术,在此基础上介绍了一种新颖的基于深度学习的电子商务平台用户行为预测技术,使得预测结果更为精准接近消费者真实想法,以期为电子商务的发展提供一定的参考和借鉴.

1. 电子商务用户行为分析

电子商务通常是指一种新颖的在互联网开放的网络平台上,消费者基于浏览器/服务器应用方式进行各种商贸活动的商业运营模式。消费者在此平台上可实现无需与卖家面对面的网上购物、交易和在线电子支付。从2013年开始,越来越多的电子商务企业更加注重通过使用互联网为用户提供优质的服务,并随着电子商务越来越普及,更多人选择在其上进行交易,因此存在着庞大客户购买行为数据信息等,更重要的还有消费者的评价以及反馈意见。那么如何利用这些数据信息分析挖掘所蕴含的用户行为规律,从而应用于客户购买行为预测成为研究热点之一。准确把握客户购买行为,能够精确识别和定位潜在客户群体进行,将浏览者变为购买者,有着极其强的现实意义和经济价值。

电子商务客户的购买行为预测是指根据消费者历史访问点击操作、服务器日志、浏览记录以及商品反馈信息中所蕴含的行为规律对在线客户购买倾向进行实时预测消费者将来的行为。因此可实现针对客户推荐商品、制定营销策略以及决定平台商品的进货量与出货量。上世纪90年代,研究者就开始对大量网络数据进行挖掘和研究,国内还专门成立数据挖掘研究机构来专门分析客户的购物行为。随着电子商务的普及,越来越多方法被提出应用到客户行为分析预测中,如决策树方法、贝叶斯分类算法、支持向量机神经网络方法及时间序列预测方法等。他们大都以数据驱动,从消费者个人信息、商品、消费行为等多种信息中筛选出主要因素并设计特征,利用机器学习算法对筛选出的数据进行模型训练,以训练好的模型预测消费者购买可能性最大的商品。

机器学习的本质是通过算法在众多的假设空间中找到一个最优的假设,预测方法是对数据从不同角度进行分析,预测方法以及处理的数据不同,客户行为预测的效果也不同。那么对于特定的学习问题都有与其相匹配的较合适的算法。而在现实生活中,并没有一个算法可以在任何领域里学习出准确的模型。通过集成若干多个单一算法的学习结果形成新的组合模型,从而达到提高算法最终学习准确率的效果的做法就越来越流行。使用何种方法来集成算法对于提高融合后最终算法的准确率至关重要。

2. 用户行为分析关键技术

在电商平台中,平台往往需要对客户网购行为进行分析及预测。电子商务平台所具有的客户信息数据库为基础,完成对客户网购行为的实时及针对性预测,从而体现了对客户行为的智慧化预测。因此,作为一套完整的预测模型系统,首先需要利用数据挖掘机器学习、统计学等方法进行知识发现,对数据进行特征提取。然后以此为基础,构建作为知识指导的知识存储与表示的客户网购行为知识库,进而建立从数据输入到预测行为的系统体系。主要研究内容如下:

(1) 消费者行为数据处理和特征构建

首先从电子商务交互系统中抽取交互日志,准备与消费者行为分析预测相关的数据,其次进行数据预处理,包括数据清洗、填充缺失值和去除异常值,保证数据的唯一性,从而为实现消费者行为预测提供良好的基础保障。

(2) 消费者行为特征构建

基于原始数据,进行提取用户行为购买特征,根据不同分类方法可将特征分成原始和拓展、静态和动态,或者将两种或以上类别的特征合成一个新的特征。要得到良好预估效果,数据和特征很大程度上决定了模型预估的上限,因此如何构建适合的特征是为实现用户行为分析提供良好的保障。

(3) 消费者行为预测模型

预测模型的准确性是保障消费者行为预测分析的关键,目前虽然有很多预测模型,但的都远远达不到真实情况下的准确性要求。如何利用消费者静态或动态数据的分析进行准确预测消费者行为是极其关键的技术。

3. 基于深度学习的消费者购物行为分析

由于电子商务数据量大、处理复杂等处理难点,目前没有一种模型能够完全解决所有问题,绝大部分研究还是定性分析影响因素、构建理论模型。传统大多采用基于Logistic回归的方法,但其本质是一个线性分类模型,对输入有很高的要求,比如要求目标对象是线性可分的,但在实际中提出来的特征关联性强且存在复杂的非线性关系。再者就是Badding和随机森林方法,他们的性能都或多或少受到限制。为此,我们提出一种基于深度学习的消费者购物行为分析方法,如下图所示。

深度学习的概念由Hinton等人于2006年提出,属于机器学习研究中的一个新的领域,为解决神经网络易陷入局部最小和学习能力受限的问题,借助“逐层贪婪学习”的思想,通过学习更深层次的非线性网络,并从中选取有助于机器学习的更有效的特征,可以预测出更加精准的结果。本质是对数据的表征学习,目标是寻求更好的表示方法并创建更好的模型来从大规模未标记数据中学习这些表示方法。

基于深度学习的消费者购物行为分析工作流程主要分为包括以下四个步骤:

1) 准备并处理数据集:包含用户交互信息采集、数据清洗等。

2) 特征构建:分为特征选择、划分样本训练集和测试集、特征处理三个阶段,特征选择是构建预测模型的关键,即从大量数据集中挑选对分类极为重要的特征集进而提高模型预测精准度,减少运行时间。因不同维度选择出的特征量纲和单位不统一会影响评估特征的权重,进而影响模型的预估效果、因此,需进行特征管理来进行归一化处理。

3) 设计预测模型并训练:选择基本模型框架为卷积神经网络CNN+循环神经网络RNN,并在其基础上对数据的负样本进行随机抽样、调整网络层数、确定损失函数、设计学习率参数;将模型输出误差通过BP算法反向传播,利用随机梯度下降SGD或Adam算法优化模型参数

4) 模型验证:利用未训练的数据验证模型的泛化能力,如果预测结果不理想,则需要重新设计模型,进行新一轮的训练;

至今已有数种成熟的深度学习模型,包括深度神经网络DNN、卷积神经网络CNN和深度置信网络DBN和递归神经网络RNN等。这些在机器视觉、自然语言处理、生物信息学、语音识别等领域得到广泛应用、并取得显著效果。

4. 总结

消费者行为预测是目前在电子商务中极具前瞻性的研究领域,随着人工智能深度学习模型的深入研究,极大提升了消费者行为预测准确率。但是由于深度学习的黑盒特性,难以对消费者行为预测的特征提取过程进行定性研究,为此,仍需要进一步加强对深度学习模型的可视化技术研究,提高学习模型的可靠性分析并在可解释性的基础上进一步提高消费者行为预测准确度。

参考文献

1. 刘建, 孙鹏, 倪宏. 基于神经网络的用户兴趣度估计[J]. 计算机工程, 2011, 37(7):187-189.

2. 李美其, 齐佳音. 基于购买行为及评论行为的用户购买预测研究[J]. 北京邮电大学学报(社会科学版), 2016, 18(4):18-25.

3. 胡东波, 肖璇, 周锦. 基于数据挖掘的移动电子商务用户群体特征分析[J]. 科技管理研究, 2013, 33(9):222-226.

4. Kuo R J, LIAO J L, TU C. Integration of ART2 neural network and genetic k-means algorithm for analyzing web browsing paths in electronic commerce[J]. Decision Support Systems,2005(40):355-374

5. Wei C P, Chiu I T. Turning telecommunications call details to churn prediction: A data mining approach[J].Expert Systems with Application,2002,23(2):103-112.

中国人工智能开放创新平台
中国人工智能开放创新平台

平台由贵阳市政府、英特尔及中国产业创新联盟共同打造,致力于深化AI产业结构发展,扶持AI初创企业,打造AI生态圈,集合众多海内外高校导师及行业大牛,撰稿深度分析专业技术及应用,为 智能+注入源源不断的活力。

产业深度学习机器学习
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

权重技术

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

学习率技术

在使用不同优化器(例如随机梯度下降,Adam)神经网络相关训练中,学习速率作为一个超参数控制了权重更新的幅度,以及训练的速度和精度。学习速率太大容易导致目标(代价)函数波动较大从而难以找到最优,而弱学习速率设置太小,则会导致收敛过慢耗时太长

损失函数技术

在数学优化,统计学,计量经济学,决策理论,机器学习和计算神经科学等领域,损失函数或成本函数是将一或多个变量的一个事件或值映射为可以直观地表示某种与之相关“成本”的实数的函数。

超参数技术

在机器学习中,超参数是在学习过程开始之前设置其值的参数。 相反,其他参数的值是通过训练得出的。 不同的模型训练算法需要不同的超参数,一些简单的算法(如普通最小二乘回归)不需要。 给定这些超参数,训练算法从数据中学习参数。相同种类的机器学习模型可能需要不同的超参数来适应不同的数据模式,并且必须对其进行调整以便模型能够最优地解决机器学习问题。 在实际应用中一般需要对超参数进行优化,以找到一个超参数元组(tuple),由这些超参数元组形成一个最优化模型,该模型可以将在给定的独立数据上预定义的损失函数最小化。

表征学习技术

在机器学习领域,表征学习(或特征学习)是一种将原始数据转换成为能够被机器学习有效开发的一种技术的集合。在特征学习算法出现之前,机器学习研究人员需要利用手动特征工程(manual feature learning)等技术从原始数据的领域知识(domain knowledge)建立特征,然后再部署相关的机器学习算法。虽然手动特征工程对于应用机器学习很有效,但它同时也是很困难、很昂贵、很耗时、并依赖于强大专业知识。特征学习弥补了这一点,它使得机器不仅能学习到数据的特征,并能利用这些特征来完成一个具体的任务。

知识库技术

知识库是用于知识管理的一种特殊的数据库,以便于有关领域知识的采集、整理以及提取。知识库中的知识源于领域专家,它是求解问题所需领域知识的集合,包括基本事实、规则和其它有关信息。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

随机森林技术

在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而"Random Forests"是他们的商标。这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合Breimans的"Bootstrap aggregating"想法和Ho的"random subspace method" 以建造决策树的集合。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

随机梯度下降技术

梯度下降(Gradient Descent)是遵循成本函数的梯度来最小化一个函数的过程。这个过程涉及到对成本形式以及其衍生形式的认知,使得我们可以从已知的给定点朝既定方向移动。比如向下朝最小值移动。 在机器学习中,我们可以利用随机梯度下降的方法来最小化训练模型中的误差,即每次迭代时完成一次评估和更新。 这种优化算法的工作原理是模型每看到一个训练实例,就对其作出预测,并重复迭代该过程到一定的次数。这个流程可以用于找出能导致训练数据最小误差的模型的系数。

支持向量机技术

在机器学习中,支持向量机是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法。给定一组训练实例,每个训练实例被标记为属于两个类别中的一个或另一个,SVM训练算法创建一个将新的实例分配给两个类别之一的模型,使其成为非概率二元线性分类器。SVM模型是将实例表示为空间中的点,这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

特征构建技术

特征构造(也称为构造感应或属性发现)是一种数据增强形式,可将派生特征添加到数据中。 特征构造可以使机器学习系统在各种学习任务中构建更准确的模型。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

特征选择技术

在机器学习和统计学中,特征选择(英语:feature selection)也被称为变量选择、属性选择或变量子集选择。 它是指:为了构建模型而选择相关特征(即属性、指标)子集的过程。

时间序列预测技术

时间序列预测法其实是一种回归预测方法,属于定量预测,其基本原理是;一方面承认事物发展的延续性,运用过去时间序列的数据进行统计分析,推测出事物的发展趋势;另一方面充分考虑到偶然因素影响而产生的随机性,为了消除随机波动的影响,利用历史数据进行统计分析,并对数据进行适当处理,进行趋势预测。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

推荐文章
暂无评论
暂无评论~