刘艺馨作者

阿里、百度、腾讯、滴滴、华为、京东、联想 KDD2020公司论文大盘点

会议概况

ACM SIGKDD(Conference on Knowledge Discovery and Data Mining, KDD)是世界数据挖掘领域的最高级别的国际会议,由 ACM(Association of Computing Machinery,计算机学会)的数据挖掘及知识发现专委会(SIGKDD)负责协调筹办,被中国计算机协会荐为A类会议。

自 1995 年以来,KDD 已经以大会的形式连续举办了二十余届全球峰会,作为数据挖掘领域最顶级的学术会议,KDD 大会以论文接收严格闻名,每年的接收率不超过 20%,因此颇受行业关注。

近日,KDD 2020 发布论文接收结果:本次 KDD 总接受论文数 338 篇,其中 Research Track 共 1279 篇论文参与投稿,接收率约为 16.9%;Applied Data Science track 共 756 篇论文投稿,接收率约为 16.0%。

AMiner 近期也上线了 KDD 2020 最新专题(https://www.aminer.cn/conf/kdd2020),收录了今年录用的所有论文,并对过去历年来 KDD 的录用论文数据进行了分析,后期还将陆续推出论文数据分析与论文精读等内容,为大家详解 KDD2020 最新动态。

同时,通过对 AMiner 平台中 KDD 2020 收录论文数据的挖掘,从词云可以看出,KDD 2020 的关键词主要集中在 Graph Neural Network、Representation Learning、Deep Learning Heterogeneou Graph、Attention Network、Knowledge Graph、Convolutional Network 等方向。

那么在 KDD2020 中,有哪些公司大放异彩?

学术头条为你细细道来——
(以下排名不分先后)

NO.1 阿里巴巴

KDD2020 中,阿里巴巴发表论文数 25,占比 7.3%。

论文1:Fraud Transactions Detection via Behavior Tree with Local Intention Calibration基于局部意图校正行为树的欺诈交易检测
作者:Can Liu,Qiwei Zhong,Xiang Ao,Li Sun,Wangli Lin,Jinghua Feng,Qing He,Jiayu Tang

论文2:Order Fulfillment Cycle Time Estimation for On-Demand Food Delivery按需食品配送的订单履行周期时间估算
作者:Lin Zhu,Wei Yu,Kairong Zhou,Xing Wang,Pengyu Wang,Wenxing Feng,Ning Chen,Pei Lee

论文3:Graph Structural-topic Neural Network图结构主题神经网络
作者:Qingqing Long,Yilun Jin,Guojie Song,Yi Li,Wei Lin

论文4:Learning to Generate Personalized Query Auto-Completions via a Multi-View Multi-Task Attentive Approach学习通过多视图多任务关注方法生成个性化的查询自动完成
作者:Di Yin,Jiwei Tan,Zhe Zhang,Hongbo Deng,Shujian Huang,Jiajun Chen

论文5:Fast R-STL: Efficient and Robust Seasonal-Trend Decompositionfor Time Series with Complex Patterns快速R-STL:复杂模式时间序列的高效稳健季节趋势分解
作者:Qingsong Wen,Zhe Zhang,Yan Li,Liang Sun

论文6:Large-Scale Training System for 100-Million Classification at Alibaba阿里巴巴1亿分类大规模培训体系
作者:Liuyihan Song,Pan Pan,Kang Zhao,,Hao Yang,Yiming Chen,Yingya Zhang,Yinghui Xu,Rong Jin

论文7:Semi-supervised Collaborative Filtering by Text-enhanced Domain Adaptation基于文本增强域自适应的半监督协同过滤
作者:Wenhui Yu,Xiao Lin,Junfeng Ge,Wenwu Ou,Zheng Qin

论文8:Privileged Features Distillation at Taobao Recommendations淘宝推荐的特权特征提炼
作者:Chen Xu,Quan Li,Junfeng Ge,Jinyang Gao,Xiaoyong Yang,Changhua Pei,Fei Sun,Jian Wu,Hanxiao Sun,Wenwu Ou

论文9:GCC: Graph Contrastive Coding for Graph Neural Network Pre-Training      GCC:用于图神经网络预训练的图对比编码
作者:Jiezhong Qiu,Qibin Chen,Yuxiao Dong,Jing Zhang,Hongxia Yang,Ming Ding,Kuansan Wang,Jie Tang

论文10:Multi-objective Optimization for Guaranteed Delivery in Video Service Platform视频服务平台保证交付的多目标优化
作者:Hang Lei,Yin Zhao,Longjun Cai

论文11:Feature-Induced Manifold Disambiguation for Multi-View Partial Multi-label Learning多视图部分多标签学习的特征诱导流形消歧
作者:Jing-Han Wu,Xuan Wu,Qing-Guo Chen,Yao Hu,Min-Ling Zhang

论文12:Disentangled Self-Supervision in Sequential Recommenders连续推荐的分离主义自监督
作者:Jianxin Ma,Chang Zhou,Hongxia Yang,Cui Peng,Xin Wang,Wenwu Zhu

论文13:Efficiently Solving the Practical Vehicle Routing Problem: A Novel Joint Learning Approach有效解决实际车辆路径问题:一种新的联合学习方法
作者:Lu Duan,Yang Zhan,Jiangwen Wei,Yu Gong,Haoyuan Hu ,Yinghui Xu

论文14:Learning Stable Graphs from Heterogeneous Confounded Environments异构混杂环境中的学习稳定图
作者:Yue He,Peng Cui,Jianxin Ma,Zou Hao,Xiaowei Wang,Hongxia Yang,Philip S. Yu

论文15:Context-to-Session Matching: Utilizing Whole Session for Response Selection in Information-Seeking Dialogue Systems上下文会话匹配:在信息寻求对话系统中利用整个会话进行响应选择
作者:Zhenxin Fu,Shaobo Cui,Mingyue Shang,Feng Ji,Dongyan Zhao,Haiqing Chen,Rui Yan

论文16:Controllable Multi-Interest Framework for Recommendation可控多兴趣推荐框架
作者:Cen Yukuo,Zhang Jianwei,Zou Xu,Zhou Chang,Yang Hongxia,Tang Jie

论文17:Maximizing Cumulative User Engagement in Sequential Recommendation: An Online Optimization Perspective连续推荐中最大化累积用户参与度:在线优化视角
作者:Zhao Yifei,Zhou Yu-Hang,Ou Mingdong,Xu Huan,Li Nan

论文18:Prediction and Profiling of Audience Competition for Online Television Series网络电视剧观众竞争预测与分析
作者:Peng Zhang,Chuanren Liu,Kefeng Ning,Wenxiang Zhu,Yu Zhang
 
论文19:M2GRL: A Multi-task Multi-view Graph Representation Learning Framework for Web-scale Recommender Systems  
M2GRL:一个面向网络推荐系统的多任务多视角图表示学习框架

作者:Wang Menghan,Lin Yujie,Lin Guli,Yang Keping,Wu Xiao-ming

论文20:Understanding Negative Sampling in Graph Representation Learning图表示学习中的理解负采样
作者:Yang Zhen,Ding Ming,Zhou Chang,Yang Hongxia,Zhou Jingren,Tang Jie

论文21:Comprehensive Information Integration Modeling Framework for Video Titling视频标题综合信息集成建模框架
作者:Shengyu Zhang,Ziqi Tan,Jin Yu,Zhou Zhao,Kun Kuang,Tan Jiang,Hongxia Yang,Fei Wu,Jingren Zhou

论文22:A Dual Heterogeneous Graph Attention Network to Improve Long-Tail Performance for Shop Search in E-Commerce提高电子商务商店搜索长尾性能的对偶异构图注意网络

作者:Xichuan Niu,Bofang Li,Chenliang Li,Rong Xiao,Haochuan Sun,Hongbo Deng,Zhenzhong Chen

论文23:Balanced Order Batching with Task-Oriented Graph Clustering面向任务图聚类的平衡顺序批处理
作者:Lu Duan,Zili Wu,Guozheng Li,Yu Gong ,Xinhang Zhang,Haoyuan Hu,Yinghui Xu

论文24:Hybrid Spatio-Temporal Graph Convolutional Network: Improving Traffic Prediction with Navigation Data混合时空图卷积网络:利用导航数据改进流量预测
作者:Rui Dai,Shenkun Xu,Qian Gu,Chenguang Ji,Kaikui Liu

论文25:Attention and Memory-Augmented Networks for Dual-View Sequential Learning双视序列学习的注意记忆增强网络
作者:Yong He,Cheng Wang,Nan Li,Zhenyu Zeng

NO.2 百度

KDD2020 中,百度发表论文数 9,占比 2.6% 

论文1:Competitive Analysis for Points of Interest兴趣点的竞争分析
作者:Shuangli Li,Jingbo Zhou,Hao Liu,Xinjiang Lu,Tong Xu,Hui Xiong

论文2:Geodemographic Influence Maximization地理人口统计影响力最大化
作者:Kaichen Zhang,Jingbo Zhou,Donglai Tao,Panagiotis Karras,Qing Li,Hui Xiong

论文3:Combo-Attention Network for Baidu Video Advertising百度视频广告组合注意力网络
作者:Tan Yu,Yi Yang,Yi Li,Xiaodong Chen,Mingming Sun,Ping Li

论文4:Dual Channel Hypergraph Collaborative Filtering双通道超图协同过滤
作者:Shuyi Ji,Yifan Feng,Rongrong Ji,Xibin Zhao,Wanwan Tang,Yue Gao

论文5:Intelligent Exploration for User Interface Modules of Mobile App with Collective Learning基于集体学习的移动App用户界面模块智能化探索
作者:Jingbo Zhou,Zhenwei Tang,Min Zhao,Xiang Ge,Fuzheng Zhuang,Meng Zhou,Liming Zou,Chenglei Yang,Hui Xiong

论文6:Polestar: An Intelligent, Efficient and National-Wide Public Transportation Routing Engine  

Polestar:一个智能、高效、全国性的公共交通路径引擎

作者:Hao Liu,Ying Li,Yanjie Fu,Huaibo Mei,Jingbo Zhou,Xu Ma,Hui Xiong


论文7:Personalized Prefix Embedding for POI Auto-Completion in the Search Engine of Baidu Maps百度图搜索引擎中POI自动完成的个性化前缀嵌入

作者:Jizhou Huang,Haifeng Wang,Miao Fan,An Zhuo,Ying Li


论文8:ConSTGAT: Contextual Spatial-Temporal Graph Attention Network for Travel Time Estimation at Baidu Maps  
ConSTGAT:百度地图针对出行时间估计的上下文时空图注意力网络

作者:Xiaomin Fang,Jizhou Huang,Fan Wang,Lingke Zeng,Haijin Liang,Haifeng Wang


论文9:Local Community Detection in Multiple Networks多网络中的局部社区检测

作者:Dongsheng Luo,Yuchen Bian,Yaowei Yan,Xiao Liu,Jun Huan,Xiang Zhang


NO.3 腾讯


KDD2020 中,腾讯发表论文数 10,占比 2.9%


论文1:TranSlider: Transfer Ensemble Learning from Exploitation to Exploration  TranSlider:从开发至探索的迁移集成学习
作者:Kuo Zhong,Ying Wei,Chun Yuan,Haoli Bai,Junzhou Huang

论文2:Adversarial Infidelity Learning for Model Interpretation模型解释中的对抗不忠学习
作者:Laing Jian,Bai Bing,Cao Yuren,Bai Kun,Wang Fei

论文3:General-Purpose User Embeddings based on Mobile App Usage基于移动App使用的通用用户嵌入
作者:Zhang Junqi,Bai Bing,Lin Ye,Liang Jian,Bai Kun,Wang Fei

论文4:INPREM: An Interpretable and Trustworthy Predictive Model for Healthcare INPREM:一个可解释且可信的医疗保健预测模型
作者:Xianli Zhang,Buyue Qian,Shilei Cao,Yang Li,Hang Chen,Yefeng Zheng,Ian Davidson

论文5:ASGN: An Active Semi-supervised Graph Neural Network for Molecular Property Prediction  
ASGN:分子性质预测的主动半监督图神经网络
作者:Zhongkai Hao,Chengqiang Lu,Zhengya Huang,Hao Wang,Zheyuan Hu,Qi Liu,Enhong Chen,Cheekong Lee

论文6:Vulnerability vs. Reliability: Disentangled Adversarial Examples for Cross-Modal Learning脆弱性与可靠性:跨模式学习的分离对抗性实例
作者:Chao Li,Haoteng Tang,Cheng Deng,Liang Zhan,Wei Liu

论文7:Meta-Learning for Query Conceptualization at Web Scale面向网络规模查询概念化的元学习
作者:Fred X. Ha,Di Niu,Haolan Chen,Weidong Guo,Shengli Yan,Bowei Long

论文8:A Request-level Guaranteed Delivery Advertising Planning: Forecasting and Allocation一种请求级保证交付的广告规划:预测与分配
作者:Hong Zhang,Lan Zhang,Lan Xu,Xiaoyang Ma,Zhengtao Wu,Cong Tang,Wei Xu,Yiguo Yang

论文9:A Block Decomposition Algorithm for Sparse Optimization稀疏优化的块分解算法
作者:Ganzhao Yuan,Li Shen,Weishi Zheng

论文10:Two Sides of the Same Coin: White-box and Black-box Attacks for Transfer Learning一枚硬币的两面性:迁移学习的白盒攻击和黑盒攻击
作者:Yinghua Zhang,Yangqiu Song,Jian Liang,Kun Bai,Qiang Yang

NO.4 滴滴

KDD2020 中,滴滴发表论文数 6,占比 1.8%

论文1:Dynamic Heterogeneous Graph Neural Network for Real-time Event Prediction用于实时事件预测的动态异构图神经网络
作者:Wenjuan Luo,Han Zhang,Xiaodi Yang,Lin Bo,Xiaoqing Yang,Zang Li,Xiaohu Qie,Jieping Ye

论文2:Towards Building an Intelligent Chatbot for Customer Service: Learning to Respond at the Appropriate Time打造面向客户服务的智能聊天机器人:学会适时响应
作者:Che Liu,Junfeng Jiang,Chao Xiong,Yi Yang,Jieping Ye

论文3:HetETA: Heterogeneous Information Network Embedding for Estimating Time of Arrival  
HetETA:用于估算到达时间的异构信息网络嵌入

作者:Huiting Hong,Yucheng Lin,Xiaoqing Yang,Zang Li ,Jieping Ye ,Kun Fu,Zheng Wang,Xiaohu Qie

论文4:CompactETA: A Fast Inference System for Travel Time Prediction  
CompactETA:旅行时间预测的快速推理系统

作者:Kun Fu,Fanlin Meng,Jieping Ye,Zheng Wang

论文5:Gemini: A novel and universal heterogeneous graph information fusing framework for online recommendations  
Gemini:一个新颖的通用异构图信息融合框架

作者:Jixing Xu,Zhenlong Zhu,Jianxin Zhao,Xuanye Liu,Minghui Shan,Jiecheng Guo

论文6:Predicting Individual Treatment Effects of Large-scale Team Competitions in a Ride-sharing Economy共享单车经济条件下大型团体比赛的个人治疗效果预测
作者:Teng Ye,Wei Ai,Lingyu Zhan,Ning Luo,Lulu Zhang,Jieping Ye,Qiaozhu Mei

NO.5 华为

KDD2020 中,华为发表论文数 6,占比 1.8%

论文1:Neural Subgraph Isomorphism Counting神经子图同构计数
作者:Liu Xin,Pan Haojie,He Mutian,Song Yangqiu,Jiang Xin

论文2:Probabilistic Metric Learning with Adaptive Margin for Top-K Recommendation
Top-K推荐中基于自适应裕度的概率度量学习

作者:Chen Ma,Liheng Ma,Yingxue Zhang,Ruiming Tang ,Xue LiuXue Liu,Mark Coates

论文3:Cellular Network Radio Propagation Modeling with Deep Convolutional Neural Networks基于深度卷积神经网络的蜂窝网络无线传播建模
作者:Xin Zhang,Xiujun Shu,Bingwen Zhang,Jie Ren,Lizhou Zhou,Xin Chen

论文4:Stable Learning via Differentiated Variable Decorrelation基于差分变量去相关的稳定学习
作者:Zheyean Shen,Peng Cui,Jiashuo Liu,Tong Zhang,Bo Li,Zhitang Chen

论文5:A Framework for Recommending Accurate and Diverse Items Using Bayesian Graph Convolutional Neural Networks一种基于贝叶斯图卷积神经网络的精确多样推荐框架
作者:Jianing Sun,Wei Guo,Dengcheng Zhang,Yingxue Zhang,Florence Robert-Regol,Yaochen Hu,Huifeng Guo,Ruiming Tang,Han Yuan,Xiuqiang He,Mark Coates

论文6:WavingSketch: An Unbiased and Generic Sketch for Finding Top-k Items in Data Streams  
WavingSketch:在数据流中查找Top-k项的无偏通用草图

作者:Jizhou Li,Zikun Li,Yifei Xu,Shiqi Jiang,Tong Yang,Bin Cui,Yafei Dai,Gong Zhang

NO.6 京东

KDD2020 中,京东发表论文数 6,占比 1.8%

论文1:CAST: A Correlation-based Adaptive Spectral Clustering Algorithm on Multi-scale Data  
CAST:一种基于相关性的多尺度数据自适应谱聚类算法

作者:Li Xiang,Kao Ben,Shan Caihua,Yin Dawei,Ester Martin

论文2:AutoST: Efficient Neural Architecture Search for Spatio-Temporal Prediction
AutoST:时空预测的有效神经结构搜索

作者:Ting Li,Junbo Zhang,Kainan Bao,Yuxuan Liang,Yexin Li,Yu ZhengYu Zheng

论文3:Faster Secure Data Mining via Distributed Homomorphic Encryption基于分布式同态加密的快速安全数据挖掘
作者:Junyi Li,Heng Huang

论文4:Federated Doubly Stochastic Kernel Learning for Vertically Partitioned Data垂直分区数据的联邦双随机核学习
作者:Bin Gu,Zhiyuan Dang,Xiang Li,Heng Huang

论文5:Doing in One Go: Delivered Time Inference Based on Coueriers' Trajectories一次性完成:基于Couerier轨迹的交付时间推断
作者:Sijie Ruan,Zi Xiong,Cheng Long,Yiheng Chen,Jie Bao,Tianfu He,Ruiyuan Li ,Shengnan Wu,Zhongyuan Jiang,Yu Zheng

论文6:Category-Specific CNN for Visual-aware CTR Prediction at JD.com京东用于视觉感知CTR预测的类别特定CNN
作者:Hu Liu,Jing Lu,Hao Yang,Xiwei Zhao,Sulong Xu,Hao Peng,Zehua Zhang,Wenjie Niu,Xiaokun Zhu,Yongjun Bao,Weipeng Yan

NO.7 联想

KDD2020 中,联想发表论文数 3,占比 0.9%

论文1:ST-SiameseNet: Spatio-Temporal Siamese Networks for Human Mobility Signature Identification  
ST-siamenet:用于人类移动特征识别的时空暹罗网络

作者:Huimin Ren,Menghai Pan,Yanhua Li,Xun Zhou,Jun Luo

论文2:xGAIL: Explainable Generative Adversarial Imitation Learning for Explainable Human Decision Analysis
xGAIL:用于可解释的人类决策分析的可解释生成对抗模仿学习

作者:Menghai Pan,Weixiao Huang,Yanhua Li,Xun Zhou,Jun Luo

论文3:Curb-GAN: Conditional Urban Traffic Estimation through Spatio-Temporal Generative Adversarial Networks
Curb-GAN:基于时空生成对抗网络的有条件城市交通量估计

作者:Yingxue Zhang,Yanhua Li,Xun Zhou,Xiangnan Kong,Jun Luo

根据官方信息,KDD2020 主席、执行委员会和组委会决定将本年度会议完全虚拟化,接下来的几周官方会公布更多的议程和计划细节。

注册现已开放,敬请关注 2020 年 8 月 23 日至 27 日的所有直播和点播安排。

官网链接:https://www.kdd.org/kdd2020/

AMiner学术头条
AMiner学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
理论KDD 2020
相关数据
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商,致力于把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。目前华为有19.4万员工,业务遍及170多个国家和地区,服务30多亿人口。

https://www.huawei.com/cn/
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

协同过滤技术

协同过滤(英语:Collaborative Filtering),简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。协同过滤又可分为评比(rating)或者群体过滤(social filtering)。其后成为电子商务当中很重要的一环,即根据某顾客以往的购买行为以及从具有相似购买行为的顾客群的购买行为去推荐这个顾客其“可能喜欢的品项”,也就是借由社区的喜好提供个人化的信息、商品等的推荐服务。除了推荐之外,近年来也发展出数学运算让系统自动计算喜好的强弱进而去芜存菁使得过滤的内容更有依据,也许不是百分之百完全准确,但由于加入了强弱的评比让这个概念的应用更为广泛,除了电子商务之外尚有信息检索领域、网络个人影音柜、个人书架等的应用等。

集成学习技术

集成学习是指使用多种兼容的学习算法/模型来执行单个任务的技术,目的是为了得到更佳的预测表现。集成学习的主要方法可归类为三大类: 堆叠(Stacking)、提升(Boosting) 和 装袋(Bagging/bootstrapaggregating)。其中最流行的方法包括随机森林、梯度提升、AdaBoost、梯度提升决策树(GBDT)和XGBoost。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

元学习技术

元学习是机器学习的一个子领域,是将自动学习算法应用于机器学习实验的元数据上。现在的 AI 系统可以通过大量时间和经验从头学习一项复杂技能。但是,我们如果想使智能体掌握多种技能、适应多种环境,则不应该从头开始在每一个环境中训练每一项技能,而是需要智能体通过对以往经验的再利用来学习如何学习多项新任务,因此我们不应该独立地训练每一个新任务。这种学习如何学习的方法,又叫元学习(meta-learning),是通往可持续学习多项新任务的多面智能体的必经之路。

推荐系统技术

推荐系统(RS)主要是指应用协同智能(collaborative intelligence)做推荐的技术。推荐系统的两大主流类型是基于内容的推荐系统和协同过滤(Collaborative Filtering)。另外还有基于知识的推荐系统(包括基于本体和基于案例的推荐系统)是一类特殊的推荐系统,这类系统更加注重知识表征和推理。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

图搜索技术

在计算机科学中,图遍历(也称为图搜索)是指在图中访问(检查/或更新)每个顶点的过程。这样的遍历是按访问顶点的顺序进行分类的。比如,树遍历就是图遍历的一个特例。 与树遍历不同,图遍历可能需要多次访问某些顶点,因为在转换到一个已经被探索的顶点之前,它并不一定是已知的。随着图形变得越来越密集,这种冗余变得更加普遍,导致计算时间增加;随着图形变得越来越稀疏,相反的情况也成立。 因此,通常需要记住哪些顶点已经被算法探索过了,这样就可以尽可能少地重新访问顶点(或者在最坏的情况下,防止遍历无限延续)。这可以通过将图中的每个顶点与在遍历期间的“颜色”或“访问”状态相关联来完成,然后在算法访问每个顶点时检查和更新。如果顶点已经被访问过,它就被忽略了,路径就不再被继续了;否则,算法会检查/更新顶点,并继续它当前的路径。

异构信息网络技术

与homogeneous同构信息网络相区别,异构信息网络的网络模式限定了对象集合以及对象间关系的类型约束。这些约束使得异构信息网络具有半结构化的特点,引导着网络语义的探究。异构信息网络可以由许多相互连接的、大规模的数据集来构造,范围涉及社会、科学、工程、商业应用等。

迁移学习技术

迁移学习是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。 迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

图神经网络技术

图网络即可以在社交网络或其它基于图形数据上运行的一般深度学习架构,它是一种基于图结构的广义神经网络。图网络一般是将底层图形作为计算图,并通过在整张图上传递、转换和聚合节点特征信息,从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微预测层的输入,并用于节点分类或预测节点之间的连接,完整的模型可以通过端到端的方式训练。

对话系统技术

对话系统大致被分成两类: 任务为导向的对话系统,帮助用户去完成特定任务,比如找商品,订住宿,订餐厅等。实现任务为导向的对话系统,主要有两类方式,流水线方法和端到端方法。非任务导向的对话系统,与用户进行互动并提供回答,简单的说,就是在开放领域的闲聊。实现非任务导向对话系统也主要可分为两类,生成方法和基于检索的方法。

生成对抗网络技术

生成对抗网络是一种无监督学习方法,是一种通过用对抗网络来训练生成模型的架构。它由两个网络组成:用来拟合数据分布的生成网络G,和用来判断输入是否“真实”的判别网络D。在训练过程中,生成网络-G通过接受一个随机的噪声来尽量模仿训练集中的真实图片去“欺骗”D,而D则尽可能的分辨真实数据和生成网络的输出,从而形成两个网络的博弈过程。理想的情况下,博弈的结果会得到一个可以“以假乱真”的生成模型。

模仿学习技术

模仿学习(Imitation Learning)背后的原理是是通过隐含地给学习器关于这个世界的先验信息,就能执行、学习人类行为。在模仿学习任务中,智能体(agent)为了学习到策略从而尽可能像人类专家那样执行一种行为,它会寻找一种最佳的方式来使用由该专家示范的训练集(输入-输出对)。

阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。 阿里巴巴集团经营多项业务,另外也从关联公司的业务和服务中取得经营商业生态系统上的支援。业务和关联公司的业务包括:淘宝网、天猫、聚划算、全球速卖通、阿里巴巴国际交易市场、1688、阿里妈妈、阿里云、蚂蚁金服、菜鸟网络等。 2014年9月19日,阿里巴巴集团在纽约证券交易所正式挂牌上市,股票代码“BABA”,创始人和董事局主席为马云。 2018年7月19日,全球同步《财富》世界500强排行榜发布,阿里巴巴集团排名300位。2018年12月,阿里巴巴入围2018世界品牌500强。

https://www.alibabagroup.com/
相关技术
百度机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

https://www.baidu.com/
联想集团机构

联想集团是1984年中国科学院计算技术研究所投资20万元人民币,由11名科技人员创办,是中国的一家在信息产业内多元化发展的大型企业集团,和富有创新性的国际化的科技公司。 从1996年开始,联想电脑销量一直位居中国国内市场首位;2005年,联想集团收购IBM PC(Personal computer,个人电脑)事业部;2013年,联想电脑销售量升居世界第一,成为全球最大的PC生产厂商。2014年10月,联想集团宣布了该公司已经完成对摩托罗拉移动的收购。 作为全球电脑市场的领导企业,联想从事开发、制造并销售可靠的、安全易用的技术产品及优质专业的服务,帮助全球客户和合作伙伴取得成功。联想公司主要生产台式电脑、服务器、笔记本电脑、智能电视、打印机、掌上电脑、主板、手机、一体机电脑等商品。 自2014年4月1日起, 联想集团成立了四个新的、相对独立的业务集团,分别是PC业务集团、移动业务集团、企业级业务集团、云服务业务集团。2016年8月,全国工商联发布“2016中国民营企业500强”榜单,联想名列第四。 2018年12月,世界品牌实验室编制的《2018世界品牌500强》揭晓,排名第102。

京东机构

京东(股票代码:JD),中国自营式电商企业,创始人刘强东担任京东集团董事局主席兼首席执行官。旗下设有京东商城、京东金融、拍拍网、京东智能、O2O及海外事业部等。2013年正式获得虚拟运营商牌照。2014年5月在美国纳斯达克证券交易所正式挂牌上市。 2016年6月与沃尔玛达成深度战略合作,1号店并入京东。

腾讯机构

腾讯科技股份有限公司(港交所:700)是中国规模最大的互联网公司,1998年11月由马化腾、张志东、陈一丹、许晨晔、曾李青5位创始人共同创立,总部位于深圳南山区腾讯大厦。腾讯由即时通讯软件起家,业务拓展至社交、娱乐、金融、资讯、工具和平台等不同领域。目前,腾讯拥有中国国内使用人数最多的社交软件腾讯QQ和微信,以及中国国内最大的网络游戏社区腾讯游戏。在电子书领域 ,旗下有阅文集团,运营有QQ读书和微信读书。

http://www.tencent.com/
聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

图卷积神经网络技术

图卷积神经网络(Graph Convolutional Network)是一种能对图数据进行深度学习的方法。GCN的三个主要特征:它是卷积神经网络在 graph domain 上的自然推广;它能同时对节点特征信息与结构信息进行端对端学习;适用于任意拓扑结构的节点与图;

神经结构搜索技术

神经结构搜索(NAS)表示自动设计人工神经网络(ANN)的过程。

多目标优化技术

多目标优化是多准则决策的一个领域,它是涉及多个目标函数同时优化的数学问题。多目标优化已经应用于许多科学领域,包括工程、经济和物流,其中需要在两个或多个相互冲突的目标之间进行权衡的情况下作出最优决策。分别涉及两个和三个目标的多目标优化问题的例子有:在购买汽车时降低成本,同时使舒适性最大化;在使车辆的燃料消耗和污染物排放最小化的同时将性能最大化。

图卷积网络技术

假设有一张图,要做分类,传统方法需要手动提取一些特征,比如纹理啊,颜色啊,或者一些更高级的特征。然后再把这些特征放到像随机森林等分类器,给到一个输出标签,告诉它是哪个类别。而深度学习是输入一张图,经过神经网络,直接输出一个标签。特征提取和分类一步到位,避免了手工提取特征或者人工规则,从原始数据中自动化地去提取特征,是一种端到端(end-to-end)的学习。相较于传统的方法,深度学习能够学习到更高效的特征与模式。

度量学习技术

即学习一个度量空间,在该空间中的学习异常高效,这种方法多用于小样本分类。直观来看,如果我们的目标是从少量样本图像中学习,那么一个简单的方法就是对比你想进行分类的图像和已有的样本图像。但是,正如你可能想到的那样,在像素空间里进行图像对比的效果并不好。不过,你可以训练一个 Siamese 网络或在学习的度量空间里进行图像对比。与前一个方法类似,元学习通过梯度下降(或者其他神经网络优化器)来进行,而学习者对应对比机制,即在元学习度量空间里对比最近邻。这些方法用于小样本分类时效果很好,不过度量学习方法的效果尚未在回归或强化学习等其他元学习领域中验证。

生成对抗技术

生成对抗是训练生成对抗网络时,两个神经网络相互博弈的过程。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。

推荐文章
暂无评论
暂无评论~