腾讯技术工程

Atlas元数据存储模型分析
Atlas元数据存储模型分析

Atlas 是一个可扩展的核心基础治理服务集 - 使企业能够有效地和高效地满足 Hadoop 中的合规性要求,并允许与整个企业数据生态系统的集成。该项目用于管理共享元数据、数据分级、审计、安全性以及数据保护等各个方面,是数据治理的重要组成部分。本文介绍Atlas的存储子系统,分析Atlas的存储模型和各个元数据要素的存储结构。

经典机器学习 | 如何做到预流失与流失挽回?
经典机器学习 | 如何做到预流失与流失挽回?

流失用户,即有流失倾向,但还没有开始真正流失的用户。相较于流失用户而言,预流失用户处于观望阶段,或许对现有产品有所顾虑,或许对于潜在的流向(竞品)有所顾虑,或许是在等待些什么;流失用户,即已经流失了的用户,或许是因为游戏弃坑,或许选择了其他产品,用户肯定还在玩些什么,只是不再来你这儿了。文章介绍了如何通过经典的机器学习(Machine Learning, ML)方法来寻找那些流失可能性比较高的用户、寻找那些回流意愿比较大的用户。运营同学针对这些用户就可以重点干预,降低预流失用户比例,拉高用户的回流比例。

综述 | 生成对抗网络(GAN)在图网络中的应用
综述 | 生成对抗网络(GAN)在图网络中的应用

生成对抗网络(Generative Adversarial Network,简称GAN)是非监督式学习的一种方法,通过让两个神经网络相互博弈的方式进行学习。自2014年GAN网络提出以来,其在Computer Vision(计算机视觉)领域获得了广泛的关注,但GAN网络在其他领域的应用相对较少。将GAN网络的思想应用在图网络(network)特征表达是近一年新兴的课题,本文综述GAN模型在图网络表征学习方面的研究。

AI商业产品经理:我眼中的AI简史
AI商业产品经理:我眼中的AI简史

ABC时代(AI+BigData+Cloud),作为腾讯云大数据及人工智能产品中心的一员,也算是站在了toB+ABC的“腾讯风口“。分享一些在AI领域作为一名商业产品经理的心得,希望尽可能系统化。适合对AI感兴趣的人群,无需产品和算法/研发背景知识。

上篇 | 如何设计一个多轮对话机器人
上篇 | 如何设计一个多轮对话机器人

导语:多轮对话聊天机器人,作为人工智能的典型应用场景,也是一项极具挑战的任务,不仅涉及多方面异构知识的表示、抽取、推理和应用,还涉及包括自然语言理解在内的其他人工智能核心技术的综合利用

从字到词,大词典中文BERT模型的探索之旅
从字到词,大词典中文BERT模型的探索之旅

在本文中,我们提出了对BERT的一些改进,将中文BERT词模型的词典大小进行了大幅扩充,并在多个下游任务上测试了大词典BERT的表现。此外,我们尝试了一种针对上下文相关词向量的最近邻检索方法,基于BERT的词向量做以词搜词任务,相对于上下文无关词向量在效果上有着明显的提升。