腾讯技术工程

Bing搜索核心技术BitFunnel原理
Bing搜索核心技术BitFunnel原理

从90年代中期开始,人们普遍认识,对于内容索引来说,文件签名技术比反向链接效果更差。最近几年必应搜索引擎开发与部署了一套基于位分割的标签索引。本文根据论文《BitFunnel: Revisiting Signatures for Search》和Bing团队实践分享视频,对BitFunnel原理进行分析解读。

AI 到底是怎么「想」的?
AI 到底是怎么「想」的?

最近,Nature发表了一篇关于深度学习系统被欺骗的新闻文章,该文指出了对抗样本存在的广泛性和深度学习的脆弱性,以及几种可能的解决方法。安全平台部基础研究组自2017年来在对抗样本的生成及防守方法进行了深入研究,在这里团队通过在攻击方面的经验,分享我们对于防守对抗样本的一些思考,欢迎共同讨论。

机器学习模型可解释性的详尽介绍
机器学习模型可解释性的详尽介绍

模型可解释性方面的研究,在近两年的科研会议上成为关注热点,因为大家不仅仅满足于模型的效果,更对模型效果的原因产生更多的思考,这样的思考有助于模型和特征的优化,更能够帮助更好的理解模型本身和提升模型服务质量。本文对机器学习模型可解释性相关资料汇总survey。

腾讯游戏自研学术成果:基于图分割的网络表征学习初始化技术
腾讯游戏自研学术成果:基于图分割的网络表征学习初始化技术

本文介绍了 IEG 在网络表征学习方面的一个自研学术成果,最近被国际顶级学术会议 13th ACM International Conference on Web Search and Data Mining (WSDM 2020) 接收为学术长文。个人始终认为并且坚持研究与业务是可以相辅相成的。因此,该技术起源于对游戏业务优化的需求,升华于对技术细节的精益求精。

腾讯物联网操作系统正式开源,最小体积仅1.8 KB
腾讯物联网操作系统正式开源,最小体积仅1.8 KB

9月18日,腾讯宣布将开源自主研发的轻量级物联网实时操作系统TencentOS tiny。相比市场上其它系统,腾讯TencentOS tiny在资源占用、设备成本、功耗管理以及安全稳定等层面极具竞争力。该系统的开源可大幅降低物联网应用开发成本,提升开发效率,同时支持一键上云,对接云端海量资源。

如何用keras实现deepFM
如何用keras实现deepFM

文末参考的文章用Keras实现一个DeepFM 是我们初期学习和搭建deepFM 的主要参考。然后下面我们的实现会比参考内容更简单而且有一些处理上的差异。同时在我们的业务数据集上,下面我们自己的实现方式得到的测试 auc 大约都比按照上面文章的实现测试 auc 高约 0~0.01 左右。

Atlas元数据存储模型分析
Atlas元数据存储模型分析

Atlas 是一个可扩展的核心基础治理服务集 - 使企业能够有效地和高效地满足 Hadoop 中的合规性要求,并允许与整个企业数据生态系统的集成。该项目用于管理共享元数据、数据分级、审计、安全性以及数据保护等各个方面,是数据治理的重要组成部分。本文介绍Atlas的存储子系统,分析Atlas的存储模型和各个元数据要素的存储结构。

经典机器学习 | 如何做到预流失与流失挽回?
经典机器学习 | 如何做到预流失与流失挽回?

流失用户,即有流失倾向,但还没有开始真正流失的用户。相较于流失用户而言,预流失用户处于观望阶段,或许对现有产品有所顾虑,或许对于潜在的流向(竞品)有所顾虑,或许是在等待些什么;流失用户,即已经流失了的用户,或许是因为游戏弃坑,或许选择了其他产品,用户肯定还在玩些什么,只是不再来你这儿了。文章介绍了如何通过经典的机器学习(Machine Learning, ML)方法来寻找那些流失可能性比较高的用户、寻找那些回流意愿比较大的用户。运营同学针对这些用户就可以重点干预,降低预流失用户比例,拉高用户的回流比例。