央视曝光大数据黑市:超七成网民信息正在被AI营销公司滥用!

一天拨出5000个电话,在线使用设备数量3万台……中国超七成网民的个人资料正在被AI营销公司滥用!

央视3·15晚会曝光个人数据信息灰色全产业链。

从智能探针收集用户数据,到大数据支持用户分析与匹配,再到智能机器人提供外呼服务。


3月15日晚间八点整,央视二套,央视3·15「打假」晚会如期而至。

每年,3·15晚会不仅将揭示各种侵害消费者权益的社会乱象,也会将这些乱象背后的公司集团赤裸裸地公之于众。

今年,央视在调查个人信息盗存销一条龙产业链的过程中,牵扯出的高新企业多达11家,融资金额动辄上亿元,包含新三板、「准赴美」上市公司,而这些公司背后更是涉及到科大讯飞、蓝色光标等知名公司,以及马云持股的杭州圆景股权投资合伙企业。

信息黑市

“X先生,对不起打扰了……”

现如今,接到骚扰电话对于我们每个人而言,再熟悉不过,几乎每天都在我们身边发生。而这些电话和个人信息是如何被对方获取的?

个人信息盗取和售卖几乎成为互联网时代一个公开的秘密。但这次央视曝光的集盗、存、取一条龙产业链如此之成熟和猖狂仍让人震惊,而融合了语音识别语音合成自然语言理解人工智能技术的「智能呼叫机器人」就在这条产业链中就扮演着重要的角色。

谁在窃取我的个人信息?

极有可能就是一个叫“探针盒子”小玩意儿。

据央视315晚会报道,一款由声牙科技有限公司研发的“探针盒子”,当你的手机开启WiFi功能时,会向周围发出寻找无线局域网的信号。探针盒子发现这个信号后,就能迅速识别出用户手机的MAC地址。

在现场实拍中,探针盒子就检测到了附近82.54米至90.85米范围内,某位用户个人隐私信息,其中涉及教育程度、职业、月收入等。

经调查发现,探针盒子遍布超市、商场、便利店、写字楼等各种公共场合,在用户毫不知情的情况下,能够实时采集用户信息。

比如,财神兄弟科技有限公司会把盒子放在人流量大的区域,萨摩耶公司把盒子放在便利店里,还会店面合作,一家商场11个门,装了11个探针盒子,而这些盒子通常就藏在天花板的中空位置。

更让人震惊的是,探针盒子的存在已经十分普遍。在央视曝光的公司中,智子信息有限公司表示目前日活在5000-10000台。璧合科技表示已经三万台设备在使用。

而只要探针盒子搜到附近人设备的MAC信息,然后再和公司后台的大数据进行匹配,就可以转换出用户的手机号码。

被暗访的声牙科技李经理表示,他们已经掌握有全国6亿多人的信息资料,包括用户手机号。此外,这些信息还包括婚姻、教育程度,收入等各个层面,甚至可以对用户进行精准画像。「年龄、性别,使用的设备是什么,平时上网搜索的关键词,常用的App我们也知道。」璧合科技股份有限公司谭经理说道。

超过6亿人的信息资料,被一家名不见经传的数据营销公司轻易获取。要知道截止目前我国网民总数也不过8.29亿,换句话说,这家公司已经掌握中国七成以上网民的信息资料。这真是一件让人毛骨悚然的事!

而海量大数据的泄露往往就来源于我们手机上安装的第三方APP。

很多软件在安装前往往会要求有开放授权等免责条款,而这些权限往往包括要求访问你的通讯录、手机文件夹、电话、短信。并且,在我们使用这些软件时所产生的用户数据,通常可以被用作商业营销用途。

据央视曝光,这些手机软件公司盗取到的个人信息大多被贩卖到特定行业,主要集中在房地产、汽车、金融、整形、培训教育领域,用作拨打骚扰电话等商业营销用途。

在央视晚会现场,主持人和安全专家就现场演示了一场APP实时获取用户社保账号、密码等信息的操作。而通过仔细阅读该APP的用户免责条款,我们就会发现在使用该APP的那一刻起,我们就将个人信息的使用权全权授予给了这家公司。

是「谁」在给我打电话?

当我们还在质疑AI落地难,没想到「智能呼叫机器人」的应用和普及已经如此成熟。

「你今天开启了任务,你可以把结束时间设到一百年以后。电脑不用开机,现在都停电了,机器人一样在拨啊。」接受暗访的楼房销售王经理这样介绍「智能呼叫机器人」的神通广大。

过去人工外呼的传统拨打方式已经被逐步淘汰,取而代之的正是「他们」,「人工打三五百个电话很疯狂了,但是机器人一天可以呼一千个出去。」

经央视调查,我们平时接到的很多骚扰电话都是来自这些机器人,他们能够向周边的手机用户自动拨打骚扰电话。

在某地产售楼处,屋里没有人拨打电话,周边居民却经常接到楼盘推销电话。壹鸽公司的负责人介绍,这套系统由公司专门进行研发。

在演示过程中,机器人还能合成明星林志玲的亲切声调,如果你回答它提出的简单问题,机器人还会针对接听者的回答进行继续询问。其逼真程度足够以假乱真。

而这些「机器人」的工作强度也让人惊叹。

卓经理介绍,一个代理商就能做几千个机器人。中科智联科技公司的王经理表示,他们的机器人呼出的推销电话每天高达5000个。

自称是人工智能领域的领导者的易科芯声,则将为骚扰电话提供智能外呼列为主要业务。该公司经理称,目前已经覆盖了三十几个行业。一位吴经理甚至表示,一年内已经拨出超过40亿个电话。

骚扰电话能够如此猖狂,还在于他们有着一套逃避监管的「独门秘籍」。

中联科技的工作人员将其称之为「硬件穿透」:电话记录里不会显示用户的真实号码,而是均虚拟为同一个号码。如此一来,拨打骚扰电话就算被用户投诉,监管部门也无据可查。

「查不到你的通话记录,没有一秒的时长。」王经理自信满满地说道。

用机器人拨打骚扰电话,再加上逃避监管的「巧妙手段」,让这些公司的外呼工作量大幅度增加。房地产、教育培训等领域公司都是他们的大客户,中科智联科技、壹鸽科技等公司提供的「智能呼叫机器人」每个售价3000元。

11 家公司榜上有名,背后利益集团现身

据天眼查数据显示,智能机器人骚扰电话+大数据营销+探针盒子非法获取用户隐私被曝光互联网公司名单包括:

中科智联科技有限公司、壹鸽科技、陕西易龙芯科人工智能科技有限公司、秒嘀科技、智子信息科技有限公司、凌沃网络科技有限公司、声牙科技有限公司、璧合科技有限公司、财神科技有限公司、萨摩耶互联网金融服务有限公司、智子信息科技股份有限公司

其中,被曝光的璧合科技股份有限公司背后股东包括科大讯飞、蓝色光标。旗下产品“招财宝”探针盒子,不仅可以收集用户号码,甚至可以对用户精准画像。

根据天眼查数据显示,璧合科技股份有限公司于2012年8月创立于北京,2015年8月31日在新三板挂牌上市,是国内第一家登陆新三板的效果广告公司。公司主营业务为互联网广告的投放服务,兼营SAAS软件业务。2018年,璧合科技实现营业总收入4.03亿元,同比下降30.95%。

资料显示,北京蓝色光标数据科技股份有限公司(300058,蓝色光标)为璧合科技股份有限公司第三大股东,持股比例为19.79%;其大股东是济南微耀网络技术有限公司,持股28.13%,济南聚力创业投资合伙企业为第二大股东,持股23.13%。

此外,该公司股东还包括科大讯飞股份有限公司(002230),持股3.66%;济南微耀网络技术有限公司、济南聚力创业投资合伙企业等。

目前,蓝色光标已经发文对此事进行回应,称未参与璧合科技的日常运营决策。节目播出后,公司已第一时间联系璧合科技的相关负责人,要求璧合科技对节目中提及的问题进行全面调查,并将督促其及时向公众做出说明。

此外,璧合科技与中国排名前十的页游厂商均有业务往来。

该公司董事长刘竣丰是原悠易互通(北京)广告有限公司CEO。曾任麦肯光明广告有限公司媒介主管,负责麦肯在中国地区的互联网广告业务,服务于微软、AMD、欧姆龙、日立等十多个国际品牌客户;2005年,创办酷热影音(现暴风影音前身),负责公司整体的营销及产品规划;2007年创办悠易互通。

此外,一家名为萨摩耶金服生产探针盒子的公司,全称为“深圳萨摩耶互联网金融服务有限公司”,其股东列表中包括杭州圆景股权投资合伙企业,由马云持股32.72%。

萨摩耶金服,2015年5月成立于深圳。公司的注册资本3.5亿元,自身风险为146条。工商数据显示,由其CEO林建明和另15位合伙人联合创立。

值得关注的是,据美国证监会(SEC)披露的信息,萨摩耶金服已提交赴美上市申请,计划募资8000万美元。本次被央视315晚会曝光,无疑为萨耶摩金服赴美上市蒙上了一层阴影。

节目播出后,萨耶摩金服给出了官方公告,表示正在检查,将第一时间对摸查结果向公众做出说明。

「技术进步」与「技术原罪

「凭借强大的数据分析能力和先进的广告优化算法,为广告主提供开放自助的广告投放平台及一站式广告投放解决方案。」

上边的广告词看上去是不是很熟悉?这是被央视曝光的盗取个人信息企业「璧合科技」的官方宣传词,在我们周围这样打着「大数据/AI 营销」旗号的贩卖个人数据的公司并不在少数。

依托多平台的大数据采集,以及大数据技术的分析与预测能力,这些公司能够让广告更加精准有效,给品牌企业带来更高的投资回报率。而与此同时,其背后的「大数据」生意却是一条深不可测的灰色产业。

据国浩律师(北京)事务所史清霞介绍,「信息黑产」已经建立起由内鬼、黑客、掮客、条商及买家组成的整条地下交易链。

当下,中国地下信息黑产的实际规模已经很难确切估量。根据中国互联网协会发布的《中国网民权益保护调查报告》显示,2107年,国内6.88亿网民因个人信息泄露造成的经济损失预计达到915亿元。

不可否认,数据已经成为互联网经济的石油燃料,每一家快速成长的互联网公司都在竭尽全力去创建场景寻找、收集数据,通过各色名目使出浑身解数让我们敲下「我已阅读并同意用户及隐私协议」的按钮,而随便安装一个APP可能就要给予它超过20项的权限。

大数据人工智能应用场景下,无所不在的数据收集技术、专业化多样化的数据处理技术,使得我们每个用户都难以控制其个人信息的收集情境和应用情境。与此同时,基于这些海量的个人数据和信息,再借助人工智能的技术针对性地进一步分析和处理,便将彻底释放出这些数据的巨大力量。

此时的「善」与「恶」不过就在一念之间。

比如,智能电话机器人,用于营销企业谋取私利,每天数以千计的骚然电话狂轰乱炸,就像是狗皮膏药让人厌恶;而用于任务场景下的智能助手,订机票叫外卖,简直就是生活中的小天使。在去年的Google I/O大会上,谷歌现场演示了能够帮助用户预订餐厅的人工智能助手 Duplex,不是引来阵阵喝彩?

当来自声牙科技的李经理说出那句,「如果明年(2019年)3·15曝出来,那3·15之后就要开始查了,如果3·15不曝出来,那还能用到一年左右。」相信在李经理的心中,「善」与「恶」的界限早已明了。

所以,无论是大数据,还是人工智能,究竟是谁赋予了它们「技术的原罪」?

当技术和时代前进的步伐我们已经无法阻挡,那么我们还能做些什么?

产业科技趋势政府人工智能大数据
2
相关数据
科大讯飞机构

科大讯飞股份有限公司(SZ.002230)成立于1999年,是一家专业从事智能语音及语言技术、人工智能技术研究,软件及芯片产品开发,语音信息服务及电子政务系统集成的国家级骨干软件企业。科大讯飞的语音合成、语音识别、口语评测、机器翻译等智能语音与人工智能核心技术代表了世界最高水平。

http://www.iflytek.com/
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

暂无评论
暂无评论~