如何保持大数据(理论上)匿名

2013年5月17日 经过 · 1条评论

本文由John C. Tanner颁发,最初发布 Telecomasia.net..

物品: 研究人员声称已经开发出一种用于巩固从蜂窝网络生成的大数据的模型,而不会揭示移动用户的身份。

研究团队来自&罗格斯大学,普林斯顿和罗泰大学建立了洛杉矶和纽约市的“移动模式”,使用来自移动语音呼叫的位置数据点和文本消息&这两个城市的网络。该模型汇总数据,产生代表的“合成呼叫记录”,然后在数学上模糊任何可以识别人员的数据,报告技术审查:

新方法通过聚合真实人类运动的痕迹,然后识别可能表示家庭,工作或学校的公共场所。接下来,它创建了一套运输模型。这些模型生成了研究人员称之为“合成”的人的路线轨道,因为它们仅仅代表总数据,而不是实际的人。

但第三部分是关键。即使是这些所谓的合成记录也可以与真实的符合匹配(特别是当底层聚集样品小时)。因此,使用称为差异隐私的新兴技术的算法计算出的这种风险的高度高,以及如何通过改变数据来减少它。

换句话说,您可以将“噪声”注入模型,例如改变聚合的家庭和工作位置或呼叫时间以减少对单个用户的数据的依赖。

这是关键,因为其他研究已经证明它是可能的采用匿名移动用户数据,并针对一个人的姓名和地址 用它。 3月,比利时MIT和CathtéCatulydeLouvain的研究人员从一百万和半移动用户中获取了数据,并管理只使用四个位置参考点识别95%。

当然,这个问题是上述模型将在多大程度上在现实世界中工作,或者某人在其周围找到一种方式需要多长时间。

就此而言,还有一个问题的问题是如何遵循这种模型,这将取决于当地监管环境等事物,以及它们是否可以将匿名数据作为可识别数据作为可识别的数据。虽然匿名数据是 理论上是有用的 对于像街道交通规校这样的东西,像种族分裂这样的东西,疟疾爆发和贫困程度,那里不一定是商业商业模式。

此外,来自奥特网的竞争压力来自谷象和谷歌和Facebook,他们已经收集了大量用户数据,以便他们的广告客户的利益(以及有时, 无论政府机构是否可能想要访问它)。如果他们不保留所有数据匿名,为什么需要Cellcos这样做?

同时,虽然我们在大数据上,其中的商业价值和它提供的匿名水平,您可能想要退房 这件作品 从凯特克劳福德的凯特克劳福德为市民媒体,这解决了关于大数据的五个神话,包括这一数据:“大数据是匿名的,所以它不会侵入我们的隐私。”

Crawford的判决:“出错”。

'addthis:title =''>

如果你还没有,请带我们 读者调查!!只有3个问题可以帮助我们更好地了解谁在读电信摇滚之后,所以我们可以更好地为您服务!

类别: 政府规章 · 其他帖子 · 无线的

加入讨论!

1评论,添加你的!


发表评论

您可以 登录 发布评论或填写表格匿名发布。