大数据时代,移动通信和传感设备等位置感知技术的发展将人和事物的地理位置数据化。移动对象中的传感芯片以直接或间接的方式收集移动对象的位置数据,传感器自动采集位置信息的速度和规模远远超过现有系统的处理能力。未来,移动传感设备的进步和通信技术的提升会更频繁地产生位置信息。在大数据时代,这样的产生速度和数据规模为人们的生活、企业的运作以及科学研究带来巨大的变革。我们称这类由于包含位置信息且具有规模大、产生速度快、蕴含价值高等满足被普遍认可的大数据的特点的数据为位置大数据。位置大数据在带给人们巨大收益的同时,也带来了泄露个人信息的危害。这是因为位置大数据既直接包含用户的隐私信息,又隐含了用户的个性习惯、健康状况、社会地位等其他敏感信息。位置大数据的不当使用,会给用户各方面的隐私带来严重威胁。
(一)位置大数据的隐私威胁
类似一般的隐私定义,我们认为,位置大数据的隐私是移动对象对自己位置数据的控制。大数据时代,位置数据的来源极为广泛,位置大数据中包含的移动对象不同时刻的位置信息与背景知识结合,会泄露用户的健康状况、行为习惯、社会地位等敏感信息。例如:观察到用户出现在医院附近,可以推测出用户大致的健康状况;考虑用户轨迹开始和结束的地点,可以推测出用户的家庭住址等信息。此外,加速度传感器等收集到的只包含部分位置的信息,也可以让攻击者有效推测用户的行为模式。
攻击者利用类似上述各种数据推测用户某时刻的隐私,在传统的位置隐私保护工作中通常被称为观察攻击或者关联攻击,但这些攻击模型不能概括大数据时代用户的位置隐私面对全方面推测的威胁。由于“知情与同意”、匿名等经典的隐私保护策略在大数据时代均失效,如何防止攻击者利用收集到的各方面数据推测用户的隐私信息,成为大数据时代亟待解决的位置大数据的隐私保护问题。
位置大数据隐私保护技术研究的早期,并没有专门针对位置大数据的保护手段,研究者仅简单通过用户对数据进行分类,并提供访问控制列表或者数据使用列表等隐私控制策略,避免不可信对象对用户敏感位置数据的获得以及数据的不正当应用。之后,针对位置大数据隐私保护的研究集中在如何避免向攻击者发布移动对象某一时刻的精确位置,同时获得基于位置大数据的服务,这类技术的典型方法包括位置k-匿名等基于单点位置的启发式隐私度量的方法。随着位置大数据隐私保护技术的发展,人们开始注意到轨迹信息包含用户的移动位置在时间上的相关性,于是保护用户轨迹信息的方法受到重视。由于位置之间在时间上的相关性难以把握,一些基于轨迹的启发式的隐私度量方法(比如将位置数据随机化的方法、对空间数据的模糊化方法和对时间数据的模糊化方法)被提出。
但在大数据时代,提供可以量化的位置大数据的隐私保护效果是十分重要的,因此,基于概率推测的位置大数据隐私保护方法从信息论的角度给出位置隐私完整的度量方式,量化每个位置数据暴露的用户隐私。同时,基于隐私信息检索的位置大数据隐私保护技术提供了完美的隐私保护。(www.daowen.com)
(二)位置大数据隐私保护技术
不同的位置大数据隐私保护技术出于不同的隐私保护需求以及实现的原理不同,在实际应用中各有优缺点。这里将位置大数据隐私保护技术分为三类。
基于启发式隐私度量的位置大数据隐私保护技术。对于任意时刻t的位置信息发布后,暴露的用户敏感信息与攻击者收集到的时刻t之前和之后的位置数据都有关,针对这些完整的数据攻击和保护用户的位置隐私代价很大。对于一些隐私保护需求不严格的用户,基于启发式隐私度量的位置大数据隐私保护技术是假设用户在不等于时刻的位置信息只与当前时刻攻击者收集到的数据有关。相应的方法包括经典的基于单点或轨迹的位置隐私保护技术,直接应用这些方法会遭受针对数据特征的攻击。比如:经过空间匿名框处理以后的数据,在考虑移动物体的移动速度时,某时刻发布的匿名框可能由于移动物体上一时刻的匿名框中无法到达下一时刻,从而导致匿名失败。为此,这类方法针对一般常见的攻击手段,如考虑匿名框的面积等技术,对发布的位置数据进行处理,以降低攻击者推测出用户敏感位置的可能性。
基于概率推测的位置大数据隐私保护技术。这类方法严格量化攻击模型的效果,并进而限制任意时刻t发布的位置数据包含的信息量。基于概率推测的隐私保护技术假设攻击者具有全部背景知识,并由此对每个发布的位置数据计算其披露风险,判断发布当前的位置数据是否违反用户的隐私要求。因此,这种位置大数据的隐私保护技术可以在攻击者具有完全的背景知识的情况下,在统一的位置大数据攻击模型下,定量地保护用户的位置隐私。
基于隐私信息检索技术的位置大数据隐私保护技术。当用户要求定义完美隐私时,由于发布位置信息或多或少地会为攻击者带来一些信息,这时会导致没有数据可以发布,用户也因而无法获得基于位置大数据的服务。基于隐私信息检索的位置大数据保护技术,可以在任何情况下保护移动用户的隐私。但在位置大数据上的应用服务中,由于用户查询本身包含位置信息,很长时间内都不存在可以在不解密用户查询的情况下回答复杂的基于位置查询的加密算法。尽管最近的研究结果发现,基于同态映射的加密方法可以在不暴露用户位置隐私的情况下返回正确的查询结果,但最新的结果显示,因为高效的数据访问方法暴露了数据之间的顺序,可以提供完美隐私的高效加密方法是不存在的。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。