理论教育 法意文心:什么是个人数据?学术思考一

法意文心:什么是个人数据?学术思考一

时间:2023-08-07 理论教育 版权反馈
【摘要】:我们先来看第一个问题,什么是个人数据?前文讲了很多关于个人数据要保护的现状和立法,从做研究的角度上来说,首先有一个基本的问题:什么是个人数据?你在淘宝网上买了一本书或者一盒化妆品,这是不是个人数据?身份证号码是否属于可以确定识别的个人数据?我们对于个人数据的理解很容易陷入物的思维,如什么是个人数据、什么不是个人数据。

法意文心:什么是个人数据?学术思考一

我们先来看第一个问题,什么是个人数据?前文讲了很多关于个人数据要保护的现状和立法,从做研究的角度上来说,首先有一个基本的问题:什么是个人数据?关于这个问题,各个国家都有规定,但基本上的规定是说个人数据是已识别(identified)或者是可识别(identifiable)的数据。比如,前面讲到的美国法律还有欧洲法律里面都有此类规定,我国网络安全法把个人数据定义为已识别的个人数据或者结合其他信息可以识别的个人数据。当网络企业或者数据收集者在收集个人数据时必须要获得法律的保护。

这个定义非常重要,比如,对于个人信息的非法买卖,我国刑法中非法获取售卖500条以上个人信息就可以入刑。那个人数据到底指的是不是个人信息?如果是,就会涉及刑法问题。欧盟对于个人数据保护很严格,他们有一个促进非个人数据流通的规定,对于某条数据是否属于个人数据,会有相应的完全不同的法律规制框架

从法律研究角度怎么理解这个问题?这个问题初看上去好像很简单,但我想问一下,能不能举几个例子来分析一下这个“简单”的问题?

首先,姓名是不是个人数据?身份证号码是不是个人数据?生日是不是个人数据?你的偏好、爱好是不是个人数据?比如,你在网上买的一本书是不是个人数据?你在淘宝网上买了一本书或者一盒化妆品,这是不是个人数据?有没有哪条数据肯定属于个人数据?或者说属于已识别的个人数据?身份证号码是否属于可以确定识别的个人数据?对于公安机关来说,一条正确的身份证号码可以识别出个人,但其他机构、企业或个人能够凭身份证号码识别个人吗?

所以,对于个人数据概念的分析,有一个很重要的误解要消除。我们对于个人数据的理解很容易陷入物的思维,如什么是个人数据、什么不是个人数据。但我们仔细分析个人数据,会发现数据最重要的特征是一种线索或者是一种痕迹。从线索或者痕迹角度思考个人信息,会发现某种程度上,没有哪个数据或信息属于已识别的数据,为什么这么说?因为没有哪个信息可以完全确定到个体,所有信息中间都可能存在着信息链条上的断裂,这个在刑事领域特别明显。反过来说,所有的信息都可以被归纳为可识别信息,都有可能追踪到个人。即使从这个门出去,另外一个人看到你从门出去的一刹那,背影也可能变成个人信息了。大家如果看《福尔摩斯探案全集》会有这种感受,或者看《名侦探柯南》也会有这种感受,为什么能破案?从侦探视角来看,一个完全不属于个人信息的数据,都可能变成个人数据。比如,这个粉笔今天被人用了一下,这个信息算不算个人数据?你第一印象肯定觉得不是个人数据,但它有可能成为个人数据。(www.daowen.com)

所以,我们回到法律写作与法律研究角度,可以发现,通过一个非常简单和一个看上去非常普通的议题,却可以挖掘出一个推翻我们直觉和常识的学术议题。个人数据为什么和我们想象的不一样?为什么并没有那么确定?这其中一个最重要的原因是固化思维,数据恰巧是一种线索或者是一种痕迹。

对应到现实问题,这种思维在很多问题上具有现实意义。比如,个人数据保护法的保护对象问题,其实大量的个人数据保护并不是说收集我们的身份、电话信息或者个人信息,大部分争议点其实是一些属性不太明确的数据,如“用户画像”类的数据。很多数据收集的恰恰是行为信息和偏好信息,包括“BAT”对信息的收集,其实并不知道我们的身份,但知道我们的姓名是什么;并不知道我们的电话号码是什么,但知道行为偏好是什么,我们喜欢什么。那么问题也就来了,这些数据属于个人数据吗?需不需要对这些进行保护?比如,我们前文讲的,你在淘宝上的购买记录,你的数据是什么?当然会有一个IP地址,或者对应一台电脑或一部手机的IMEI码,如果知道用这个手机的人喜欢买什么东西,那么这个数据算不算是个人数据?

其实这里有一个更为深刻的哲学问题,什么叫已识别或认识一个人?当同学们说认识某个人的时候是什么意思?同学之间相互知道姓名,这是认识彼此吗?如果你观察一个人很久了,知道他的行为特点,知道他的行为轨迹和生活习惯,但是不知道他的名字,也不知道他的一些信息,这时候算不算认识或识别周围的同学?所以往深了说,个人数据研究其实有一个很深刻的哲学问题,甚至可能变成一个“你是谁”的问题。

回到“用户画像”的法律问题上,其实现实中已经有不少此类案件了。比如,南京法院曾经判的“朱烨案”。朱烨是一位女性,在网上搜索一些类似于丰胸的广告百度就不断地给她推送整形、流产之类的广告,于是朱烨就起诉百度。这个问题的关键就在于企业通过“用户画像”,可能比周围同学更知道你喜欢什么,因为你不会对周围同学提供此类信息。匿名化的行为信息是不是属于个人信息?或者是不是属于个人数据?从信息收集与传播的方式来看,“用户画像”的起因在于整个信息沟通方式发生了变化,以前同学之间相互交往都是先从姓名开始,然后交换电话号码和其他联系方式,最后才是了解对方的喜好。现如今,整个信息收集与传播的方式大大改变,互联网公司或者数据企业通过大数据,可能恰恰是先知道了我们喜欢什么,但我们叫什么名字、住哪里往往不知道。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈