这节的主题是企业数据,很多时候也涉及平台数据。为什么要先讲个人数据,因为平台数据很多时候恰恰是由个人数据构成的,平台数据的争夺常常非常激烈。有一种说法大家可能都听说过,就是数据是“21世纪的石油”。现在对于很多互联网企业而言,谁有更多的数据,谁就决定了未来成败。
在涉及企业数据或者平台数据,最近比较热的案子是关于腾讯公司和今日头条公司的。案件的主角是腾讯公司的一款产品——“微信”,今日头条公司的两款产品,一款产品是“抖音”,另一款产品是“多闪”。目前,“抖音”的日活用数达到8亿。现在中国所有互联网产业里面,“抖音”是海外扩展最好的产品,其中在印度、日本排名第一,美国排名第三。但“多闪”不如“微信”。腾讯公司对“抖音”为什么这么警惕?是因为以前认为跟“抖音”之间不存在竞争关系,“抖音”主要是基于内容的一款产品,用户之间往往不认识,远远没有形成一个完整的社交网络。但“多闪”推出之后,则感受到了一定的威胁,因为“多闪”的目标就在于成为一款社交软件。
案件中的法律争议发生在双方公司的合作之后,“微信”和“抖音”首先签订了一个合作协议,通过“微信”可以登录“抖音”,通过登录的过程,询问用户是否可以使用头像、昵称,很多用户选择同意。同意之后,“抖音”把头像和昵称用在“多闪”里,那么是否愿意把“微信”的账号信息用在“多闪”平台上登录呢?很多用户也选择同意。但“微信”方在此之后就把合同给终止了。合同终止之后,“抖音”还在用这些头像、昵称,虽然不能直接从“微信”上登录,但“抖音”积累了很多数据,这些数据还在被用。“微信”就指责“抖音”侵犯了其对于数据的使用权利。今日头条公司则发了一个声明,说腾讯公司认为大家的头像和昵称是属于“微信”的,虽然不同意这个观点,但也没办法,建议修改一下头像和昵称,如果头像和昵称是真实信息,也可以不改。今日头条公司认为头像和昵称是属于用户的。从我刚才的介绍中,大家认为谁有道理?
思考这个问题时,我们第一反应是关于头像和昵称数据。如果细想,就会发现这争议的本质其实并不是头像和昵称本身,而是哪一个昵称和哪一个昵称背后对应的是谁和谁,是朋友、熟人或者不是熟人的关系链数据。如前文所说,个人信息、个人数据本质并不是物一样的东西,它是一种联系,这个是双方争夺的焦点。如果是单独的头像,比如,张三长成这样,李四头像信息是另外一个样子,有没有什么意义?即使有了14亿中国人所有头像与昵称数据又有什么意义?没有任何意义。那什么时候有意义?就是它们之间有联系的时候,当今日头条公司知道谁和谁是好朋友的时候,其意义就非常大了。“抖音”上大概有8亿的用户,但比较复杂的一点是,不知道谁和谁是好朋友,不知道谁和谁是认识的或者有可能认识的,所以通过“微信”头像和昵称的使用,需要借助今日头条公司非常发达的算法,如果能推出8亿用户谁和谁是好朋友,那就会有非常大的商业价值,因为“抖音”就可以通过“多闪”推荐好友,然后真的有可能会成为一款国民社交软件。
从企业数据来说,“微信”对背后的关系链数据有没有它的权利?授权是只授权登录,背后的关系链数据是不能获取的。“抖音”通过用户授权,猜出了背后的数据,甚至可以猜出谁和谁有可能是好友。前文说个人数据保护,或者是说个人数据的存储,如果大家有印象,就知道个人数据属于个人,按“抖音”的说法是头像、昵称数据通过了授权,愿意把信息共享,腾讯公司没有权利干预。只要用户进行了授权就可使用用户个人信息,因为这个数据都是属于个人的。但在腾讯公司看来,这除了可能侵犯用户的隐私期待,还可能侵犯腾讯公司对于用户整体关系链数据的权利。
还有一个非常相关的案子,与前一个案子有点类似,可以帮助我们理解企业数据,这个案子是“今日头条”和“微博”的案子。对于微博上的内容,“头条爬虫”通过技术可以把它同步到“今日头条”上。但“今日头条”也比较聪明,在其他案子里,如“微博”和“陌陌”案,当企业进行数据“爬虫”的时候,有的案子就会被法院判不正当竞争或者是非法获取数据,但“今日头条”想了一个办法,让用户自己选择愿不愿意把数据同步,其认为这个数据同步是在用户的要求之下去同步的。根据个人数据保护原理,个人数据属于个人,个人对个人数据有控制权,同时数据携带权是用户的数据权利,“爬虫”只是帮用户实现数据权利。所以,今日头条公司认为,把头像和昵称用在抖音上是经过用户授权的,腾讯公司不能禁止用户授权使用的个人信息。如果没有用户个人授权,当然可能存在问题,但用户如果授权之后则完全是合法的。
这个案子大家怎么看?对个人数据保护,大家的第一反应是一个非常确定的东西,只要是个人数据就应该进行保护。但我们发现个人数据非常复杂,而且很多时候分析要不要保护,要结合个人数据保护的目的来理解。有一种观点就认为,无论是腾讯公司的例子还是微博平台的例子,平台对于数据都有一定的权利,在收集之后,这些数据变成像财产一样的东西,对于整个互联网来说这是它最核心的资产。大家看腾讯或者新浪这样的公司没有特别多的大楼,而且很多还是附属业务的公关,没有什么厂房、资产之类的,所以最核心的是知道谁和谁是好友,中国这14亿人使用习惯是什么,也就是经常说的数据。对于这些数据,企业有没有权利要求法律对它进行保护呢?
我们再举一个美国的案子。这个案子是发生在“hiQ”和“Linkedin”之间的案子,“Linkedin”类似于人人网,但更职业一点,也是一款职业社交软件。这个案子也是双方先签了协议,“hiQ”可以自由登录“Linkedin”,“hiQ”在此过程也“爬”取数据,后来它们的协议终止了,终止之后“Linkedin”就不让“hiQ”“爬”取数据了。我们一般认为,不让对方“爬虫”,对方如果还继续,此时就可能侵权或违法了。但这个案子比较有意思,“hiQ”反而把“Linkedin”起诉了,说必须开放接口让其“爬”数据。而最后法院也支持了,并在这个案子里下了一个禁令,判决“Linkedin”必须开放API接口,让对方来“爬”取数据。法院有很多理由,但很重要的是认为“Linkedin”包含的是一些数据,一旦接入互联网就是公开数据,既然公开了数据就得让别人“爬”。从原理上是不是这样?如果微博上的数据,我们逐条去复制,这个违不违法?一条一条复制不算违法的话,那为什么“爬”数据不行?比如,书店开在这里,我进去看,但不买书,在那里看,是可以不付钱的。
从这三个案件看,企业数据可以分析出几种观点,传统上如果不涉及个人数据,企业数据一般以商业秘密保护的比较多。关于个人数据有几种观点:第一种观点,数据属于个人;第二种观点,数据属于平台;第三种观点,个人和平台都有权利;第四种观点,数据是属于公共的。
在刚才提到的“今日头条”案里,“今日头条”主张属于第一种,即认为数据属于个人,所以其结果是通过个人数据权利消解数据属于平台的权利。
第二种观点里,由于平台花了这么多力气去收集数据,花费了大量的资本,所以企业认为数据是核心资产,企业对它有财产性权利。“微博”在“今日头条”争议的案子里也是这样,因为平台经常去“爬”它的数据,所以有一段时间修改了《微博协议》,那段时间在微博上所发表言论的著作权都属于微博。当时发布的时候,网友很愤怒,说自己在微博上写点东西,如果后来想结集出版时,还侵犯“微博”的著作权了?后来“微博”退一步,说著作权属于个人,但数据传播权还在“微博”,“爬”微博的数据必须获取微博平台的认可,不认可是不行的。
第三种在我们国家现在的法院判决里面比较多,属于双重授权原则,“爬”一个网站的数据,第一必须获取平台授权,第二必须获取个人授权,双重授权,甚至叫三重授权。“三重授权”的意思是原先平台收集个人数据的时候先要获取用户的授权,在收集个人数据去“爬”的时候要获取平台的授权,在“爬”的过程中又需要用户同意把这个数据从这个平台转到那个平台。
最后一种比较有意思,是在“hiQ”案里提出的。回想前文的内容,思考这其中观点的背后理论基础是什么?数据是属于公共的,我们前文讲的数据是一种公共产品,是公共空间里面谁都可以看。这种理论背后的基础在于数据区别于物的重要特征。比如,手机或者咖啡拿在我手里,被拿走后我就损失了。一个数据被拿走后会不会有直接损失?不会。所以数据并不具有物上的特征,并不具有所谓的排他性,而且也不具有所谓的竞争性。如果一个物理的权属不太清楚容易引起纷争,如大家会天天惦记这个“手机”,不知道谁放在这里,很容易产生争议。数据如果放在公共空间,每个人都可以看到,会不会引起争议、纠纷?不会。所以,从经济学理论说存在非排他性和非竞争性,这是区别于其他动产或非动产的重要特征。(www.daowen.com)
从美国法理论来说,他们常常把数据视为一种言论,这其实就是在主张数据或信息的公共性。我们都知道美国法上有言论自由理论,言论自由理论非常复杂,背后基础认为信息是公共的、流通的,不应该为某一部分人所独有。
总结了这四种观点,我们可以对前面的一些案子重新进行分析。首先看“hiQ”和“Linkedin”这个案子,该案的判决是大家第一反应或者直觉上不太能想到的。但这种判决大家觉得有没有道理,或者是不是完全没有道理?从这个意义上来说,辛辛苦苦创办一个网站,上面收集了很多数据,结果别人用一个“爬虫机器人”,瞬间把所有数据都“搬”过去了,付出的劳动不能得到保护,通过劳动得到的应该受到法律的保护。这种观点大家觉得是不是有道理?
其实未必,或者你可能觉得有问题,但从法律上有一点需要澄清,并不是所有付出劳动的就一定能得到法律保护,因为数据具有非竞争性和非排他性。这就像某个店铺买了空气净化器,花了很大力气把空气净化得非常好。别人使用这个空气,并不意味着就侵权了。因为从法律上来说,作为言论或者是作为信息,更多的是以公有为基础、共有为原则。
这个观点在互联网领域其实是有非常多的支持者的。很多人认为互联网是一个公共领域,只要通过网络连接上了互联网,就能自由使用这个信息,不应该把这个东西给封闭起来。这种理论基础是把整个互联网看作是互联互通的。基于这种理论的中国判决还不是特别多,但大家可以想象,如果说“爬虫”有问题,那只要去看别人就违法了吗?微博平台是否可以设置一个规则,禁止所有的今日头条公司的人去看呢?
“今日头条”和“微博”的争议也涉及数据的公共性问题,但更复杂的是涉及个人数据保护和企业数据保护的紧张关系。我们在前文说“今日头条”很聪明,这个数据不都属于个人的吗,那就让个人授权。这时候“微博”也左右为难,一方面,与这些人(基于用户协议)能不能成立合同处于待定状态,另一方面,即使和明星账号有独家的发布协议也很为难。为什么?当这些明星账号的数据同步后,微博平台又不好意思去起诉这些人,因为你起诉他们,导致他们彻底搬过去就糟糕了,所以就只有去起诉“今日头条”。“今日头条”声称其是基于用户数据携带权来“爬”这个数据的,而且之前有独家协议,那就依协议起诉。而且“今日头条”认为这是在保护用户的数据利益,之前签的独家协议限制了用户的数据权利。
再回到腾讯公司和今日头条公司的案件,头像和昵称作为一些公开数据或者半公开数据,一般普通人都可以获取。比如,大家在加入群组后,群里所有人的头像信息都能够获取,但是背后的数据很多时候一般人很难知道,某种程度上属于商业秘密或者是非公开数据。
因此,今日头条公司和腾讯公司的案子事实上更复杂,腾讯公司认为根本不是关于头像、昵称的问题,而是用户背后的关系链数据,是基于数据权利的保护,而不允许用这些头像、昵称,是背后“我是谁”的用户隐私期待问题。如在“抖音”上发一条个人的搞怪视频,以满足个人虚荣心,某一天发现以前的男朋友或者女朋友看到了这些视频,这种情况下就可能涉及隐私期待问题。就是用户虽然授权了,但用户的授权是否可能导致用户隐私期待受不到保护?当然,是否达到法律上侵犯用户隐私期待的问题,可能还需要结合一般用户的合理期待来判断。
此外,腾讯公司这个案件里还涉及商业秘密的问题。对于平台数据,存在的问题是数据的公共性与整体数据权益之间的紧张关系,但腾讯公司这个案件则更为复杂。当前台数据属于公共性数据,但对这些数据的获取与分析可能得到企业的非公开性数据时,此时这种获取与分析是否涉嫌侵犯商业秘密?这里的问题可能又会非常复杂。
因此,我们对于这些企业数据的案例与原理分析就先到此为止。虽然对于很多问题我们并没有提供太明确的答案,而且可能也不存在明确的答案,但重要的是,我们真正超越了部门法与某个学科的局限,从各个不同的学科出发,以问题为导向来做学术研究。
我们多次强调,数据有多重属性。我们常常会说,数据就是“石油”,大家一想到石油就觉得是物,具有财产性价值。但数据也有可能是一个隐私权利,隐私权利就是个体相对比较独立的权利,或者个人对个人信息合理预期的利益。但常常被我们忽略的是,数据也具有公共产品的特点。公共产品有很多用处。即使很多主张私有财产保护的人,也都非常主张在信息和数据上推行公有制。从这个角度来说,我们特别需要多学科的视角。我们当前对于个人数据的理解常常是它属于人格权还是财产权的问题,财产权对个人信息可以进行交易。比如,有的企业保护信息的程度高一点,收费可以更高一点,保护不那么严格,收费可能低一点,同时个人有选择权。但人格权是个人不可转让的权利。我们其实会发现,数据还有其他性质,如作为公共产品的性质。像前文提到的,我们在日常生活中不会去保护个人数据,为什么?因为在大部分场景下数据具有公共性。
当然还包括其他角度,如知识产权角度。知识产权是对于基本事实不进行保护的,其保护的是具有原创性的内容。在个人信息保护里面,完全靠知识产权是有问题的,知识产权没有隐私性权利属性。
之所以选择数据这个主题,就我个人来理解,是觉得这个主题恰巧横跨整个法律体系,有些体系我们现在也没有来得及去思考。我们已经讨论了民法上隐私的问题、公法的问题,其实还包括其他的,如数据侵权问题。关于侵权的问题,有不正当竞争的问题,有商业秘密的问题。还有关于合同的问题,合同是否有效,用户协议是否有效,其中会涉及美国和欧洲、中国的关系,涉及国际法和国际关系问题。从法学研究视角上来说,当你深入问题的本质,其背后的问题,会反映所有浮在表面上的话语思考也存在着问题,背后有很多东西需要进一步去分析、进一步去阐述。对于中国法学来说,这可能是未来研究者们肩上的任务,现在已经到了一个需要“后浪”们去创造的年代。当然,这个创造必须建立在对西方已有研究广泛阅读和对生活经验深刻理解的基础上。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。