1.以大数据为核心:用户数据—大数据—目标信息
以大数据为核心的数据实践是目前学者们探讨数据利益保护的“标准化语境”,其关注数据的宏观总体,以尽可能多的数据为样本(样本≈总体),持续、快速地对巨量数据进行剔除、交换、提取、计算,进行相关性分析,进而萃取信息。在以大数据为中心的数据实践中,数据形态沿着用户数据—大数据集合—目标信息发生变化。[9]用户数据是指用户向数据从业者提交的,或者因使用数据从业者相关产品、服务而生成的,或者因携带移动智能终端及其他可穿戴设备而产生的与用户本身及其行为、状态相关的信息。如新浪微博通过吸引用户注册和使用微博,收集用户的账户昵称、性别、密码、密码保护选项、电子邮箱、手机号码等信息。[10]不计其数的用户数据持续汇聚形成大数据集合,[11]具备体量大、速度快、类型多、难辨识和价值密度低的特点。各大数据交易中心挂牌的大数据即为汇聚后形成的大数据集合。大数据集合孕育了大量潜在信息,待数据从业者挖掘和利用。基于大数据集合所获得的目标信息是通过相关性分析而发掘的普遍规律或者现象。从海量数据中挖掘萃取的目标信息无疑将直接推动数据从业者获取竞争优势,实现生产、管理革新。如沃尔玛通过大数据分析发现周末购买尿布的男性同时也会购买啤酒,进而改变商品陈列。目标信息是企业重要的生产资料,也是国内外数据从业者激烈开展数据争夺战的终极目的所在。通过数据萃取的目标信息,是用户数据和大数据集合之价值进一步浓缩和升华的结果,承载了数据从业者最为关键的利益。
2.以小数据为核心:用户数据—小数据—目标信息
除了以大数据实践为中心的数据实践外,还有另外一种并未受到法学界关注,却同样广泛存在、对企业具有重要意义的数据实践——以小数据为中心的数据实践。“小数据”的概念由康奈尔大学教授D.Estrin首先提出,D.Estrin教授指出,由于搜索引擎、社交网络、电商平台等逐渐深入个人生活,每个人都无时无刻地生产着“数据面包屑痕迹”(Trail of Data Breadcrumbs),这些数量巨大、来源不同的数据汇聚成了小数据集合,其以特定个人的行为和特征为中心,成为数据从业者精准投放广告、提升产品和系统个性化程度的依据。[12]自此,小数据的概念在美国学界开始受到关注,其重要性也得到宣扬和强调。[13]小数据的“小”并非数量小,而是关注范围小。相对于大数据关注大规模用户而言,小数据关注用户个体,是“针对个体用户的全方位、多层次行为模式和情景感知的数据集合”,[14]通过对小数据的收集、分析,数据从业者可以尽可能精准判断和预测用户的行为规律和偏好,进而开展精准营销、个性化服务,提升商业效率。如《腾讯隐私政策》和《新浪微博个人信息保护政策》明确将精准广告推送和个性化服务提升作为明确的信息收集目的。[15]小数据的潜在价值驱使数据从业者或扩大商业版图、提供覆盖生活方方面面的应用服务,或通过商业合作开拓获取用户数据的渠道,以描绘清晰的用户人格图像。
小数据实践在我国法学界尚未得到单独关注和强调,而被埋没于大数据的价值和实践中。然而,以小数据为中心的数据实践中,数据形态变化和数据从业者的利益诉求均与大数据实践存在显著差别,分别讨论实有必要。小数据实践中,数据形态沿着用户数据—小数据集合—目标信息变化。与大数据不同的是,由于小数据分析以提供更为个性化的服务为目的,因此小数据分析所萃取的目标信息与用户个体的行为规律和偏好密切相关,往往具有识别性。如亚马逊通过消费者的网上浏览、购买记录,挖掘潜在用户的潜在购买需求,以实现定向精准推荐商品;日本国家先进工业科学与技术研究所通过汽车座椅压力传感器提供的人的身形、姿势、重量分布等数据,分析压力分布差异,研制出个性化的识别防盗系统。(www.daowen.com)
3.大数据与小数据的融合
数据实践中,大数据和小数据往往是相互融合的,尤其是在数据从业者力量不平衡的数据生态下,数据从业者兼具开展大小数据实践的能力。大数据和小数据的融合表现在:大数据中含有大量用户数据,通过对这些数据的剔除、筛选,可以提取关于特定用户的小数据;小数据汇聚亦可以形成大数据集合,此其二。为清晰展示数据实践中的数据形态变化,列示如下:
必须说明的是,数据从业者间的数据流通并未直接改变数据的具体形态,数据从业者授权他人抓取其控制的用户数据或者使用其大数据集合均是用户数据、大数据集合转移,并不改变数据形态。数据从业者之间数据流通的重要意义在于促使数据价值孵化机制在数据从业者间广泛进行,促进数据价值的产生、积累和升华:从横向角度而言,不同数据从业者往往可以从相同数据中挖掘出不同的目标信息;从纵向角度而言,数据从业者在数据价值孵化过程中接力合作,萃取更为精确、更有价值的信息。但无论是平行开发还是接力合作,数据价值孵化系统宏观上都要经历数据汇聚—数据分析—数据应用这一过程,由此形成的数据利益分布于用户数据—数据集合—目标信息之上。
尽管真实的数据价值孵化和利益分布并非如此按部就班、清晰可分,但超脱于数据实践本身从整体上捕捉规律,有利于以相对宏观的视角、相对清晰的思路分析数据利益的动态性,避免在复杂实践的淤泥中越陷越深。数据形态变化并非只在技术研究中有意义,对于法学研究尤其是数据利益保护研究也同样具有启发意义。只有透过数据利益的产生机制,沿着数据利益的分布机理,细致分析和比对数据形态及其之上的利益内容、利益分配和利益衡平,才能有的放矢地对数据利益保护路径作出安排。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。