数据内涵及权属研究

(整期优先)网络出版时间:2021-04-22
/ 2

数据内涵及权属研究

王莹莹

三井物产(中国)有限公司 , 北京市 100025

随着大数据、云计算和互联网等信息科学技术的革命性发展,数据的价值受到越来越多的关注,数据资源作为数据产业发展的核心竞争要素,成为了网络巨头企业争相角逐的目标,中国近年来出现了诸多围绕数据争夺的著名案件,包括大众点评诉百度案、新浪微博诉脉脉案、腾讯与华为的数据之争、米谷诉元光案和淘宝诉美景案等,这些案件总涉及的数据既有商家点评信息、用户背景信息、加工分析信息等。企业数据利用所产生的数据不正当竞争、数据垄断、数据歧视以及大数据杀熟等现象已然成为了大数据时代特有的难题。

围绕这些难题,学术界纷纷投入到相关问题研究中,而如何界定数据的法律属性、数据到底属于谁成为了探讨分析数据保护模式的基础客体,本文将试图对数据内涵以及数据权属的问题进行简单梳理与探索,求教于大方之家。

1 数据的内涵

我国《民法总则》第127条规定“法律对数据、网络虚拟财产的保护有规定的,依照其规定”,虽然在第111条个人数据保护之外单独提出了数据保护,但对数据本身的内涵并未作出规定。数据本身的内涵关系到的法律属性、产权归属以及数据各方的权利义务关系,是讨论数据确权的重要基础。

关于数据的内涵目前尚无确切的规定,实践中,数据与信息常被混用,理论界一直对于数据权利客体的问题上观点不一,展开了激烈的争论。理论界对于数据形成了四种代表性的认识。第一种“比特说”,如梅夏英教授基于《大数据时代:生活、工作与思维的大变革》一书的理念,主张“数据”(electronic data)限于在计算机及网络上流通的在二进制的基础上以0和1的组合而表现出来的比特形式,以此区分于日常生活中各种纸面统计数据,也区别于以文学、图像或视频等形式显示的信息(information),数据是传递信息的工具。第二种为“符号说”,如纪海龙教授所主张的,应基于符号语言学的指号、语义与语用三个不同层面对数据和信息进行区分,数据应定位在指号层面,而信息内容则位于语义或语用层面,两者应区分为不同客体。第三种为“载体说”,如学者刘金瑞所主张的,数据一般就是指网络信息系统里传输的比特形式的电磁记录,往往不强调其对于人的意义。第四种为“信息实质说”,如学者杨翱宇所主张的,数据并非是纯粹工具性的电子载体,其本质是信息。

除了以上从数据和信息的内涵角度进行分析之外,学者韩旭至另辟蹊径,从数据权力的生产机制切入,从数据价值链生成的角度进行研究,对算法进行考察,明确算法在数据价值、数据权力生产中所处的中心地位,提取数据确权理论的最大公约数,以合法性作为算法规制的中心。其认为无论是代码层上的数据,还是内容层上的信息之所以产生了价值,是因为经过了算法加工处理,经算法处理的非个人数据是数据权利的客体,通过算法获取的数据体现为代码符号,而通过算法加工处理的数据反映其相关内容,经过算法处理的数据均具有一定的价值,可称为数据权利客体,数据价值与数据权利的中心应该是算法。

根据国际标准组织(ISO)的定义,“数据”被界定为一种形式化方式来把信息进行重新解释、重新展示出来的,这种形式化方式是适于沟通、解释或处理的。数据可由人为的或自动化方式进行处理。而“信息”则是关于对象——如事实、事件、事物、过程或思想、理念——在特定语境下具有特定的含义的知识。简言之,“数据”是形式化方式,“信息”则是有一定意义的内容。笔者认为网络经济时代,数据处理已呈现自动化、规模化的趋势,留给人类的选择已由可选择记录哪些信息变为可选择不记录哪些信息,此时“数据”的内涵其实已经随着技术的发展扩大到包含信息的内容。笔者更倾向于将数据区分为数据载体与数据内容,数据载体为比特形式,而信息、算法则是数据内容的一部分。

2 从财产权视角研究数据权属问题

数据确权是权力运用和保护的基础,也是利益保护的重要手段,确权后,相关主体才能充分利用自己的权力,确权是明确权力边界,权利主体才能充分利用自身的权利,从而存进数据市场的活跃,利于数据产业健康发展。但但国内学者虽然认可数据的财产权,但对数据的权利归属观点不一,展开了激烈争论,目前已有思路基本上是对从数据持有主体的激励角度。

学者丁道勤主张,应对数据建议二元所有权,将数据分为基础数据和增值数据,两者对应不同的权属,所有足以对主体构成识别的数据即为基础数据,个人基础数据的提供者即拥有基础数据的所有权;数据矗立着对网络用户从事各种活动进行搜集整理等增值处理行为产生的各种数据即为增值数据,数据处理者在个人数据主体同意的基础上,加工编辑分析而产生的增值数据,其所有权应属于付出劳动成本的数据处理者。但学者王玉林、高富平教授与之观点则不同,其认为,大数据是信息财产权的客体,大数据是数据控制人的资产,是数据控制人将经过定义、脱敏或描述过的数据“写入”大数据控制人所掌握或享有使用权的记录载体,是大数据“进化”未交易标的的过程,也是单纯作为信息载体的数据转化为具有法律意义的数据的过程。如果将数据资产共同为数据主体和数据控制人享有,将导致数据主体权力不明,相关数据法律关系不能成立,无法实现数据价值。政佳宁教授与学者王玉林、高富平教授类似肯定了为信息投入劳动成本的信息制作者应对其所拥有的信息财产享有完全支配并排除他人干涉的权利,并且在此基础上其主张,应构建一种新型信息财产权,信息制作者经营信息享有复制权、使用权、传输权和处分权的权能,并可以通过排除妨害请求权、消除危险请求权、信息恢复请求权和信息删除请求权来维护权利的圆满状态。

龙卫球教授主张,并未落脚于绝对所有权,而是建议为其构建新型财产权。从数据经济关系具有双向、动态特点和数据从业者处于重心驱动位置的复结构角度来看,应将个人信息和数据资产相区分,在此基础上,从数据新型财产权从体系上说,进行两个阶段的权利建构,首先对于用户,应在个人信息或者说初始数据的层面,同时配置人格权益和财产权益;其次对于数据经营者(企业),在数据资产化背景下,基于数据经营和利益驱动的机制需求,应分别配置数据经营权和数据资产权。

徐汉明教授、学者孙逸啸、吴云民认为,则是从数据动态变化过程为其赋权,其主张应基于数据经营活动过程的动态性特点以及数据经营者对数据经济的重心驱动作用,数据财产权应该是数据资源的初始占有者、持有者、管控者,数据开发、利用及经营者对其所掌握的数据进行收集、分析、整合以及加工的基础上而形成的一种持有、管控、分成归属及其收益的结构性权利。数据财产权的主体应以原始数据与衍生数据为基础划分,用户为数据初始所有者,企业、公权力管理机构等主体为数据资源持有者、管控者、经营者等继受归属者,应赋予用户个人数据财产权和数据资源交易分成权;在数据流转、传输、存储、分析、处理等中间环节,确认企业内部数据资源持有者、管控者、经营者等继受归属者的数据管有权、数据利用权、数据经营权以及数据处分权等财产权利形态。

结合数据内涵的讨论,笔者更倾向于认为对于数据确权实质上是对数据内容权利性质和权利归属的分析讨论。我国《网络安全法》第42条规定,对于匿名化数据集合,企业对此享有数据权利,而对于未匿名化数据,因为其数据上所蕴含的个人信息并未丧失,权利主体并未发生变化,也就不能进入流通领域。同时,在司法实践层面,朱烨诉百度案中,法院认为百度公司利用未能与网络用户个人身份相对应的数据信息,该信息不具有可识别性要求,因而认可了数据从业者的抓取利用行为。笔者认为在大数据经济下,从劳动赋权的角度考量,将数据加工者作为数据内容的所有者有相应的正当性。个人数据虽具有人格权利益,但通过合法手段获得并经用户个人同意而获得的数据是合法有效的,数据加工者对合法获得数据进行深加工,对其进行选择、整理、编排,形成了庞大的数据集合,这些数据集合则是一个新的客体,数据加工者为此付出了了一定的劳动和经济成本,通过这些加工实现了数据价值的增值。按照劳动赋权说,谁付出了劳动谁就有资格享有其带来的利益。而且从促进数据经济发展的角度来说,将数据内容赋权于数据加工者将更有利于激发其活力,激励其积极地对数据进行收集、加工、利用,从而使数据经济得以进一步发展。