来自 娱乐 2020-06-24 16:43 的文章

从传统产权到数据产权,数据究竟属于谁?

从传统产权到数据产权,数据究竟属于谁?

图片来源@全景视觉

文丨陈根

伴随着5G技术的发展,数据的基础性战略资源属性进一步突显。技术的发展以及云、网、端、IoT等基础设施和设备的发展也使数据量在以指数级的速度增加。研究显示,过去几年中人类制造的数据占整个人类历史数据量的95%,换言之,大数据时代已经真正降临。

我们知道,农业经济社会重要生产要素是土地,工业经济时代是资本,数字经济时代是数据以及相应的算法和算力今年的《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》,已将数据作为与土地、劳动力、资本、技术并列的生产要素。从前的产业多为技术密集型或资本密集型,而今天对某个产业的判断可能会看它是否为数据密集型。因为这会直接关系到对这个产业发展和性质的判断,而数据密集型产业的技术含量会越来越高。

随着数据量逐渐增多,数据问题逐渐成为焦点问题与过去任何一种生产资料不同的是,数据既是生产要素,同时其本身也映射了某种社会关系,这使得对于数据的利用会产生相关的外部性问题。

人自身的行为数据以及人与人之间的互动数据,涉及隐私和个人信息保护;企业与企业的数据,涉及竞争关系或商业秘密。更进一步的是,人、物、组织之间的交叉互动联系所产生的数据也使得讨论更加复杂化。这也带来了一个全球性问题——当隐私成为一种数据,当数据成为一种资产,我们该如何保护它?数据确权又将去往何处?

从传统产权到数据产权

在中国两千年历史中,私有产权一直与中国传统的至高无上的皇权概念,比如皇帝、天下直接相抵触、相违背。虽然从宋朝开始百姓可以在市场交易土地使用权,但从百姓到宰相,土地的最终控制权都归于皇帝。上千年以来,中国文明中没有不可侵犯的私有财产的概念,没有个人权益的概念,也没有争取个人权益的事实基础。与世界上其他国家现代化的历程相比,从戊戌变法开始,中国在一百多年的现代化努力中遇到的困难都与中国传统上私有产权的孱弱、人的基本权利的孱弱、私法(民法)的缺失密切相关。

中国的改革开放过程中,做的最重要的一件事就是引入了私有产权的制度成分。在改革开放的四十年中,中国对私有产权的保护时而进、时而退。与此同时,相比于发达国家,中国对私有产权的保护还处于相对落后的阶段。现在,以人工智能为标志的第四次产业革命已悄然而至,它带来了一个全球都猝不及防的问题:当隐私成为一种数据,当数据成为一种资产,我们该如何保护它?数据确权将去往何处?

数据具有“使用非损耗”的属性,表面上看似不具有稀缺性,但因数据蕴藏着经济利益,其被企业采集并存储在施加了技术措施的数据集合。这就使数据资源变得稀缺起来,由此导致企业之间的数据争夺战愈发激烈。例如,顺丰与菜鸟的“物流数据”之争、华为与腾讯的“微信数据”之争、新浪微博与脉脉的“微博数据”之争,这在较大程度上凸显了商业领域中数据确权的紧迫性。

此外,个人数据荷载了人格要素,频发的数据泄露、数据滥用等事件,唤醒了人们的数据安全意识人们控制个人数据的诉求也越来越强烈,当人们无法获得技术方案所保障的数据安全感时,便会转向制度规则寻求保障,即希望法律赋予其控制个人数据的能力。被媒体视为21世纪以来影响最不好的15起数据安全事件就在一定程度上凸显了生活领域中数据确权的必要性。

而关于数据的确权,毫无疑问会成为中国人工智能发展,以及数字经济发展的重要影响因素。

数据确权的私有和公有

在众多对财产权的研究中,洛克的观点很有代表性。他阐述了私有财产神圣不可侵犯原则,认为每一个人对自己的人身都享有所有权,每一个人对自己的生命、自由、财产都具有平等的权利,任何人都没有占有权。由此推之,自然人基于自己行为产生的各种信息并因此而形成的数据,自然专属于个人,尤其是数据产品,属于劳动付岀所得,理应享有产权

因此,自然人或企业自身参与社会活动的显名或可识别数据,可以隐私、商业秘密或知识产权形式存在,产权归属于数据产生者自己。双边或多边交易中产生的数据,关涉到参与各方,则产权原则上共有。

政府控制着大部分公共数据资源,从经济学角度来看,政府数据属于公共产品。首先,政府数据具有非排他性。平等对待所有主体、无条件且非歧视,不同于私人数据产品“谁付款、谁受益”。任何人对政府数据的消费不会影响其他人;其二,政府数据具有非竞争性,突岀表现在政府数据边际生产成本和拥挤成本为零。理论上不论增加多少需求,同一数据集可以无限次近乎零成本的被重复访问下载;其三,政府数据效用不可被分割。无论政府数据如何被使用,都不会改变原始存储在开放平台上的数据效用。数据源不会被随意修改,用户对数据后续具体使用处理也不影响原数据的整体效用;最后,政府数据的公共性源于政府本身的公共属性。

从国家产生的历史来看,正是国家的出现,才将人们的自然权利变为法律权利。没有政府组织或参与收集整理数据便没有个人数据的完整呈现。可以说,自然状态的产权具有不确定性。在数据产权创造中,政府的贡献是巨大的,这才使得数据产权获得了法律上的确定性和外部的强制性公权保护。同时,在对个人数据的整理挖掘中,政府的劳动附加了数据的价值,大大提高了了数据资产化、价值化的可能性。从某种意义上说政府是数据财富的创造者和推动者就如土地征用一样

与此同时,要警惕的是政府对数据的滥用,这或将成为权力机构对个人实行监控的工具。随着健康码的全国推广及普及,健康码似乎已经成为后疫情时代的新常态。从防疫健康码,到健康码升级,目前已有多市实现与电子健康卡、电子社保卡的打通使用,即凭码看病,健康码已经不是一个简单的“管理措施”。

随着科技的发展,数字孪生成为社会的趋势,一种数字式的自动化行政不可避免。健康码的延续当然传达着巨大的信号,这是行政系统以前所未有的效率和能力挤占个人生活的开始。而个人隐私与社会监管两者之间对于数据的管理边界又在哪里?这是另一个数据发展不可避免的新生问题。

从私有到公有再到数据共有

无论是数据私有还是数据公有,数据的产权都相对容易界定,但是较难界定的是各类互联网平台掌握的涉及个体的交易或行为数据。这类数据产权界定甄别问题由来已久,早期的平台更多地体现实体特征,如商场、专业市场、交易所等,信息更多地以纸质形式存在。随着信息技术的发展,很多信息变成了数据。数据很容易被存储、复制、加工,数据流转交易成为常态。

平台的数据究竟归属谁?在产权界定研究思路上,传统法学通常遵循“事后研究”方法,依既定财产权类型和规范来解决纠纷,而法经济学则采用“事前研究”方法,假定纠纷发生后通过效率论证来重新确定各个权利束的顺位高下。

科斯定理认为,只要在财产权是明确的,并且交易成本为零或者很小时,那么无论在开始时将财产权赋予谁,市场均衡的最终结果都是有效率的,实现资源配置的帕累托最优。当然,在现实世界中,科斯定理所要求的前提往往是不存在的,财产权的明确是很困难的,交易成本也不可能为零,有时甚至是比较大的。于是,在大于零的世界里,数据产权归属方案在影响资源优化配置上就非常关键了

关于数据确权的共有问题,需要明确的是数据产权由用户和平台共享。在这种产权框架下,需要科学设计数据信息的使用规则,从而明确双方的权利界限。

从数据价值产生过程来看,价值更多地来源于数据背后的行为分析而不是原始数据本身。交易数据是自动记录的,用户不可能、也无需操心数据的质量。相反,平台则有动力优化数据处理方式,从而挖掘更多价值。因此,应该把数据的剩余索取权界定给平台从平台行为数据产生看,平台投入人力物力,为数据的整理和储存等付出努力理应对这部分数据享有一定权利

在这种共享产权的框架内,平台征得用户同意后,可以将交易数据和姓名、身份证号、性别、家庭地址等个人信息进行配对,进行下一步的开发利用。客户享有基础数据产权,仅仅有权明示反对个人数据的市场化运作对于数据匹配后推断出的数据,例如通过所购买的商品推断出的身体状况、性取向等,可以行使否决权等,也可以自行采取产权保护措施,如拒绝平台利用Cookie进行追踪的请求,或关掉手机定位功能,或者在第一次接到平台使用数据进行针对性营销时明示反对等。

在共享产权模式下,平台使用数据的自由度大大提高,将为下一步数据利用和开发奠定良好基础,从长远看必将推动数据产业发展,从而促进社会福利整体提高。

保护隐私是大数据时代社会发展的基本问题

事实上,数据的确权逃不开隐私保护的问题,从执法的角度看,在没有司法独立的情况下,任何法律都无法公正地执行。因此,只有在司法独立的情况下,讨论与数据确权相关的法律问题才有意义。

关于保护隐私的立法,欧盟早在2016年就出台了《通用数据保护条例》(General Data Protection Regulation,简称GDRP),而美国相关的法律则至今还在辩论之中。在对隐私权没有相应的法律保护,同时又高速发展的美国,产生了曾经沸沸扬扬的Facebook数据泄露丑闻。一家叫做“剑桥分析”(Cambridge Analytica)的英国公司,以性格测试的方式收集超过5000万Facebook用户的信息,进行美国选民心理档案的商业化,有效地干预了2016年美国大选。这意味着人们的私有财产在不知情的情况下被人利用了

在谈论与保护个人隐私相关的法律时,一个重要的基本前提是法律对私人数据的保护,是保护人的基本权利,是维护社会的基本秩序。最好的法律一定是一方面保护私人对数据拥有的权利;另一方面,在保护的前提下,能够帮助私人交换这些数据。能够交换数据权,才使得它能够被整合。如果私有产权不能够交换,资产就无法被整合,那么整个社会就会裹足不前。

对于大量的私人数据如何在市场上交换,如何整合等一系列的问题,目前人们还没有充分的认识。如何在保护隐私的同时增加社会福利,这是整个法律和制度层面的一个重大的基本问题。

对于数据确权将去往何处,没有人能够事先就完整地知道一切。从历史的角度纵向来看,数据是继语言和文字之后的人类第三次信息载体革命。

正是因为有了数据,人类才能够海量地收集、存储、处理客观世界的信息。在此基础上重现、模仿客观世界。因此,发展人工智能给人本身,甚至整个人类文明都带来了革命性影响。此外,脑机接口已经踏上发展的快车,未来我们极有可能不再需要通过书本、视频等媒介实现交流与学习目的。届时,数据将给语言、文字带来另一场颠覆。毫无疑问,我们已经站在时代发展的关口,人类的智慧是技术的智慧,也是发展的智慧。