区块链开启信息产权新时代

原创: 戴剑 张宇萌 国际融资

在大数据时代背景下,各机构之间共享数据困难,主要是因为数据的校验、保存和同步一直是一个难点。各个利益相关方在访问和共享数据时存在严格的限制,这一过程需要花费大量的资源和时间用在权限审查和数据校验。究其本质,是对数据产权难以界定而引发的问题。本文提出使用基于区块链的数据共享模型,具有去中心化、安全可信、集体维护、不可篡改等特点,适用于解决各机构数据共享的难题。从此,区块链有可能打开数据(信息)产权的新时代!

数据的所有权

提出数据的所有权这个问题,主要是基于大数据的发展。我们看到,大数据产业发展给民生带来了便利,推动了社会的治理和进步。然而,在区块链之前要享受这些便利难免需要牺牲一部分初始所有权人的权利,包括隐私权。

2018年3月26日,在中国高层发展论坛上,李彦宏称:“将各个数据来源放在一起,它的威力和能力将会呈现指数级上升,与此同时我们也非常重视隐私问题,以及包括数据的保护问题。在过去几年当中,中国也越来越认识到这个问题,也一直在加强相关的法律法规的建设。在这一个过程当中,我想中国人会更加开放,或者说对于这个隐私问题还没有那么敏感。如果让他们选择用隐私交换便捷性或者效率的话,在很多情况下,他们是愿意这么做的。对于我们来说,当然要遵循一系列的原则,就是说如果我们认为用这一个数据会让所有人受益,而且他也愿意让你使用这一个数据的话,我们会使用的。”

甚至有人提出这样的谬论:当前大数据行业正处于高速发展阶段,应以保护大数据产业发展为优先价值,兼顾初始所有权人的权利,只有这样才能赢得大数据产业的国际竞争。

公地悲剧

1968年,哈定在《科学》杂志上发表了一篇题为《公地的悲剧》的文章。文章写到:英国曾经有这样一种土地制度——封建主在自己的领地中划出一片尚未耕种的土地作为牧场(称为“公地”),无偿向牧民开放。而作为理性人,每个牧羊者都希望自己的收益最大化。在公共草地上,每增加一只羊会有两种结果:一是获得增加一只羊的收入;二是加重草地的负担,并有可能使草地过度地放牧。经过思考,牧羊者决定不顾草地的承受能力而增加羊群数量。结果是因羊只的增加而收益增多。看到有利可图。许多牧羊者也纷纷加入这一行列。由于羊群的进入不受限制,所以牧场被过度地使用,草地状况迅速恶化,公地牧场最终因“超载”而成为不毛之地,最终导致牧民的牛羊全部饿死。

“公地悲剧”说明产权不明,使得企业和个人使用资源的直接成本小于社会所需付出的成本,从而使资源被过度地使用。科斯定理证明,一旦产权明确,而各利益相关者之间的联络、谈判、签约等的成本足够低,则无论将产权划归给谁,最终总能达到该资源的最优配置和使用。因此,尽可能地将数据的所有权明晰,并配备完善的交易市场及健全的法律法规,明确责任和义务,则能够避免“公地悲剧”在数据领域的重演。

其中,数据所有权的内涵就是拥有对相关数据的支配、处置和获益等财产的权力。这些权力具体的表现为:同意权、知情权、异议权、纠错权和司法救济权。真正做到谁的数据谁作主,通过严格的执法和行业自律,确保大数据在产权清晰、权力保障有效的框架下,发挥更大的价值,大数据才会拥有健康发展的未来。

明晰产权是建立数据流通规则和秩序的前提条件。在区块链之前,没有很好的解决方案,直到区块链出现后,对明晰数据产权有了新的工具,推动了数据的大发展。

基于区块链的数据共享模型破解数据(信息)产权困局

数据同样拥有产权属性,区块链则能让数据变成一种资产甚至一种产权。基于区块链,数据的所有权回归到数据生产者身上。在这样的条件下,每个人都可以决定第三方是否能够读取、使用自己的数据,人们也可以围绕数字资产创造财产,变现数据资产,而不是无偿地贡献给第三方平台。

产权区块链可以扩展于所有类型的资产,如果数据可以作为一种产权,这样会极大地激励人们解锁更多的数据,从而真正开启信息革命的大门。综合现有的研究成果,创新地提出并设计了基于区块链的数据共享模型。具体分下面两步实现:

数据上链,即数据确权

在数据块中存储的每条数据不能大于100KB,在用户不愿对数据加密且数据量很小的情况下, 数据摘要部分可以存储数据原文,数据类型可能是一个链接、一段文本、一个小图片或者一小段视频等。当用户希望数据加密或数据文件很大时,解决方案是一边计算数据摘要并将其存储在数据块中,一边将文件加密存储在分布式数据库系统中。

这样做使得数据块中的数据摘要不仅可以对数据进行完整性校验,同时可以作为在数据库中查找数据的索引。其具体步骤如下:

首先,用户提记录请求, 并提交公钥作为标识。

其次,某代表节点接受请求,并广播。

其三,代表节点根据用户公钥将记录添加入数据块。

最后,每隔10分钟将所有新生成的数据块的merkle根锚定到比特币区块链。

数据共享与访问控制

数据所有者将数据加密存储在分布式数据库中,模型采用密码学中代理重加密(Proxy re-encryption)机制来实现对数据的访问控制和共享。因为模型基于区块链技术是一个去中心化的应用场景,没有可信的第三方也就不存在传统重加密场景中的唯一的代理角色。系统中的任何节点都可以充当代理完成重加密的操作,作为报酬可以获得相应的Token。

代理重加密技术实质上是一种用于密文之间的密钥转换机制。在代理重加密系统中,代理者在获得由授权人产生的针对被授权人的转换钥(即代理重加密密钥)后,能够将原本加密给授权人的密文转换为针对被授权人的密文,然后被授权人只需利用自己的私钥就可以解密该转换后的密文。代理重加密能够确保,虽然代理者拥有转换钥,但其无法获取关于密文中对应明文的任何信息。从而实现了授权人和被授权人之间的数据安全共享。

由于使用代理重新加密,未加密的对称密钥(能够解密私有数据)绝不会暴露在服务器端,即使被攻破,黑客也只能得到重新加密的密钥,并且对文件的访问仍然受到保护。


结束语

随着区块链技术的快速发展,这一新兴技术会逐步成为热点研究课题, 本文提出的数据共享模型有助于现有机构的数据中心进行转型,以满足越来越多的数据安全存储、共享等需求。相信数据产权也能够创造更多的机会,产权区块链可以扩展用于所有类型的资产,这也将是第三次革命的到来。

区块链开启信息产权新时代

在大数据时代背景下,各机构之间共享数据困难,主要是因为数据的校验、保存和同步一直是一个难点。各个利益相关方在访问和共享数据时存在严格的限制,这一过程需要花费大量的资源和时间用在权限审查和数据校验。究其本质,是对数据产权难以界定而引发的问题。本文提出使用基于区块链的数据共享模型,具有去中心化、安全可信、集体维护、不可篡改等特点,适用于解决各机构数据共享的难题。从此,区块链有可能打开数据(信息)产权的新时代!

数据的所有权

提出数据的所有权这个问题,主要是基于大数据的发展。我们看到,大数据产业发展给民生带来了便利,推动了社会的治理和进步。然而,在区块链之前要享受这些便利难免需要牺牲一部分初始所有权人的权利,包括隐私权。

2018年3月26日,在中国高层发展论坛上,李彦宏称:“将各个数据来源放在一起,它的威力和能力将会呈现指数级上升,与此同时我们也非常重视隐私问题,以及包括数据的保护问题。在过去几年当中,中国也越来越认识到这个问题,也一直在加强相关的法律法规的建设。在这一个过程当中,我想中国人会更加开放,或者说对于这个隐私问题还没有那么敏感。如果让他们选择用隐私交换便捷性或者效率的话,在很多情况下,他们是愿意这么做的。对于我们来说,当然要遵循一系列的原则,就是说如果我们认为用这一个数据会让所有人受益,而且他也愿意让你使用这一个数据的话,我们会使用的。”

甚至有人提出这样的谬论:当前大数据行业正处于高速发展阶段,应以保护大数据产业发展为优先价值,兼顾初始所有权人的权利,只有这样才能赢得大数据产业的国际竞争。

公地悲剧

1968年,哈定在《科学》杂志上发表了一篇题为《公地的悲剧》的文章。文章写到:英国曾经有这样一种土地制度——封建主在自己的领地中划出一片尚未耕种的土地作为牧场(称为“公地”),无偿向牧民开放。而作为理性人,每个牧羊者都希望自己的收益最大化。在公共草地上,每增加一只羊会有两种结果:一是获得增加一只羊的收入;二是加重草地的负担,并有可能使草地过度地放牧。经过思考,牧羊者决定不顾草地的承受能力而增加羊群数量。结果是因羊只的增加而收益增多。看到有利可图。许多牧羊者也纷纷加入这一行列。由于羊群的进入不受限制,所以牧场被过度地使用,草地状况迅速恶化,公地牧场最终因“超载”而成为不毛之地,最终导致牧民的牛羊全部饿死。

“公地悲剧”说明产权不明,使得企业和个人使用资源的直接成本小于社会所需付出的成本,从而使资源被过度地使用。科斯定理证明,一旦产权明确,而各利益相关者之间的联络、谈判、签约等的成本足够低,则无论将产权划归给谁,最终总能达到该资源的最优配置和使用。因此,尽可能地将数据的所有权明晰,并配备完善的交易市场及健全的法律法规,明确责任和义务,则能够避免“公地悲剧”在数据领域的重演。

其中,数据所有权的内涵就是拥有对相关数据的支配、处置和获益等财产的权力。这些权力具体的表现为:同意权、知情权、异议权、纠错权和司法救济权。真正做到谁的数据谁作主,通过严格的执法和行业自律,确保大数据在产权清晰、权力保障有效的框架下,发挥更大的价值,大数据才会拥有健康发展的未来。

明晰产权是建立数据流通规则和秩序的前提条件。在区块链之前,没有很好的解决方案,直到区块链出现后,对明晰数据产权有了新的工具,推动了数据的大发展。

基于区块链的数据共享模型破解数据(信息)产权困局

数据同样拥有产权属性,区块链则能让数据变成一种资产甚至一种产权。基于区块链,数据的所有权回归到数据生产者身上。在这样的条件下,每个人都可以决定第三方是否能够读取、使用自己的数据,人们也可以围绕数字资产创造财产,变现数据资产,而不是无偿地贡献给第三方平台。

产权区块链可以扩展于所有类型的资产,如果数据可以作为一种产权,这样会极大地激励人们解锁更多的数据,从而真正开启信息革命的大门。综合现有的研究成果,创新地提出并设计了基于区块链的数据共享模型。具体分下面两步实现:

数据上链,即数据确权

在数据块中存储的每条数据不能大于100KB,在用户不愿对数据加密且数据量很小的情况下, 数据摘要部分可以存储数据原文,数据类型可能是一个链接、一段文本、一个小图片或者一小段视频等。当用户希望数据加密或数据文件很大时,解决方案是一边计算数据摘要并将其存储在数据块中,一边将文件加密存储在分布式数据库系统中。

这样做使得数据块中的数据摘要不仅可以对数据进行完整性校验,同时可以作为在数据库中查找数据的索引。其具体步骤如下:

首先,用户提记录请求, 并提交公钥作为标识。

其次,某代表节点接受请求,并广播。

其三,代表节点根据用户公钥将记录添加入数据块。

最后,每隔10分钟将所有新生成的数据块的merkle根锚定到比特币区块链。

数据共享与访问控制

数据所有者将数据加密存储在分布式数据库中,模型采用密码学中代理重加密(Proxy re-encryption)机制来实现对数据的访问控制和共享。因为模型基于区块链技术是一个去中心化的应用场景,没有可信的第三方也就不存在传统重加密场景中的唯一的代理角色。系统中的任何节点都可以充当代理完成重加密的操作,作为报酬可以获得相应的Token。

代理重加密技术实质上是一种用于密文之间的密钥转换机制。在代理重加密系统中,代理者在获得由授权人产生的针对被授权人的转换钥(即代理重加密密钥)后,能够将原本加密给授权人的密文转换为针对被授权人的密文,然后被授权人只需利用自己的私钥就可以解密该转换后的密文。代理重加密能够确保,虽然代理者拥有转换钥,但其无法获取关于密文中对应明文的任何信息。从而实现了授权人和被授权人之间的数据安全共享。

由于使用代理重新加密,未加密的对称密钥(能够解密私有数据)绝不会暴露在服务器端,即使被攻破,黑客也只能得到重新加密的密钥,并且对文件的访问仍然受到保护。

结束语

随着区块链技术的快速发展,这一新兴技术会逐步成为热点研究课题, 本文提出的数据共享模型有助于现有机构的数据中心进行转型,以满足越来越多的数据安全存储、共享等需求。相信数据产权也能够创造更多的机会,产权区块链可以扩展用于所有类型的资产,这也将是第三次革命的到来。