万字说透Web 3为什么可以解决数据使用中存在的难题( 六 )


但实际上 , 如果这个人是一个恐怖分子 , 他选择不公布的数据中藏有能够找到他的信息怎么办?有人说 , 那就让政府启用啊!问题来了 , 在启用前政府不知道恐怖分子是谁 , 为了知道是谁只能全面启用 , 这又会波及到其他无辜的用户(隐私泄露了);同时 , 该恐怖分子作恶会对其他人产生负外部性 。 如何处理这些外部性?
隐私如同文学作品 , 不同人对其的理解可能是千人千面的 。 我觉得露脖子不算什么 , 可能有的人会非常反感 。 这导致如果推行一个通用型的标准 , 总会有部分人的“隐私”被侵犯 。 如此通用型标准只能够越宽泛越好 , 但如果过于宽泛 , 也不能称之为“标准”了 。
2、数据外部性与产权确立
谈及数据的外部性 , 必先介绍两个概念:非竞争性与非排他性 。 这两个概念是用来规定公共品的 , 而外部性就是存在于公共品问题之中 。
**非竞争性指 , 当一个人消费某种产品时 , 不会减少或限制其他人对该产品的消费 。 **通常来说 , 这意味着零/低边际成本(所以互联网产品通常具有非竞争性) 。 我们所见到的绝大部分数据 , 都是可以被重复使用的 , 不会因为用过一次而自焚或者改变内容 。 与之不同的是 , 大学入学名额 , 我挤进了分数线就一定有一个人被挤下去 , 所以高考就是“竞争性”的 。
**非排他性指 , 当一个人在消费某种产品时 , 无法排除其他人也消费这一产品(或者排除的成本很高) 。 **什么意思呢?举个例子 , 你去鱼塘钓鱼 , 不能不让别人钓(除非这鱼塘是你家的);或者你半夜去轧马路 , 看到另一个轧马路的 , 但你不能打他 , 除非给他很多钱请他离开 , 但如果他走了又有一个人过来轧马路 , 你还是不能打他 , 因为马路大家都有份 。
满足非竞争性与非排他性的就是公共品 。 公共品问题中存在一个著名的博弈:“公地悲剧” , 意思是每个人都想尽可能多地利用公共资源谋私利 , 最终导致公共资源难以承受而崩溃 。 这是因为每个人对公共资源的使用都会对其他人产生一个“负外部性” 。 我们知道 , 在互联网中 , 外部性是正的 。 这源于信息生产的零边际成本 , 而公共资源显然不具有这个优势 。
无论外部性是正还是负 , 外部性的存在意味着产权不够明晰 。 而市场是无法为产权不够明晰的商品做出合理定价的 。 如何看待数据的外部性?
首先我们需要就非竞争性与非排他性的概念给数据进行分类 。 对于非竞争且非排他的数据而言 , 显然应该由政府/公共组织提供 , 收益归其所有 。 比如天气预报、宏观经济数据 。 这类公共数据有一个特点:他们都与个体毫无瓜葛 。 这是最为清晰明了的一种 。
对于竞争性/排他性数据 , 由于在生产过程中无法明确分离权利主体 , 导致无法分离出数据中的公共内容与私人内容 。 例如某公司想通过X市一个普通人的生活数据来寻找X市的投资机会 , X市总共有10万人愿意提供这类数据 , 但该公司只需要1万条 。 这类数据就具有外部性 , 因为它们的一部分内容是共享的 , 任意一条数据被采用都会使得其他数据受到“负外部性”影响而贬值 。
又例如 , 我的听歌数据 , 除了我自己知道 , 记录该数据的软件也一定知道 , 因为我使用这个软件听歌 。 除去我的行为部分 , 其余的部分本质上来说由软件生产 , 难道这就意味着软件也拥有我的听歌数据的部分产权?
人做任何行为 , 最终一定是要与外部世界交互的;无论这种交互是物理性的 , 还是通过生活状态表现出来的 。 这使得交互对象通常存在于你的数据里 , 无论他是物体还是人 。 既然外部性似乎不可避免 , 我们又如何去为数据确立明晰的产权呢?