万字说透Web 3为什么可以解决数据使用中存在的难题( 六 ) 免责声明：本文旨在传递更多

但实际上，如果这个人是一个恐怖分子，他选择不公布的数据中藏有能够找到他的信息怎么办？有人说，那就让政府启用啊！问题来了，在启用前政府不知道恐怖分子是谁，为了知道是谁只能全面启用，这又会波及到其他无辜的用户（隐私泄露了）；同时，该恐怖分子作恶会对其他人产生负外部性。如何处理这些外部性？
隐私如同文学作品，不同人对其的理解可能是千人千面的。我觉得露脖子不算什么，可能有的人会非常反感。这导致如果推行一个通用型的标准，总会有部分人的“隐私”被侵犯。如此通用型标准只能够越宽泛越好，但如果过于宽泛，也不能称之为“标准”了。
2、数据外部性与产权确立
谈及数据的外部性，必先介绍两个概念：非竞争性与非排他性。这两个概念是用来规定公共品的，而外部性就是存在于公共品问题之中。
**非竞争性指，当一个人消费某种产品时，不会减少或限制其他人对该产品的消费。 **通常来说，这意味着零/低边际成本（所以互联网产品通常具有非竞争性）。我们所见到的绝大部分数据，都是可以被重复使用的，不会因为用过一次而自焚或者改变内容。与之不同的是，大学入学名额，我挤进了分数线就一定有一个人被挤下去，所以高考就是“竞争性”的。
**非排他性指，当一个人在消费某种产品时，无法排除其他人也消费这一产品（或者排除的成本很高）。 **什么意思呢？举个例子，你去鱼塘钓鱼，不能不让别人钓（除非这鱼塘是你家的）；或者你半夜去轧马路，看到另一个轧马路的，但你不能打他，除非给他很多钱请他离开，但如果他走了又有一个人过来轧马路，你还是不能打他，因为马路大家都有份。
满足非竞争性与非排他性的就是公共品。公共品问题中存在一个著名的博弈：“公地悲剧” ，意思是每个人都想尽可能多地利用公共资源谋私利，最终导致公共资源难以承受而崩溃。这是因为每个人对公共资源的使用都会对其他人产生一个“负外部性” 。我们知道，在互联网中，外部性是正的。这源于信息生产的零边际成本，而公共资源显然不具有这个优势。
无论外部性是正还是负，外部性的存在意味着产权不够明晰。而市场是无法为产权不够明晰的商品做出合理定价的。如何看待数据的外部性？
首先我们需要就非竞争性与非排他性的概念给数据进行分类。对于非竞争且非排他的数据而言，显然应该由政府/公共组织提供，收益归其所有。比如天气预报、宏观经济数据。这类公共数据有一个特点：他们都与个体毫无瓜葛。这是最为清晰明了的一种。
对于竞争性/排他性数据，由于在生产过程中无法明确分离权利主体，导致无法分离出数据中的公共内容与私人内容。例如某公司想通过X市一个普通人的生活数据来寻找X市的投资机会， X市总共有10万人愿意提供这类数据，但该公司只需要1万条。这类数据就具有外部性，因为它们的一部分内容是共享的，任意一条数据被采用都会使得其他数据受到“负外部性”影响而贬值。
又例如，我的听歌数据，除了我自己知道，记录该数据的软件也一定知道，因为我使用这个软件听歌。除去我的行为部分，其余的部分本质上来说由软件生产，难道这就意味着软件也拥有我的听歌数据的部分产权？
人做任何行为，最终一定是要与外部世界交互的；无论这种交互是物理性的，还是通过生活状态表现出来的。这使得交互对象通常存在于你的数据里，无论他是物体还是人。既然外部性似乎不可避免，我们又如何去为数据确立明晰的产权呢？