经过激励协做实现语义 Web 的弱中心化

本文由 SoLiD 中文社区 翻译自: ruben.verborgh.org/articles/in…

我的隐私数据正在以一种史无前例的规模被大量使用,由此引起了 Facebook + Equifax、Google Plus 等大公司的隐私丑闻事件。去中心化只是个乌托邦,咱们不谈去中心化,只谈弱中心化。我的数据的弱中心化可让普通人控制他们的数据(尤为是网络数据),语义网技术可让数据集成变的更快。可是,对于弱中心化的数据处理须要更复杂的算法,由此须要更强大的算力。因为不是中心化的数据处理中心,各个数据节点的处理能力更低(你是否想到了边缘计算?)。本文介绍了一个愿景,使用分布式帐本进行数据处理协做,并激励网络中的各节点。经过利用全部节点的集体处理能力,咱们能够寻求除了当前「集中式计算机房」外另外的替代方案,令人们可以在不影响功能的状况下从新得到数据的全部权。web

经过弱中心化我的数据的存储来从新得到数据的控制权

在过去的几年里,咱们目击了网络上我的数据史无前例的集中化。不管你赞成与否,大型社交媒体都在收集咱们的信息,并在其强大的数据处理中心存储和分发这些信息。人们为了获取更好的服务,不得不将数据共享给软件服务商。例如,在 Facebook 上,包含家庭成员的相册会上传进去。Equifax 和 Facebook 的严重隐私丑闻让咱们看到了将大量数据集中在一处可能产生的风险。而从新得到对数据的控制权是万维网发明人 Tim Berners-Lee 在 2017 年制定的三个主要挑战中的两个。算法

让人们从新控制数据的方式是容许数据存储在他们想存储的任何地方,而这和他们想要使用的应用程序无关。这是 SoLiD 等计划背后的核心思想:数据是分散的,是弱中心化的,每一个人均可以将数据存储在本身的空间中,而且应用程序与数据分离,由于使用 A 应用程序建立的资源能够被 B 应用程序读取和修改。缓存

应用程序无权要求全部权,而是从分散的数据中心查询数据

上图是一个示例,能够看到社交应用的数据源是由其余应用程序建立的图片或者会议事件。此外,经过从多个存储位置查询数据来构建社交推送,而无需事先集中收集数据,也是 SoLiD 的一个核心亮点。这样,人们就能够自由选择他们的存储提供商和他们的应用程序提供商,并能够随意转移他们的数据。他们可让应用程序,其余人或公司在他们认为合适的时候访问其数据的特定部分,并在任何给定的时间点撤销或限制该权限。这能够实现真早的数据全部权和彻底控制。安全

因为这种方式须要处理相同的数据,因此须要一份标准协议,这能够经过 RDF、SPARQL 等语义网技术实现。开发者能够经过选择被普遍承认的本体来表示数据,每一个人均可以自由选择他们的本体,而且因为语义学的存在,推理能够弥合本体间的差别。换句话说,关联数据(Linked Data)的弱中心化特质和 RDFS 、OWL 的不协调性质很是适合 SoLiD 的目标。服务器

弱中心化的性能问题

与集中式计算中心相比,弱中心化的系统面临着两个问题:网络

  1. 单个节点不只要解决更难的问题,所拥有的资源也更少;
  2. 因为分布式,弱中心化数据处理比集中式数据处理须要更多的计算能力和网络带宽;

此外,如今不少数据处理算法尚未为弱中心化的数据处理作好准备。咱们举一个简单但实际的例子,构建具备 500 个朋友的社交网络推送,在最坏状况下须要执行对 500 个不一样数据源的查询,其中每一个人朋友将他们的数据存储在不一样的位置。最早进的 SPARQL 查询引擎只须要查询十几回。相比之下,弱中心化的数据存储将须要联合查询数百个小型数据集。数据源的选择策略对于性能相当重要。架构

最后,经过查询连接暴露我的数据存储带来了安全问题上的挑战。联合 SPARQL 查询一般在私有网络中进行测试。在公共 Web 上,SPARQL EndPoint 长期以来一直受到可用性问题的影响,不管是技术缘由仍是管理缘由,这些问题至少能够经过我的数据的掌控权表现出不可忽视的风险。当数据在愈来愈多的节点上传播后,咱们可能遇到严重的带宽使用问题和查询速度降低问题。分布式

经过多方协做最大化性能

若中心化网络具备特定资产:即便单个节点与大规模服务器集群相比资源有限,但整体而言,这些节点具备更大的计算能力和带宽。每一个单独的我的数据存储以及每一个客户端(计算机、智能手机、平板电脑)都会使用本身的 CPU - 这些 CPU 在集中式环境中一般未获得充分利用。若是咱们找到可让这些节点协做的方法,咱们就能够解决弱中心化网络中的资源问题。若是咱们采起优化措施,例如在最接近数据的节点上执行计算工做(也就是所谓的「边缘计算」),咱们就能够抵消因为弱中心而产生的算法复杂度提高。ide

咱们能够把这种理念应用于应用程序的数据收集阶段,在弱中心化网络中,这至关于联合查询(从不一样的数据存储中心上查询)。社交媒体一般包含重叠的人群,所以任何人均可能成为其余人的联系人。因此,咱们能够达成一个共识,也就是,若是你帮助我执行了个人查询,我也能够帮助你执行你的查询。而后,咱们就能够将更大的子查询并行的委托给 10 个或 20 个节点,而不是将子查询发送到例如 500 个节点。所以,咱们不是在服务器或客户端彻底执行数据收集,而是经过网络动态地从新分配查询执行。性能

经过分布式帐本提供激励和信任

为了实现可持续的协做,须要激励节点充当网络的贡献者。不然,节点没法肯定,若是它在空闲时帮助其余节点,则其余节点须要记录此节点的优先级。可是,当建立激励时,节点可能会产生不诚信问题,所以咱们须要一种信任机制来验证工做是否正确完成。因为在弱中心化网络中不存在集中式的实体,咱们须要一种弱中心化的共识来创建这种激励和信任。这能够经过分布式帐原本实现,它能够跟踪所执行的工做,从而得到其余人的帮助。

一类分布式帐本是区块链,须要证实才能在帐本中添加内容。比特币是以无心义计算而闻名,但较新类型的区块链项目(好比 Filecoin)为此引入了更有意义的计算。使用 Filecoin,人们能够向其余人安全的存储和检索他们的数据,而且复制证实和时空证实会确认数据始终存在。咱们一样须要开发一个查询证实结果,它既能够捕获所执行的工做,也能够捕获结果的正确性。

下面这张图显示了网络中单个节点的架构体系。当一个查询到达时,该节点肯定它愿意接受的激励和愿意为其余人支付的激励。在可能委派了一些工做并自行执行完成以后,它会保留数据的出处并生成结果的正确性证实。整个交易在区块链上注册,以便全部参与者都能得到奖励。某些节点可能会提早计算常见查询的部分结果,或者缓存常见数据以加快查询速度。

网络中的每一个节点都有一个查询处理器,能够本身执行查询或把部分委托给其余人。激励模型会捕获所须要的奖励、出处和提供正确性保证。执行任务及其激励措施会记录在区块链上。

预计影响

在目前的弱中心化语义数据网络中,整个想法先于了市场发展。上面的一些示例只是说明了对我的数据查询的委托,还能够将其做为其余服务,好比将数据转换为不一样本体的推理。全部这些应用程序都依赖于客户端 CPU 在大多数时间属于空闲状态的原则,也就是说,当咱们不须要使用 CPU 时将其借给其余人使用,当咱们 CPU 不够用时能够委托其余人帮助咱们计算。

这份提案将对语义网技术的规模化成长产生巨大影响,尤为是在缺少明确业务模型的状况下。它为弱中心化算法开辟了新的方向,并在语义网和「agent」代理理论指南创建了联系,同时还应用了经济模型中的激励措施。固然咱们还要注意隐私等问题,也许咱们能够经过加密来保证安全。最重要的是,这个愿景向大小玩家都勾画出了一个面向 Web 的语义 Web 之路。

参考文献

[1]Berners-Lee, T. (2017), “Three challenges for the Web, according to its inventor”, World Wide Web Foundation, March, available at:webfoundation.org/2017/03/web….

[2]Mansour, E., Sambra, A.V., Hawke, S., Zereba, M., Capadisli, S., Ghanem, A., Aboulnaga, A., et al. (2016), “A Demonstration of the Solid Platform for Social Web Applications”, inCompanion Proceedings of the 25thInternational Conference on World Wide Web, pp.223–226, available at:crosscloud.org/2016/www-ma….

[3]Buil-Aranda, C., Hogan, A., Umbrich, J. and Vandenbussche, P.-Y. (2013), “SPARQLWeb-Querying Infrastructure: Ready for Action?”, inProceedings of the 12thInternational Semantic Web Conference, available at:aran.library.nuigalway.ie/handle/1037….

[4]Verborgh, R., Vander Sande, M., Hartig, O., Van Herwegen, J., De Vocht, L., De Meester, B., Haesendonck, G., et al. (2016), “Triple Pattern Fragments:a Low-cost Knowledge Graph Interface for the Web”,Journal of Web Semantics, Vol.37–38, pp.184–206, available at:linkeddatafragments.org/publication….

[5]Nakamoto, S. (2008), “Bitcoin: APeer-to-Peer Electronic Cash System”, available at:bitcoin.org/bitcoin.pdf.

[6]Filecoin: A Decentralized Storage Network, Whitepaper. (2017), , Protocol Labs, available at:filecoin.io/filecoin.pd….

[7]Grubenmann, T., Dell’Aglio, D., Bernstein, A., Moor, D. and Seuken, S. (2017), “Decentralizing the Semantic Web: Who will pay to realize it?”, inProceedings of the Workshop on Decentralizing the Semantic Web, available at:ceur-ws.org/Vol-1934/co….

相关文章
相关标签/搜索