技术 | IPFS网络是如何组建的?_ZRX:CZRX币

回顾

IPFS-InterPlanetaryFileSystem星际文件系统,是一个点对点的分布式文件存储系统,IPFS的愿景是构建一个全世界的分布式网络,用来替代传统中心化的服务器模式,所有的IPFS节点组成一个分布式网络,每个节点都可以存储文件,用户可以从IPFS构建的网络中以DHT(DistributedHashTable,分布式哈希表)?的方式获取文件,从而实现了新一代的完全去中心化的网络,旨在取代现有的万维网。IPFS功能很丰富,如DHT组网,文件存储,Bitswap文件交换等功能。

文件存储和文件交换的技术详解可以通过之前的推文内容进行了解,今天我们来了解这个文件系统的“地基”——网络模块。

IPFS网络初识

IPFS是一个开源项目,要达到它声称的构建一个全世界的分布式网络的目标,那么他必然要先解决不同国家、不同地区节点的连接问题。

声音 | 央视网:谁掌握了区块链技术 谁就掌握了财富:11月11日,央视网发布关于《争相布局的“区块链”到底能做什么?》的视频。视频开头将扎克伯格为Libra辩护作为切入点,并指出:1.全球巨头争相布局区块链,加速应用时代的到来,而数字货币是区块链发挥作用的进行价值传输的工具。目前投资人参与区块链的主要方式是数字货币交易;2.将来数字货币会借助一个新的支付工具,不需要再依靠第三方银行账户,只要支付工具里有钱,就可以直接转账使用,并且安全不可篡改;3.比特币就是区块链的一种呈现方式,也是一种应用;4.区块链还有存储、商品来源可追溯特性、追溯版权等特性。5.区块链技术一旦成熟并投入使用,就不可能被任何其他人或单一实体妥协、破坏或者改变。它将是一种金融解决方案,并且谁掌握了区块链技术谁就掌握了财富。[2019/11/12]

首先,看一下IPFS网络部分配置,如下图所示,红框内部的Swarm是IPFS监听的网络地址,其中支持ipv4和ipv6协议,且默认支持QUIC协议。

动态 | 中欧班列首次落地应用区块链技术 首个国际班列“新账本”诞生:据封面新闻消息,10月17日,中欧班列(德国巴伐利亚至中国四川)整列41张“统一运单”信息进入中国铁路成都局集团“一单制”区块链平台,标志着集团公司首次在亚欧大陆国际铁路联运(中欧班列)试点应用区块链技术。今年8月30日,集团公司发挥自身数据资源及信息化建设优势,自主研发“一单制”区块链平台系统上线试运行,签发全国首张区块链铁路运单。10月17日,该平台新增“国际联运”模块,生成全国首个中欧班列区块链运单数据。[2019/10/21]

*QUIC协议是由google最先提出的,目前已经提交给互联网工程任务小组,成为了正式的网络规范,相对于TCP来说QUIC网络传输协议的传输速度更快。

IPFS节点启动之后日志如下图所示,可以看到IPFS节点监听了以下网络地址,其中包括本地的、局域网、广域网的地址,最后还有/p2p-circuit地址。

动态 | 印度政府看好人工智能、区块链等新兴技术 科技巨头为政府工作人员提供技能培训:随着印度政府看好人工智能、云计算、区块链和数据分析等新兴技术,其未来的艰巨任务是培训数百万政府官员,以便优化这些颠覆性技术造福超过10亿人。除了在新兴技术领域培养熟练的学生、年轻程序员和企业家,科技巨头现在有责任培训政府系统的人才,特别是在信息技术部门。零售业巨头亚马逊AWS全球公共部门(APAC和日本)区域董事总经理Peter Moore表示,已经成功地与政府高层领导人就此议题进行会谈,因为AWS已经在培养学生技能和提升该国劳动力技能方面发挥了领导作用。

微软印度公司上个月宣布了“数字治理技术之旅”项目,旨在让政府信息技术官员掌握人工智能和智能云计算等技术。微软将组织一系列物理和虚拟研讨会,在12个月内培训5000名政府IT人员。(Hindustan Times)[2019/9/29]

动态 | 360“安全大脑”结合区块链等新兴技术 获财经中国创新研发奖:据中新经纬消息,由中国新闻社旗下财经媒体中新经纬、中国产业发展促进会联合主办的“财经中国2019V峰会?致敬创新”16日在北京举行。会上,360“安全大脑”获得财经中国2019创新研发奖。据了解,“安全大脑”是一个分布式智能网络安全防御系统,它综合利用了人工智能、大数据、云计算、 IoT智能感知、区块链等新技术,保护国家、国防、关键基础设施、社会、城市及个人的网络安全。“安全大脑”由360集团董事长兼 CEO周鸿祎在2018年5月召开的第二届世界智能大会上首次提出,并在同月正式发布。[2019/1/17]

问题来了,为什么需要监听这么多地址?

那是因为IPFS是一个开源项目,为了让全世界各地的节点连接起来则必须要解决各种网络情况下节点连接的问题。

监听本地地址,这样本地启动多个IPFS节点,它们之间可以以该地址进行连接,监听局域网地址,这样内网内启动多个IPFS节点,它们之间可以以该局域网地址相互连接,监听广域网地址,这样公网中启动多个IPFS节点,它们之间可以以该广域网地址进行连接。

动态 | 研究报告:P2P保险采用区块链技术 保单持有人具备管理所有保险的职能:Researchandmarkets在最新公布的《2018年全球P2P保险行业研究报告》中指出,最近出现了使用区块链技术和自治模式的新一轮P2P保险。在自治模式下,社区内的保单持有人具备集体管理所有保险的职能,例如制定政策规则、接受新成员以及制定和批准索赔以及支付报销。[2018/9/7]

通过上述方式就解决了大部分网络情况下的IPFS节点的网络连接问题:

2个节点都在同一主机:通过127.0.0.1地址连接

2个节点在同一个内网内:通过局域网地址连接

2个节点都有公网地址:通过公网地址连接

1个节点在内网,1个节点在公网:内网的节点通过在公网节点的公网地址连接

这里有一个问题,如果2个节点处于两个不同内网环境,由于存在NAT设备,NAT设备可能是对称型,对称型的NAT设备是没有办法穿透的,所以IPFS提供了relay的方式解决不同内网环境下节点的连接问题,上面提到的监听/p2p-circuit地址则是为了解决该问题,对于2个处于不同内网环境不能直接连接的节点,通过配置relay节点中转从而建立连接。

至此,IPFS解决了不同网络环境下的节点之间建立连接的问题,下面我们来看一下IPFS是如何构建大规模的分布式节点网络,将处于全世界的不同地区的各个节点连接起来的。

IPFS网络构建

IPFS网络构建的过程可以看作是两个阶段:

▲?Bootstrap阶段

IPFS节点在启动之前需要配置它的Bootstrap节点,配置文件中相关配置如下图所示,Bootstrap配置中配置了IPFS节点启动时需要连接的所有种子节点列表,这些节点地址列表信息是默认的,如果需要搭建IPFS私有网络可以修改成自己的种子节点列表。默认提供的种子节点都是具有公网地址的节点,IPFS节点启动的时候首先连接该种子节点,后续通过该种子节点去发现IPFS网络中更多的节点,从而进行连接,也就是DHT组网阶段。

▲?DHT组网阶段

IPFS节点连接种子节点成功以后则去通过DHT去发现其他节点,关于DHT的详解可以看这篇文章《Libp2p中DHT和Bitswap详解》。

发现其他节点之后则尝试进行连接,连接成功的节点会加入到该节点的节点列表,以便后续可以直接与该节点通信,考虑到全世界的IPFS节点规模很大,不可能每个节点和其他节点保持长连接,所以对每个节点的连接数量做了限制,一般节点连接数量都在1千以下,对于没有连接的节点需要通信的话,可以通过DHT找到该节点地址,然后连接该节点进行通信,这样就构成了大规模的分布式节点网络。

我们可以通过一个示例展示上述过程。下图是一个常见的网络拓扑架构,有三个网络分别连接了Internet,IPFSnode1部署在具有公网ip的服务器上,外部可以直接访问该节点,IPFSnode2和IPFSnode3都部署在对称型NAT设备后面,外部不能访问该节点。

在上面的网络架构下,处于公网的IPFSnode1作为种子节点,种子节点最先启动,然后IPFSnode2,node3,node4,node5的种子节点配置成IPFSnode1,分别启动后首先连接IPFSnode1,连接成功后通过DHT发现其他节点最后分别连接,对于IPFSnode1,它连接的节点地址列表如下图所示,由于IPFSnode2,node3,node4,node5均处于NAT设备后面,所以IPFSnode1节点列表中这些节点的端口都是NAT设备映射后的端口。

对于IPFSnode3来说,它的节点地址列表中,IPFSnode1的地址是公网地址,由于IPFSnode3和IPFSnode2都处于NAT设备后面,不能直接连接,所以IPFSnode2的地址是relay地址,IPFSnode1节点作为relay节点,IPFSnode3给IPFSnode2发消息时通过IPFSnode1转发,relay地址格式为:

Relay节点的地址/p2p-circuit/p2p/目标节点id

而IPFSnode3的节点地址列表中,IPFSnode4和IPFSnode5的地址均为局域网地址,这样就完成了公网节点、处于NAT设备后的局域网节点的组网过程。

总结

以上就是IPFS网络的组建过程,为了方便描述只是以几个IPFS节点为例。

实际上IPFS的这种网络组建方式也能很好地支持超大规模节点的组网,当节点规模很大的时候,设置数十个节点作为种子节点,通过DHT组网就能完成数万甚至更多节点的组网,此时每个节点的长连接数量保持在数百个,后续节点间通信时,如果还没有建立连接,可以通过DHT根据节点id查询该节点的地址信息,然后通过该地址连接该节点最后完成通信过程。

IPFS网络的这种组建方式也非常值得分布式系统学习和借鉴。

作者简介

姚文豪来自数据网格实验室BitXMesh团队数据平台架构师

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金智博客

[0:15ms0-7:454ms