概述
IPFS-InterPlanetaryFileSystem星际文件系统,是一个点对点的分布式文件存储系统,IPFS的愿景是构建一个全世界的分布式网络,用来替代传统中心化的服务器模式,所有的IPFS节点组成一个分布式网络,每个节点都可以存储文件,用户可以从IPFS构建的网络中以DHT(DistributedHashTable,分布式哈希表)的方式获取文件,从而实现了新一代的完全去中心化的网络,旨在取代现有的万维网。IPFS功能很丰富,包括DHT组网,文件存储,Bitswap文件交换等功能。本文主要介绍IPFS的文件存储原理,文件上传到IPFS节点存储时,节点会将文件分块后进行存储,每个文件以MerkleDAG的格式组织,而MerkleDAG的根哈希则用来表示该文件。本文将对IPFS存储进行详解,所述的IPFS的版本为v0.6.0。
CID
在介绍IPFS存储文件的远离之前,先介绍一个重要的标识——CID,CID是IPFS中用来表示内容的标识,可以用来表示一个文件,也可以用来表示一个文件块。如下所示,CID是一个字符串,它主要由Version、Codec和Multihash三部分构成,Version目前分为v0和v1版本,v0版本的CID可以由V0Builder生成,v0版本的CID以Qm字符串开头,v1版本的CID可以由V1Builder生成,v1版本的CID主要包含三个部分Codec,MhType和MhLength,其中Codec是表示内容的编码类型,例如DagProtobuf,DagCBOR等,MhType是哈希算法,例如SHA2_256(默认的哈希算法),SHA2_512,SHA3_256,SHA3_512等等,MhLength是生成哈希的长度,默认用-1表示根据哈希算法确定长度。
深度科技风投First Star第三支基金拟募资4000万美元,将专注于区块链、AI等领域:9月17日消息,根据美国证券交易委员会披露文件显示,深度科技风投First Star旗下第三支基金计划募资4000万美元,以支持区块链、人工智能、机器学习和机器人等领域的早期阶段初创公司,目前该公司尚未披露新基金募资结束时间。
另据PitchBook数据显示,First Star在2014年推出的首支基金曾成功募资1000万美元,随后又在2019年推出了第二支基金,该基金募资规模达到2500万美元。(雅虎财经)[2022/9/17 7:02:59]
IPFS组件介绍
IPFS用IpfsNode表示IPFS的节点,存储相关组件的如下所示:
这些组件的关系如下图所示,最上层是DAGService,它组合了BlockService组件,而BlockService组合了GCBlockstore组件,然后GCBlockstroe包含BaseBlocks和GCLocker两个组件,最后BaseBlocks组合了最原始的blockstore组件。
佟扬:金色财经、节点咨询、IPFS100.com三剑客达成深度合作:2020年6月22日,由金色财经主办,节点咨询、IPFS100.com承办,星际特工、麦客存储联合主办的“星际漫游指南——IPFS技术与应用研讨论坛”在深圳拉开帷幕。论坛上金色财经VP、CapitalIN CEO佟扬,在开场致辞中指出,金色财经自创立之初就始终深耕区块链行业,节点咨询是以助力区块链行业实现良性循环、打通产业上下游为己任的咨询公关公司,专注于IPFS垂直领域的生态平台——IPFS100.com横空出世。目前金色财经、节点咨询、IPFS100.com三大超重量级平台已经达成深度战略合作,充分实现资源共享、双赢共生。这一场由区块链技术三剑客倾力打造的盛会将为行业带来全新的思考方向,让大家窥视IPFS技术发展先机,嗅探投资动向、看清技术前沿。[2020/6/22]
接下来分别介绍这些组件的功能:
Pinning:固定CID的管理器,主要负责将文件或者文件块的CID固定,固定CID的块不会被GC掉。上传的文件最后的文件的CID都会被固定住,防止被GC。
安徽省委书记李锦斌:推动区块链和实体经济深度融合:6月13日上午,安徽省委书记李锦斌赴科大讯飞公司调研并主持召开加快新一代人工智能产业发展与推进中国声谷建设座谈会。李锦斌强调,围绕产业链部署创新链、围绕创新链布局产业链,推动互联网、大数据、区块链、人工智能和实体经济深度融合,积极构建具有优势特色的平台基地,加快构建“龙头带动+园区集聚+技术支撑+政策保障”人工智能产业发展格局,拉动内需、开拓市场,培育壮大具有国际竞争力的人工智能企业和产业集群,引领创新型现代产业体系建设,奋力推动安徽经济高质量发展。(安徽日报)[2020/6/14]
Blockstore:GCBlockstore类型,组合Blockstore和GCLocker两个组件。
BaseBlocks:原始的blockstore,提供了对Block的Get/Put/Has/DeleteBlock等操作。
GCLocker:用来锁住blockstore,保护blockstore防止被GC影响。
声音 | 何宝宏:区块链与人工智能等深度融合将组成数字社会新型基础:金色财经报道,中国信通院云计算与大数据研究所所长何宝宏表示,2020年国内区块链将掀起新一轮技术热潮。区块链的应用领域还有待技术完善,仍存在扩展性较差等问题,大规模应用还很缺乏。何宝宏认为,未来,随着区块链技术、应用、治理不断完善,将为承载数字资产和价值流互连做好准备,成为未来信息基础设施重要组成部分。区块链与人工智能、物联网等技术深度融合,将共同组成泛在、信任的数字社会新型基础。[2019/12/31]
Blocks:提供Block的服务,组合Blockstore组件,提供了GetBlock/GetBlocks、AddBlock/AddBlocks、DeleteBlock等操作。
DAG:IPFS的默克尔DAG的服务,组合BlockService组件,提供Get/GetMany,Add/AddMany,Remove/RemoveMany等操作。
动态 | 人民数据与坤腾畅联将以区块链等技术为支撑在多方面展开深度合作:据人民网报道,人民数据管理有限公司与北京坤腾畅联科技有限公司在北京人民日报新媒体大楼正式签署“人民政务”项目合作协议。双方将以人工智能、大数据、云计算、区块链、物联网等现代信息技术为支撑,在税务的智慧分析、产业经济分析、智慧政务、智慧民生、智慧产业、财政绩效等多个方面展开深度合作,致力于做好各级党政机关、央国企、民企等大数据的“存、管、用”相关工作,并共同打造安全、高效、开放、共享的数字政府的政务服务平台。[2019/4/27]
文件存储流程
文件上传时将文件添加到IPFS的仓库中,上传的流程可以如下图所示,生成默克尔DAG的结构,生成的结构有两种Layout:balanced和trickle的。这里介绍默认的balanced结构,首先生成root作为根节点,然后将文件分割,默认按照256KB大小读取一个chunk,生成叶子节点,依次生成node1,node2,root节点会有Link指向挂在root节点的叶子节点node1和node2。root节点下面能够Link的叶子节点数量是有限的,IPFS中默认设置的是174个。
如下图所示,超过174个后则会新创建一个newroot节点,并Link到oldroot,新的chunk作为node3被newroot直接Link。
当继续有新的chunk添加时,则会生成node34作为node3和node4的父节点,node34含有两个Link分别链接到node3和node4。
IPFS在init的时候会生成.ipfs目录,如下图所示,其中blocks则为文件块存储的目录,datastore为leveldb数据库,其中存储了文件系统的根哈希等,存储相关的配置关联在.ipfs目录下面的config文件。
经过上面的步骤,文件已经切块并转化成MerkleDAG的结构,接下来详细介绍每个块是如何进行存储的流程。
如下图所示,一个Block存储时,首先由dagService调用Add进行添加;之后由blockService调用AddBlock添加该Block;再调用arccache的Put,arccache是对存储的Block做arc策略的缓存;再之后由VerifBS调用Put进行存储,VerifyBS主要对CID的合法性进行校验,合法则进行Put;接着blockstore调用Put进行存储,Put函数中会对CID进行转化,调用dshelp的CidToDsKey方法将CID转化成存储的Key;再接着调用keytransform.Datastore的Put,Put函数中会将前缀拼上,这时Key加上了前缀/blocks;然后调用measure的Put函数,measure是对mount的封装;之后调用mount的Put函数,mount和IPFS的config配置文件中结构对应,根据key去查找对应的datastore,由于前缀是/blocks则可以找到对应的measure;调用该measure的Put函数;最后调用flatfs的Put函数,由Put函数调用doPut最终调用encode函数将完整的block写入的目录指定为/home/test/.ipfs/blocks/WD,其中WD来自于blocks/CIQFSQATUBIEIFDECKTNGHOKPOEE7WUPM5NNNSJCCDROMM6YHEKTWDY中的倒数第三第二个字符。这样该Block则写入了该目录下面的文件中。
总结
IPFS文件存储格式为默克尔DAG格式,每一层Links大小为174个,超过了则会重新调整。文件存储过程中有多个Datastore进行了组合和封装,每个Datastore功能比较单一,例如arccache只做Block的缓存,VerifBS只做CID的校验,这样做的好处是每个组件功能明确,不好的地方在于组合太多,调用深度太深,加上内部都是用interface,好几个组件都实现了该interface,不便于阅读。
IPFS的存储模式面向互联网用户而设计,因为它的开放性,允许所有节点随意接入,已接入IPFS网络的节点可以自由查找内容,不适合直接用来作为企业的文件存储服务。但其分布式存储的特点,很容易进行存储的动态扩容,可以通过结合节点认证机制和DHT查找内容的剥离,为企业的分布式存储系统,另外配合区块链技术,通过链上链下协同技术,很容易地解决链上存储容量不足的问题。
了解IPFS和Filecoin资讯,参与Filecoin挖矿,可联系IPFS研习社,微信号:XF2020IPFS
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。