分布式存储助力DT时代到来_FILE:LibraFace

数据时代被谈论了好几年了,但到底什么是数据时代,数据时代有哪些特征,没有一个清晰的定义。在此之前,数据时代是将至而未至。真正的数据时代是以数据为中心的时代,数据具有自身的特征和属性,网络为数据服务。有了IPFS,这一切就有了可能。

8月14日,我在深圳的分布式存储大会上做了主题为《分布式存储助力DT时代到来》的主题演讲。其中提到了数据时代的一些特征,和现在能够为数据时代服务的一些技术,这里做一点梳理。

数据爆炸并不意味着进入了数据时代

数据时代数年前被提起,又被放下。被提起是因为大家看到了数据的价值,和数据量的爆发,进行大数据计算,数据挖掘,似乎网络要以数据为中心了。被放下是因为以数据为中心的基础设施还没有建设好,没有一套符合数据保存、流通、价值交换的协议、标准和网络。

七牛云副总裁何军:分布式存储要在可靠性的前提下考虑性能:金色财经现场报道,4月23日,数御未来——2021数据与存储产业峰会在成都举办。在会议现场,七牛云副总裁何军指出,分布式存储系统面临着挑战,如高性能、成本、可靠性往往不能兼得。在可靠性的前提下考虑它最优的性价比,是存储系统考虑的关键点。失去可靠性,任何存储系统的成本、高性能是没有任何意义的。[2021/4/23 20:51:36]

各种应用带来了海量的数据,而且数据量以年符合增长率40%的速度增长,但这并不意味着数据时代已经到来,相反,我们仍然处于网络时代,只是隐隐约约感觉到现今的网络技术似乎有些不适应,以数据为中心的一套体系还没有建立,因此出现大量的数据有关的问题,比如;数据被滥用、用户数据归属不明、App强制授权、隐私信息被不正当使用等等。还有就是个人数据的流转不畅,数据直接变现难度重重。所有这一些,不是互联网协议解决的问题。

1475:分布式存储数据存储量正经历爆发式增长:在第六届区块链全球峰会上,协议实验室创始人Juan Benet演讲表示:数据存储存储量在未来会增长三倍。Filecoin挖矿正在蓬勃发展,目前已有550多名矿工,90多个组织参与Filecoin的开发工作。 此外,Juan Benet还表示,接下来Filecoin会重视为客户提供存储服务。提倡社区接下来寻找存储的客户服务、构建应用程序、考虑长远发展。

IPFS技术龙头1475对此表示:分布式数据存储一直是新时代的一个大课题,在挖矿经济模型刺激下,对于当下数据存储量爆发式增长不意外,需要进一步提升算法与技术的研究,发掘更多实体应用落地方向,应对更多的客户端数据存储订单。[2020/11/3 11:33:02]

数据时代需要数据互联

当前我们还处于互联网时代,简称IT时代。Internet直译过来就是网络互联。这个时代的特点是以网络为中心,协议底层是实现网络互联,时间网络节点之间的自由通信,因此一整套协议建立起来,TCP/IP,HTTP,DNS,TLS,OSPF,BGP等等。在互联网中,每一个节点有一个网络地址,每一份内容的定位是在一个网络节点中的某一个路径之下的内容。在这一套协议的支撑下,我们可以自由地网上交流,但前提是,你要知道你访问的东西在哪里。

声音 | 埃森哲:分布式账簿技术将成为后数字时代变革的催化剂:据腾讯科技报道,埃森哲(Accenture)最近发布了新报告《2019年科技愿景》(Technology Vision 2019)。该报告认定四种科技(缩写为DARQ)将成为后数字时代变革的催化剂,分别为分布式账簿技术(如区块链)、人工智能(AI)、扩展现实(包括虚拟现实和增强现实)以及量子计算。[2019/3/8]

数据时代应该有其自身的特征,数据时代的一整套协议的实现应该以数据的互联为目标,因此我提出一个新词:Interdata。这是在Internet之上的一整套协议,目标是实现数据的定位、流通和交易。数据时代又可以称为Interdata时代。

数据时代的三个特征:

每一份数据都有自己的身份;

数据之间的关系有数据本身来表达;

分布式资本执行董事:2018年区块链不会太热闹,但会让大家冷静下来各做个事:金色财经现场播报 2018“中国区块链第一辩”暨行业领袖峰会上,分布式资本执行董事余文波表示:“我认为2018年是更好的一年,毫无疑问。但是更好怎么去理解?也许不会像2017年那样特别热闹,让无数三点钟人群,四点钟人群出来,实在搞的太晚。不太热闹是好事,太热闹让所有人都浮躁,包括创业者投资人,我不搞到五点钟错过什么,其实哪有这回事,目前的状态有利于大家冷静静下心来各做各的事,做技术德人做技术攻关,投资者更好的理解这个行业。给到监管也有一些相应的时间和空间研究它,去建立一个合适的框架。大家变得更加理智,更加关注一些。”[2018/3/28]

网络支撑数据的自由流通。

而这一切,目前都可以通过IPFS来实现。

每一份数据都有自己的身份

IPFS的协议套件中有一个是Multiformats,用来描述数据或者网络,在描述数据方面,通过hash算法来对数据进行描述,从而实现数据的身份标记。每一个份数据都有自己独一无二的身份,无论数据身居何处。

当数据有了独一无二的身份之后,就可以实现内容寻址。这是一个伟大的思维突破。与互联网时代不同,你不需要知道数据在哪里,只需要告诉网络我要找哪个数据,你就可以得到。

打个比喻,在互联网时代,你要找一个数据,你必须要知道数据在具体哪个网址的哪个路径之下,就好像在远古通信时代,你要找某个人,你要知道他住在哪里,然后直接到他家去找到他。然而数据时代,数据本身有独立的身份标志,你直接利用这个身份标志来向网络检索即可。这就类似于在这个时代你要找某个人,知道电话号码或者微信就可以直接联系了,根本不需要知道他到底现在何处。这是多么大的一个突破。

数据之间的关系由数据本身来表达

数据之间是有关系的,就跟人与人、人与物之间存在关系一样。当数据具有身份之后,这个身份就具有了很多特征。特征之一就是与其他数据之间的关系。不如说我现在有一份数据是一篇论文,那么文章之中可能包含很多引用,或者很多实验结果。在互联网时代或纸质时代的论文中,引用只是一个标记,但是引用的文章到底是什么并不明确,需要根据地址进行查询。而数据时代,或者中IPFS中的数据,可以以IPLD的方式进行存储,其中包含很多关系,这些关系直接利用数据的身份进行链接。因为不再需要进行路径寻址,你可以认为数据之间是相互包含的。这就形成了一个大的语义网络。

有点类似HTML超链接,但是要比HTML强大得多。因为它是自包含的,是内容寻址的,是自验证的。

网络支持数据的自由流通

在毋需路径寻址的情况下,那么用户如何直接通过内容的身份标记直接访问到数据呢?这在IPFS中是Libp2p协议套件支持的。

Libp2p实现了真正的点对点网络,用户之间的链接是完全对等的,不存在服务器客户端的说法,用户之间的链接是自由而且全方位的,一个节点可以链接成百上千个节点来保证可靠行。Libp2p采用分布式哈希表来帮助内容寻址,从而从网络底层实现自由地链接,简单一点,可以理解为现在的移动网络中随时都可以了解你在哪里,从而当有人找你的时候,总是可以通过你的号码直接找到你。不同的是,在数据网络中,同一份数据可能存在很多份,任意一份意义相同。因此Libp2p会根据网络情况选择适合你的地方提取出内容给你。

这里,与IT时代最大的不同,就在于,整套协议都是直接服务于数据,网络只是这一套协议的下面一个服务层。

Filecoin赋能IPFS商业化

IPFS的一整套协议打开了数据时代的大门。但是由于IPFS的开源和免费特性,在应用方面没有激励。要想加快数据时代与商业世界的结合,Filecoin就要登场了。Filecoin的目标是建立一套全球统一、标准化的数据交易市场。

这就有赖于IPFS技术和区块链的结合:

当有了区块链,有了分布式存储,我们就听到了Web3.0的脚步声。

IPFS、Filecoin?交流群

备注ipfs,添加菠萝v号:q359361480

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金智博客

[0:15ms0-4:676ms