沉默数据的唤醒:探讨分布式存储趋势与 Filecoin 商业化路径_STE:UST

原文标题:《原力研究|Filecoin存储革命与生态价值,剑指何方?》

作者:Tony

人工智能现在碰到了一个很大的瓶颈,那就是数据。人工智能发展的前提是要拥有庞大的数据,但是现在的数据拥有者并没有足够的动力去提供这些数据,尤其是极具价值的隐私数据。

——斯坦福大学终身教授、物理学家张首晟

张首晟

回顾《Filecoin存储革命与生态价值,剑指何方?》Filecoin商业落地探索系列文章,我们把Filecoin与传统项目Curve、HDFS、Ceph、GlusterFS展开横向对比,以及与区块链项目Arweave、Crust、Burst、Bluzelle、Storj、Sia进行纵向对比,多维度深度探索了HDFS和Ceph的商业发展路径。

这次我们带着张首晟的疑问继续探索Filecoin的商业落地,本文会对Filecoin与GlusterFS展开对比,然后分析各自落地方向的市场价值。

3)GlusterFS:原生协议的拥趸

动态 | 粤港澳大湾区创新报告发布:深圳在区块链技术等累计PCT国际专利申请方面均为全国第一位:近日,由国务院参事室指导,国务院参事、国务院推进政府职能转变和“放管服”改革协调小组专家组成员王京生领衔的课题组发布了《“大众创业、万众创新”研究(2019)——粤港澳大湾区创新报告》,该报告在国内首次系统提出“创新市场”理论体系,具有很高的学术价值和现实指导意义。2018 年,深圳的5G国内专利公开量163件,在全国各大城市中居第一位,累计专利量476件,超越北京,在全国各大城市中位居第一位。此外,深圳在石墨烯技术、机器人技术、区块链技术等累计 PCT 国际专利申请公开量方面,均为全国各大城市第一位。大量新兴的技术进入市场,促进了新兴行业的繁荣,加快了创新市场的产业结构转换。随着粤港澳大湾区内持续引进高校、实验室、大科学装置等,基础研究创新市场的结构也将从空白或垄断趋于寡头竞争结构,甚至垄断竞争结构,激发了创新市场的活力。(深圳晚报)[2019/12/24]

Gluster

2011年10月4日,红帽斥资1.36亿美元收购Gluster。2014年4月30日,红帽以1.75亿美元的价格收购Ceph企业级产品提供商Inktank。2018年10月28日,IBM以每股190美元收购红帽所有流通股票,总股本约为340亿美元。

德勤新报告:不考虑使用区块链的企业面临落后的风险:据cointelegraph消息,审计和咨询公司德勤发布的一份新报告分析了50多个潜在的区块链使用案例,并指出该新兴技术的“潜在影响”是“巨大的”。根据该报告,区块链将成为“跨金融,制造业和消费行业的标准运营技术”,并表示随着企业开始掌握区块链的潜力,未来五年将成为“转折点” 。该报告强调,企业应评估其战略目标是否有利于区块链投资,并称那些没有考虑区块链可能性的企业“面临落后风险”。[2018/5/29]

GlusterFS是一个开源的分布式文件系统,具有高扩展性、高可用性、高性能、可横向扩展等特点,横向扩展能够支持数PB存储容量以及同时处理数千客户端。GlusterFS也并非完美,在数据存储安全方面还存在一定的不足。

GlusterFS主攻是存储的原生协议,很多云开发服务平台都支持其应用,包括谷歌Kubernetes和红帽OpenShift。GlusterFS主要适用场景有以下三类:

媒体类:文档、图片、音频、视频共享存储:云存储、虚拟化存储、HPC大数据:日志文件、RFID数据

英国智库机构Reform最新报告:建议英国政府使用区块链技术来管理公民身份:

英国智库机构Reform最新报告建议英国政府应该使用区块链技术来管理公民的个人资料。该报告的开头语是:政府应该使用更安全高效的区块链技术管理公民身份。据报道,基于区块链技术的身份管理新系统将使公民掌握自己的个人数据,从根本上改变当前国家与公民之间的关系。[2017/12/14]

根据以上Ceph、HDFS和GlusterFS发展路径的分析,分布式存储最终落地的方向有:云计算设施、数据分析软件和存储原生协议。除此之外,分布式存储还有哪些落地探索?我们先回顾一下分布式存储大事件。

四、分布式存储的趋势发展方向

来源:《2020:下一个十年,存储发展的趋势是什么?》,制作:IPFS原力区,2020-10-27

分布式存储进化论。从2010-2019年分布式存储发展的过程,可以分为三类:分布式块存储、分布式文件存储、分布式对象存储。随着分布式存储的相对市场份额不断增长,两者将处于并存局面。其中,戴尔收购的Compellent、惠普收购的3Par,实现了块级虚拟化,将硬盘和RAID解耦;VMwareVirtualSAN、Nutanix有别于以往的专用存储,将文件系统软件与服务器解耦,都体现了分布式存储征程中的不同阶段。随之而来的是,分布式存储衍生出很多新的落地场景:

1)2024年去中心化计算市场规模:162.3亿美元。去中心化计算作为一种新的计算模式,其通过整合存储、网络、数据、硬件等分布式资源为用户提供强大的计算能力,从根本上实现并行处理、分布式计算与网格计算。其在一定程度上可以弥补中心化计算的高昂成本、计算慢和数据泄露等问题,同时也促进了闲置计算资源的利用。

来源:Technavio,2020-03

根据Technavio最新市场研究报告显示,从2020年至2024年,全球去中心化计算市场预计将增长91.4亿美元,以32%的复合年增长率扩大市场规模,去中心化计算市场正在酝酿待发。

2)2020年Q1季度去中心化超融合市场规模:39亿美元。去中心化超融合框架是基于分布式存储基础上的进一步升级,其架构通过软件实现计算、存储、网络融合,以虚拟化、去中心化来定义数据中心的技术架构。其主要解决的是业务新架构的敏捷响应、大数据处理与访问。

超融合基础架构,制作:IPFS原力区,2020-10-27

根据国际数据公司全球季度融合系统跟踪报告数据显示,全球融合系统市场收入在2020年Q1同比增长4.5%至39亿美元。其把超融合系统分为三类:认证参考系统和集成基础架构、集成平台以及超融合系统,其中超融合系统在2020年Q1季度中占整个融合系统市场的50.9%,近20亿美元。

全球季度融合系统市场占比,来源:IDC,2020-06-18

3)2024年智能化+存储存储市场规模:34.5亿美元。智能化+存储主要有两块:存储智能化和存储赋能智能AI。

存储智能化

希望实现的是根据业务负载、运维管理等,预测未来事件,以及可以根据预测结果进行动态地调整存储资源池。存储资源调配的方式很适合分布式存储的矿池概念,因为矿池天生就适合弹性调配的调整方式,只要匹配上成熟的AI技术即可实现随增随减的资源配置功能。

存储赋能智能AI

就是以AI的准备、训练、推理和归档等阶段为基本功能,存储以配合不同AI场景的需求,包含性能和响应。

总之,两者融合解决了数据的存放、保护和优化,实现了低成本、高效率地存放。

全球人工智能-存储市场份额预算,来源:marketsandmarkets.com,2019-12

全球人工智能-存储市场规模预计将从2019年104亿美元增长到2024年345亿美元。其中,亚太地区以人工智能-存储市场保持最高复合年增长率增长。

4)私有云间对接,公私云互相渗透

私有云对接本质就是B端企业的信息交流,其主要是要实现存储矿池化、自动化、API桥接,和私有云管理平台按需驱动存储资源的创建、调整、优化甚至回收。

方兴未艾的公、私云交互市场需要区块链实现脱敏变现。公、私云互相渗透本质就是B端企业与C端的交流。因为早期公有云主要是针对C端,随着云计算的深入和普及,B端与C端需要信息交互。但出于隐私保护、安全性、政府合规、管理、兼容性、惯性、迁移成本等多种因素的考虑,存储市场亟需分布式存储的诞生,以保障脱敏信息的交互和信息的隐私保护。

张首晟在《区块链技术是互联网世界新的分合转折点》文章中找到了文前疑问的答案:“一旦有了区块链之后,如果创造数据能被价值化、共识化,就会形成一个大的数据市场,使得人工智能也能够更进一步”。

区块链不仅仅可以让隐私数据价值化、公式化,更可以让AI的发展更进一步,如AI操作记录的存储、数据的脱敏使用等。总的来说,区块链+存储可实现有价数据的利用,AI是赋予整个过程更加智能。

5)原生协议赋能实体的无限潜力。分布式存储原生协议主要是为各家应用提供最根本的存储架构,便于协议层与应用层的衔接。从建房子角度看,原生协议主要是建设房子框架的工具,应用层主要是装潢房子,满足不同喜好的人群。该块市场针对的规模可能会更大,但凡是与存储有关,都可能是真需求,如医疗数据存储、金融数据存储和大文件冷存储等。

来源:marketsandmarkets.com,2020-09

其中,全球云存储市场规模预计将从2020年501亿美元增长到2025年1373亿美元。云存储市场的增长随着企业数据量剧增而不断增长,为远程用户提供无处不在的数据和需求,其中其涵盖的垂直领域有电信、医疗保健与生命科学、媒体与娱乐、消费品和零售、制造业、政府与公共部门、能源与公用事业和其他。

五、Filecoin会如何联动?

根据Coinmarketcap数据显示,Filecoin目前总市场价值为8亿美金左右。以上几个领域可以作为分布式存储的探索方向。尽管这些都处于雏形阶段,年市值都还只有几十亿美金规模,但未来潜力无限。总的来说Filecoin嵌合实体进去有三个方向可实践:

Filecoin存储价格,来源:storage.codefi.network,2020-10-20

存储为本,技术支撑更多方向。早期Filecoin通过高性价比的服务来积累存储容量,只有数据积累起来之后,才能体现数据的价值。同时,协议实验室在协同开发四个全节点,以提高Filecoin网络安全性和满足Filecoin生态系统的更大需求。

自由市场发展,多点并行探索。在架构稳定了之后,全球团队可基于Filecoin网络特性搭建应用,创新者可以根据其对市场的认识开发不同的产品,进行多领域、多维度探索。

沉默数据亟需区块链唤醒价值。张首晟认为,往往是隐私数据其价值可能是最大的,所以他才致力于使用区块链+AI唤醒沉默数据。目前,市场上对大多数的沉默数据都没有被使用,其价值是不可估量,一旦该数据被利用起来,对世界可能是新的一种改变。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金智博客

[0:0ms0-4:84ms