链上链下协同的数据归档真的太难了!和解?_EST:区块链的未来发展前景与应用

前言

区块链的全复制、扩展性等问题,使得业务向链上迁移会考虑采用两层设计,有基于区块链的合约层和链下拓展层,链下层承担扩展链上能力。在两层系统中,业务的存证或者协调数据在链上,链下拓展层会保存完整数据内容,并参与业务计算。

随着业务的持续,链下节点的数据会逐渐累积,越来越大,数据的增长速度甚至会超过存储介质容量增长的速度,而不得不为节点提供更大的高性能磁盘,当数据增长突破容量限定后会影响系统性能与业务持续性;链上合约层,当状态数据数据累积到一定数据量级会导致系统吞吐量下降、链上数据查询变慢,服务质量下降。

另一方面,双层系统无法和一般的数据存储系统(MySQL存储系统)一样进行“select-insert-delete”式的归档。合约数据涉及多个业务参与方,链上数据和链下的锚定、关联关系不能被破坏等约束。

Maple Finance推出现金管理池,可帮助链上参与者投资美国国库券:4月19日消息,加密借贷协议 Maple Finance 发文宣布推出现金管理池(Cash Management Pool)。Maple 表示,现金管理池是一个链上现金管理解决方案,该池支持链上参与者投资美国国库券,以满足客户的流动性、风险和会计要求。

注:美国国库证券(United States Treasury securities)是美国财政部发行短期债券,期限不超过一年。[2023/4/19 14:14:16]

为解决这些问题,我们对两层系统的数据归档进行了一定的实践,当合约层以及拓展层数据停止改变或不被频繁使用时,对其进行迁移,减少合约状态数据、让出拓展层节点主存储空间,提升系统的性能和服务质量。

什么是数据归档?

-----数据归档过程和目标

Terra链上DeFi锁仓量为269.7亿美元:金色财经报道,据DefiLlama数据显示,当前Terra链上DeFi锁仓量为269.7亿美元,近24小时增涨0.1%。在公链中排名第2位仅次于以太坊。目前,Terra链上DeFi锁仓量排名前5的分别为:Anchor(141.6亿美元)、Lido(79.9亿美元)、Astroport(12.7亿美元)、Stader(7.99亿美元)、Terraswap(6.95亿美元)。[2022/3/20 14:07:52]

为了详述数据归档来龙去脉,我们需要了解几个简单的概念,首先,需要了解备份和归档的区别:

备份:存储在非易失性存储介质上的数据集合,在原始数据丢失、损坏或不可用时,可以从备份系统访问或从备份数据中恢复,也称为副本。备份同时保护了所有生产系统的活跃的和非活跃的数据。我们通常说的备份,类似“复制“操作。归档:将不再活跃但必须保留的数据移动到另一个存储系统,以便释放节点主存储,提高系统性能。归档的数据是生产数据的子集,一般,将归档数据转存到专用系统,归档类似”剪切“操作。在两层系统语境下,归档意味着将合约的状态数据以及数据锚定的链下系统数据作为一个整体进行归档。

链上数据显示比特币正处于牛市开端,或上涨至1.2万美元:链上数据表明,比特币正处于在另一个牛市的开端。区块链分析公司IntoTheBlock报告称,目前比特币“基本上看涨”。根据其数据,比特币基础网络略有增长,而其内部的“集中度”指标目前处于正值。

彭博高级大宗商品分析师Mike McGlone也表达了同样的乐观情绪。他在彭博7月份的加密展望中写道,比特币使用的增加可能导致其价格上涨:“被使用的活跃比特币地址数量是2018年比特币价格下跌和2019年比特币价格回升的关键信号,从历史模式来看,这一数字表明比特币价值接近1.2万美元。Coinmetrics的30天平均唯一地址数量突破了去年的峰值,这反映出比特币更高的采用度。”McGlone对比特币给出的确切价格是12734美元。(NewsBTC)[2020/7/11]

对数据归档,我们要达到如下目标:

动态 | 以太坊链上交易额较前日上升57.78% 未确认交易超过4万笔:据Tokenview数据显示,截至今日十点,近24小时以太坊链上交易额为1668691.81 ETH,较前日上升57.78%,链上交易数为642420笔,较前日上升22.82%。活跃和新增地址数较前日分别上升19.28%和32.92%。待确认交易笔数41074,交易费均值0.1072美元。[2019/7/23]

1)独立的数据归档支持合约,用于索引链上的数据,包括3方面内容:数据指纹、更新时间、关联方;

2)一个归档模块以及独立归档服务:使用统一的架构,将数据迁移到一致的位置;

3)归档后的数据需要进行统一管理和一致的访问;减少运维归档数据所需的成本,同时需要保护归档数据的安全性;

4)归档后的数据具有索引和搜索功能,能更有效、快捷地对归档的数据访问并利用;

分析 | BTC链上活跃度维持近90日高位,短期调整充分:据TokenInsight数据显示,反映区块链行业整体表现的TI指数北京时间04月22日8时报492.13点,较昨日同期下跌6.81点,跌幅为1.36%。此外,在TokenInsight密切关注的28个细分行业中,24小时内涨幅最高的为社交与内容应用行业,涨幅为1.08%;24小时内跌幅最高的为娱乐与游戏平台行业,跌幅为5.81%。

据监测显示,BTC活跃地址数较前日下降22.64%,但转账数上升6.24%。BCtrend分析师Jeffrey认为,BTC链上活跃度维持近90日高位,短期调整充分,或将蓄力上攻。[2019/4/22]

5)相关归档的恢复:可以将某次归档恢复到生产环境。

一般的数据归档的过程:select-insert-delete,创建一个新的数据库-归档库,然后在归档库创建与生产库相同的表;不断查询生产库数据记录,同步复制到归档库;生产库删除已经复制的数据记录。虽然数据归档过程非常简单,但是设计数据归档的方案,我们必须想清楚以下几个问题?

归档前:那些数据可以归档?数据适合归档吗?归档库如何选型?归档执行阶段:数据归档过程需要不断的读写生产库,这个过程将会大量使用的网络、IO,那为了防止对线上业务造成压力,数据归档一般只在业务低峰期执行。归档后:数据幂等被破坏,数据归档导致生成数据缺失,会对业务造成影响。针对归档的过程和目标。综上,我们将提出设计和实现契合自身架构特点的归档方案。

归档方案实践

趣链科技自研的区块链隐私计算平台BitXMesh,将区块链与隐私计算技术深度融合,支持链上链下协同的数据共享和隐私计算。

BitXMesh是一个两层架构系统。包括区块链合约层,链上部署有数据共享合约、联邦计算协调合约等,链下拓展层由BitXMesh节点组成并提供数据共享、联邦计算等能力。从数据的维度看,整个系统由合约数据及合约数据锚定、节点内的数据以及支撑节点能力、逐渐累积的业务功能数据组成。归档数据的时候需要考虑:链上数据和节点本地数据,数据之间的锚定关系,以及本地数据的关联关系。同时,数据类型也是需要考虑的,节点内有文件、K/V类型的数据,这些数据归档需要存放在不同的归档库中。

BitXMesh数据归档组件包含:内部的归档模块(Archivermodule)、链上数据归档支持合约、存储对接组件、归档库(存储归档数据)。其中,链上数据归档支持合约是为了两层系统协同归档而构建的合约,合约主要功能是进行链上数据的索引以及按时间进行引用计算,便于定位链上数据。整个归档模块组件及其构成,如下图。

针对K/V类型的数据,选择BadgerDB作为归档库,存放BitXMesh归档的K/V数据;对文件数据,使用IPFS作为归档存储,同时文件的元信息存储在BadgerDB归档库;整个归档数据项的标识ID都会记录在归档摘要文件中,归档摘要文件记录了整个归档的元信息,该文件也可以提供给基于BitXMesh开发的业务系统使用,将业务系统的数据也进行归档。整个归档过程如下:

1)首先,归档库初始化。指定归档库存储路径,会在该目录下创建K/VBadgerDB库以及存储大文件的ipfs,这两个库的创建尤其关键,归档的数据存储于两个库中,后续可开发应用对归档的数据进行管理。2)其次,执行归档。目前,按“时间区间”进行归档,分为两个阶段:链上数据及与链上锚定的节点数据的归档、链下节点数据归档。

链上数据及与链上锚定的节点数据的归档:该步骤需要归档支持合约的支持,归档支持合约主要存储链上数据的标识信息以及数据存储时间。当归档时,先查询该合约得到需要归档的数据列表,根据这个数据列表,去归档节点与其锚定的数据。整个过程包括查询-写入-删除,查询链上数据和链下数据,将查询得到的数据信息写入到归档库,一旦写入成功,将摘要写入到归档摘要文件,最后删除数据。链下节点数据归档:该步骤归档节点的业务数据,落到时间区间的数据即可执行查询-写入-删除操作。一旦碰到文件数据,需要查询元信息,写入K/V归档库,再取文件block写入到ipfs归档系统。3)最后,资源回收和落盘操作。上面两步已经将符合时间范围的数据进行归档,之后需要将归档模块访问节点数据的连接断开,归档库也需要关闭数据访问连接。归档摘要文件落到磁盘。

在进行了一次归档操作后,归档库中的数据可以通过归档服务进行访问,类似业务系统的做法,将归档库作为backend数据存储,通过HTTP接口访问这些归档的数据。

总结

数据归档是针对大量数据累积的系统,对数据进行有计划的迁移,当数据停止改变或不被频繁使用时,通过数据归档把它们转存到别的地方,让出存储空间,提升系统的性能。本文以BitXMesh数据归档模块为例,对链上-链下两层架构系统的数据归档进行实践,将归档融入到系统功能,完成了归档使用统一的架构,将数据迁移到一致的位置,归档后的数据需要进行,统一管理和一致的访问目标。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金智博客

[0:31ms0-7:241ms