区块链行业里有一个很垂直的赛道,技术攻坚很艰涩,这就是对数据进行隐私处理的隐私计算。
为什么呢?
一是因为对数据处理的产品复杂度,二是技术上还有很多很多问题存在。用区块链基础设施来做,太过于简陋,这个举例好像,一个人住进一个没装窗户却有一个窗口的屋子,只能先挂个帘子挡一下。没有装窗户的原因是因为,这个地区没有生产窗框、玻璃的企业,也没有会安装的师傅,只能先用纸糊上或者挂一个帘子,更厉害的,直接把窗户封上。
区块链隐私计算现在就是这种情况。
为了实现web3,未来隐私计算一定会解决数据隐私问题,而这种需求面临的目标是什么?也许是联邦学习。虽然这是一个人工智能领域的基础技术,但它定义了一种数据不离开所有者的数据处理方向。
金色相对论 | 张明镜:比特币总市值至少是阿里和Facebook这样的量级:在今日举行的《危机向左,信仰向右》的比特币减半特辑之资本篇的直播中,针对“减半后比特币的通胀率将小于很多国家央行的通胀目标,各位嘉宾怎么看这次的比特币减半”的问题,链兴资本创始人张明镜表示,在我看来,比特币是顶级的另类资产,他其实是一个顶级开源软件证券化后的市值。现在才2000亿美金估值,肯定太低了。减半后,从预期的角度来讲,我们判断还需要一段时间去启动二级市场的高潮。对于比特币的总市值,张明镜表示,锚定黄金可能虚幻了一点,但他至少是阿里巴巴、facebook这样的量级的。[2020/5/14]
我们为什么要做数据隐私,也是因为平台等中心化的角色会利用数据做一些分析利用,中心化角色也是利用数据进行深度学习,以汲取数据中的价值。
金色晚报 | 百度成立区块链技术研发公司“度链” 日本乐天宣布收购数字货币交易所:东南亚区块链联盟在印尼成立;币安2018年第一季度利润超过德意志银行;蚂蚁矿机发布水冷矿机S9 Hydro测评。更多晚报内容,请查看图片。[2018/8/31]
可见,联邦学习或许是一种目标选择。
先看定义:
联邦学习在2016年由谷歌最先提出,原本用于解决安卓手机终端用户在本地更新模型的问题,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习。
再看框架:
金色晨讯 | 美财政部力挺区块链创新 币价大跌拖累区块链概念股:1.匈牙利财政部表示,匈牙利正致力于数字货币的监管,但尚未承认它们为合法支付方式。
2.美国财政部最近发布了一份报告,敦促州和联邦监管机构修改过时的法规,并支持人工智能、机器学习和区块链等技术创新。
3.据嘉楠耘智官方消息,应用7nm芯片的全芯产品阿瓦隆A9系列比特币矿机预计上线发售日期为9月20日。
4.Coinbase收购了总部位于旧金山的数字身份认证公司Distributed Systems。该公司致力于用区块链开发数字身份解决方案。
5.美国保险服务协会(AAIS)近日宣布与IBM 区块链平台合作开发新型自动化保险报告工具。
6.据Researchandmarkets数据,2018年至2023年全球能源行业的区块链市场总量,预计将从2018年的3.94亿美元猛增至71.1亿美元。
7.Santiment提供的数据显示,大约30%的以太坊交易是与交易所关联的,这表明大多数的以太坊交易和转移与投机无关。
8.芬兰一名22岁的富翁Saarimaa,因近日向泰国比特币案罪犯转账5564.4枚比特币而遭受3500万美元的损失。
9.受数字货币市场行情影响,区块链概念股Overstock股价暴跌,2018年初至今股价下跌约50%。[2018/8/16]
两个数据拥有方的场景是联邦学习的标准统构架。该构架可扩展至包含多个数据拥有方的场景。假设企业A和B想联合训练一个机器学习模型,它们的业务系统分别拥有各自用户的相关数据。此外,企业B还拥有模型需要预测的标签数据。出于数据隐私保护和安全考虑,A和B无法直接进行数据交换,可使用联邦学习系统建立模型。
金色财经现场报道 以太坊核心开发者Karl Floersch:开源课程“加密经济学”第一章已经完成 :金色财经6月3日现场报道,在今天的以太坊技术及应用大会上, 以太坊核心开发者Karl Floersch做了题为“Learning Cryptoeconomics”的主题演讲。他说,《加密经济学》有诸多课程,课程第一章已经完成,名字为“中心化支付处理器”。与此同时,联网社区已经有60多人参加了连线对话,过程非常赞。希望通过自下而上的讨论确定如何开展课程,包括确定主题,给出建议,分享故事等。课程还有“夜晚模式”。这只是个开始,希望更多人参与到这个开源课程中来。[2018/6/3]
第一步:加密样本对齐。系统利用基于加密的用户样本对齐技术,在A和B不公开各自数据的前提下确认双方的共有用户,并且不暴露不互相重叠的用户,以便联合这些用户的特征进行建模。
第二步:加密模型训练。在确定共有用户群体后,就可以利用这些数据训练机器学习模型。为了保证训练过程中数据的保密性,需要借助第三方协作者C进行加密训练。过程中协作者C把公钥分发给A和B,用以对训练过程中需要交换的数据进行加密。A和B分别基于加密的梯度值进行计算,最后把结果汇总给C。C将结果解密,分别回传给A和B。
第三步:激励。联邦学习解决了不同机构加入联邦共同建模的问题,建立模型以后模型的效果会在实际应用中表现出来,可以记录在区块链上。提供数据多的机构所获得的模型效果会更好,模型效果取决于数据提供方对自己和他人的贡献。
这个过程里,
数据隔离,不会泄露到外部其他人,满足用户隐私保护和数据安全的需求;训练有效;参与者地位对等,公平合作。
这个时候看,区块链可以在数据所有权、联邦贡献度等部分起到决定性的作用。所以是不是一个非常完美的适合用区块链来做的模型。
但目前的隐私计算区块链还不能完全做到这些,主要问题在于:
1.对数据操作的颗粒度还不能完全去中心化到个人。
2.算力不够、存储不够。
3.只用智能合约无法执行庞大的复杂的过程。
4.缺少PaaS以及BaaS这样的中间层服务。
5.链上应用的隐私需求少。
在这些问题的影响下,确实没办法实现,也许有人会认为,比如链上混币,或者查不到交易详情的隐私币是不是就可以算是另一个方向的隐私了。
对,这是另一个方向的隐私需求,这个需求已经可以实现,只是联邦学习的路会更长远一些。
在联邦学习之前,为了防止交易数据明文、合约代码明文会带来更多的安全问题,具备隐私保护能力的链上环境,可以用黑箱的方式保护交易、保护合约,保护资产。这里面有tee、mpc、zksnark等方式。
这些对于一个复杂的数据训练网络来说,都是简陋的结构了。
以太坊是世界计算机,在以太坊出现之前,互联网先是活在机房里,现在机房构成的庞大算力组合成云,互联网活在云上,云是一个组合的没有硬件限制的世界计算机,只是没有去中心化结构。
在云服务中我们可以看到涉及隐私计算的相关服务已经上线很久,比如AWS的数据湖和数据仓,比如阿里云的datatrust以及腾讯在可信平台上的服务,都是向这个方向看齐。
最后,让我们看看在云服务的架构下形成的可信数据处理架构:
当云服务部分,被联盟链云服务中的区块链所取代或者被去中心化云服务平台取代时,web3就要成功了。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。