如何利用机器学习识别加密项目风险?_CHI:加密货币市场是什么意思

作者:PengtaiXu

翻译:Sherrie

加密货币和监管的必要性

加密货币是一种存在于数字世界的交易媒介,依靠加密技术使交易安全。加密货币背后的技术允许用户直接向他人发送货币,而不需要通过第三方,如银行。为了进行这些交易,用户需要设置一个数字钱包,而不需要提供身份证号码或信用评分等个人细节,因此可以让用户伪匿名。

对于普通的加密货币用户来说,这种匿名性可以让他们放心,因为他们的个人信息或交易数据不会被黑客窃取。然而,这种交易匿名性的提高,也容易被犯罪分子滥用,进行、恐怖融资等非法活动。这种非法活动给区块链钱包用户以及加密货币实体都造成了巨大的损失。虽然金融行动特别工作组等监管机构已经在这些实体的监管中引入了标准化的指导方针,但由于每天都有大量的加密货币实体和交易发生,监控加密货币空间是一项具有挑战性的任务。

解决方案

观点:英国加密监管的关键因素是如何处理零售问题:4月5日消息,在IFGS会议的第二天,金融服务行业集团Shearman & Sterling全球负责人Barnaby Reynolds在“Crypto重启:2021年及未来”的发言中,淡化了英国财政部日前关于英国稳定币使用的监管声明的重要性。Reynolds称:英国正在考虑如何监管加密货币,但昨天宣布将稳定币纳入支付体系的声明相对没有太大影响。就加密货币监管而言,伦敦和纽约是值得关注的两个重要市场,因为这两个市场是全球“脉搏”所在。Reynolds解释说,英国的关键因素是如何处理零售问题。英国对加密货币交易的禁令是争议所在,因为零售市场非常希望进入加密货币市场。

此前消息,英国财政部在官网宣布推出一系列举措,将把稳定币视为一种有效的支付方式,作为使英国成为全球加密资产技术和投资中心的计划的一部分。(Finextra)[2022/4/5 14:05:21]

图片来源:?https://dribbble.com/shots/2723032-Needle-in-a-Haystack

萨尔瓦多居民仍对如何使用比特币和Chivo钱包感到困惑:11月27日消息,萨尔瓦多政府此前通过Chivo钱包向当地居民发放了价值30美元的比特币,两个月后,许多人仍然对如何使用比特币和该应用感到困惑,他们在花掉或兑现比特币后,已经完全放弃使用Chivo。其他人则表示,他们仍在坐等价格上涨。30岁的机修工Luis Mauricio表示:“Chivo还不能完全运作,但我希望随着时间的推移,它能得到修复,这会让人们对它的使用更有信心。”他补充说,自己在周末使用Chivo ATM机时也遇到了问题。

此前消息,数百名萨尔瓦多人10月底表示,有黑客用其身份证号码打开了Chivo钱包,以获得政府提供的30美元比特币奖励。(Decrypt)[2021/11/28 12:36:42]

因此,人们有兴趣利用开源信息,例如新闻网站或社交媒体平台,来识别可能的安全漏洞或非法活动。在与LynxAnalytics的合作中,我们已经致力于开发一个自动工具,以刮取开源信息,预测每篇新闻文章的风险分数,并标记出风险文章。这个工具将被整合到Cylynx平台中,这是LynxAnalytics开发的一个工具,用于帮助监管机构通过使用各种信息源监控区块链活动。

中央财经大学郭田勇:应深入研究如何用数字人民币组建更多功能:中央财经大学中国银行业研究中心主任郭田勇表示,在数字化的浪潮下,货币作为一种支付媒介,其本身的数字化是必然趋势。考虑到传统货币印制发行成本高、不易携带等局限,数字货币以其独特的优势,极大降低了交易成本。郭田勇指出,数字货币如果由政府或者中央银行来主导,必须协同好同原有银行体系为主导的支付关系。目前,中国的数字货币属于M0范畴,从金融学角度看,M0并不具有货币创造的能力,在整个货币储存量中占比也很小,因此,数字人民币的范围还非常有限,未来如何用数字人民币组建更多的功能,将其推向更大的领域,值得深入研究。这是一个循序渐进的过程,要把握好节奏。郭田勇称,数字人民币前期推进比较成功,有利于提升人民币国际化程度。随着中国经济实力增强,人民币国际业务更为广泛。面对庞大的国际结算量,数字货币高支付效率的优点更易凸显。(中国新闻网)[2021/7/7 0:32:14]

开源信息的数据获取

我们确定了3类开源数据,这些数据可以提供有价值的信息,帮助检测加密货币领域的可疑活动。这些类别是:

伏泰昊:JUST主动思考如何在波场上建立完善的DeFi体系:据最新消息显示,波场大航海时代4.0全球线上发布会正在进行中,JUST项目负责人伏泰昊在发布会中表示:“JUST旨在打造基于波场TRON的稳定币借贷平台,一个好的金融产品离不开下面应用层的稳定输入与输出,会有多个协议与应用的交叉集合,长期来看,JST代币作为整个治理体系的代币,我们会提供多种底层借贷协议和报价协议等,为用户提供全面的金融服务。作为DeFi明星项目,JUST不仅致力于开拓波场的稳定币市场,也在主动思考如何在波场上建立完善的DeFi体系。”[2020/7/7]

传统的新闻网站,如谷歌新闻,它将报告重大的黑客事件。

加密货币专用新闻网站,如Cryptonews和Cointelegraph,它们更有可能报道小型实体和小型安全事件的新闻。

社交媒体网站,如Twitter和Reddit,在官方发布黑客新闻之前,加密货币所有者可能会在那里发布有关黑客的消息。

现场 | 华盛顿州ICT行业部门负责人:监管者关心区块链如何与经济结合:金色财经现场报道,NEO DevCon 2019开发者大会今日在西雅图举行,华盛顿州信息和通信技术(ICT)行业部门负责人Joseph Williams发表了题为“区块链的监管视角”的主题演讲。Williams表示,监管者关心的是区块链如何与经济结合起来,如果出现问题怎么办,如何建立生态系统等问题。政府机构能够为区块链提供区块链监管框架以提振市场信心,为市场和公众释放对于科技信心的信号。此外,法律框架和监管者可以移除现有法律体系关于区块链的障碍,也可以制定支持让区块链成为可能的法律。此外,Williams还提到了美国迫在眉睫的政策问题,包括区块链交易的法律; 服务等级和保障; 责任,特别是对于发生故障的服务; 数据隐私; 区块链存储的数据作为证据的法律框架; 强制/性能。[2019/2/17]

检索文章和社交媒体帖子的内容,然后建立情绪分析模型。该模型为文章中提到的实体分配了一个风险活动的概率。

情绪分析模型

我们尝试了四种不同的自然语言处理工具进行情绪分析,即VADER、Word2Vec、fastText和BERT模型。在通过选定的关键指标对这些模型进行评估后,RoBERTa模型表现最佳,被选为最终模型。

图片来源:?https://www.codemotion.com/magazine/dev-hub/machine-learning-dev/bert-how-google-changed-nlp-and-how-to-benefit-from-this/

RoBERTa模型对新闻文章或社交媒体帖子的文本进行处理,并为特定文本分配一个风险分数。由于该文本在数据收集过程中已经被标记为实体,我们现在已经有了加密实体的相关风险指标。在后期,我们将多个文本的风险分数结合起来,给出一个实体的整体风险分数。

RoBERTa原本是一个使用神经网络结构建立的情感分析模型,我们将最后一层与我们标注的风险分数进行映射,以适应风险评分的环境。为了提高模型在未来文本数据上的通用性,我们进行了几种文本处理方法,即替换实体、删除url和替换hash。然后我们使用这个表现最好的模型进行风险评分。

风险评分

现在,每篇文章都有一个相关的来源,一个风险概率和一个计数,指的是文章被转发、分享或转发的次数。为了将这些风险概率转换为加密货币实体的单一风险得分,我们首先将文章的概率值缩放到0到100的范围内,并获得每个来源的加权平均值,结合文章的风险得分和计数。加权平均数用于对计数较高的文章给予更大的重视,因为份额数量很可能表明文章的相关性或重要性。

在计算出各来源的风险得分后,我们对各来源的风险得分进行加权求和,得到综合得分,公式如下:

传统的新闻来源被赋予了更高的权重,因为这些来源更有可能报道重大的安全漏洞。

该解决方案的有效性

我们在2020年1月1日至2020年10月30日的174个加密货币实体的名单上测试了我们的解决方案,并将结果与该时间段内的已知黑客案例进行了比较。我们发现,我们的风险评分方法表现相当出色,在37个已知的黑客案例中识别了32个。我们还分析了我们的解决方案对单个实体的有效性。下图显示了Binance从2020年1月1日至2020年10月30日的风险评分。虚线红线代表已知的黑客案例。从图中我们观察到,我们的解决方案报告了5个已知黑客中的4个黑客的风险得分增加。也有几个峰值与已知黑客案例不一致。然而,这并不构成一个主要问题,因为对我们的模型来说,更重要的是识别尽可能多的黑客,减少未识别的黑客数量。

有趣的发现

在风险评分过程中,我们注意到,与规模较小的实体相比,规模较大的实体的风险评分往往有较大比例的假阳性记录。这是因为大型实体被谈论得更多,因此会有更多的负面帖子和虚假谣言,从而导致更高的不准确率。

另一个值得强调的有趣趋势是,围绕着黑客攻击通常有几个明显的高峰。这是由于不同数据源的反应时间不同。社交媒体网站Twitter和Reddit通常是第一个看到高风险事件发生时的高峰,因为用户会发帖提出他们观察到的异常情况,比如一个实体的网站在没有事先通知用户的情况下宕机。官方消息一般是在官方声明之后,稍后才会发布。

局限性

我们发现,我们的解决方案有两个潜在的局限性,首先是需要不断地维护收集器。网站设计可能会随着时间的推移而改变,这些网站的刮擦器需要更新,以确保相关信息仍能被检索到,从而达到风险评分的目的。

第二个限制是,验证一篇文章是否已被正确地标记为加密货币实体是具有挑战性的。例如,一篇报道Bancor可疑活动的文章可能也会因为一个不相关的事件提到Binance。我们的解决方案会错误地将新闻标记为两个实体,并将Binance标记为风险,即使它不是文本中的关键主题。然而,这并不是一个主要的限制,因为我们只使用新闻文章的标题和摘录来进行风险评分,这通常只包含文章的关键信息。

结语

我们的项目让监管机构可以轻松挖掘开源信息,更好地识别加密货币领域发生的风险事件。我们提供了一个分析文章并预测风险分数的语言模型,以及根据实体和来源信息汇总这些分数的方法。这些方法都被编织成一个可以端到端运行的自动化流水线。将该项目整合到Cylynx平台中,将对其现有功能进行补充,并为监管机构识别高风险加密货币实体提供巨大的帮助。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金智博客

[0:15ms0-7:310ms