两大可商用开源大模型同时发布！性能不输 LLaMA，羊驼家族名字都不够用了_MPT:Llama

来源：量子位

从Meta的LLaMA发展出的羊驼家族一系列大模型，已成为开源AI重要力量。

但LLamA开源了又没全开，只能用于研究用途，还得填申请表格等，也一直被业界诟病。

好消息是，两大对标LLaMA的完全开源项目同时有了新进展。

可商用开源大模型来了，还一下来了俩：

MosaicML推出MPT系列模型，其中70亿参数版在性能测试中与LLaMA打个平手。

Together的RedPajama系列模型，30亿参数版在RTX2070游戏显卡上就能跑。

两大Ripple客户分别与Visa和PayDo达成合作:金色财经报道，在线银行应用程序PayDo已与德国顶级银行之一Fidor银行达成合作伙伴关系，后者是Ripple Labs的客户。Fidor与PayDo将一起计划建立更好的支付基础设施，并尽最大努力吸引欧洲和世界各地的客户开始使用在线支付。与此同时，Ripple客户Nium已与支付巨头Visa和FuiouPay合作，以在中国香港创建并推出B2B全球支付工具。[2021/7/20 1:03:31]

对于这些进展，特斯拉前AI主管AndrejKarpathy认为，开源大模型生态有了寒武纪大爆发的早期迹象。

MPT，与LLaMA五五开

MPT系列模型，全称MosaicMLPretrainedTransformer，基础版本为70亿参数。

Real Vision创始人：目前正处于牛市的中期，两大突破性进展是Defi和NFT:前高盛高管、Real Vision创始人Raoul Pal今日早些时候发推表示，很明显目前正处于牛市的中期。这次的两大突破性进展是Defi和NFT。当我们进入下一个下降周期时，这一领域将得到清理，赢家将为他们的大规模采用阶段做好准备。他表示，完全不知道BTC和ETH之外的哪些协议将会得到真正有意义的采用。Raoul Pal猜测，到2025年或更早时，加密用户将达到10亿。Diem将是所有这些的巨大催化剂。就用户而言，加密空间每年以113％的速度增长。即使减慢到互联网在同一阶段看到的网络采用率的63％增长，到2030年或更早时，它仍将导致40亿用户。[2021/5/14 22:01:50]

MPT在大量数据上训练，与LLaMA相当，高于StableLM，Pythia等其他开源模型。

支持84ktokens超长输入，并用FlashAttention和FasterTransformer方法针对训练和推理速度做过优化。

霍比特交易所将于今日16:00上线MXP?并开启两大交易大赛:据霍比特HBTC官方公告，霍比特HBTC将于9月7日16:00（UTC+8）上线MXP（MinerX Protocol），并开通MXP/USDT交易对。

同时，霍比特HBTC还将于9月7日16:00—10日16:00（UTC+8）举行“交易瓜分300,000个MXP”和“净买入排名瓜分200,000个MXP”的大赛，活动总金额达500,000个MXP。

MinerX Protocol网络协议简称MXP，基于区块链技术去中心化的优势，建立起一套包括低廉的传输成本、非常安全、不关停等优点在内的分布式数据存储生态体系。MXP能对区块链分布式存储项目IPFS和Filecoin进行有效兼容运用。

霍比特HBTC是100%持币者共享的交易平台，采用全新的10倍PE定价回购模型及霍比特队长激励模型，并推出平台资产透明和交易数据可信机制。霍比特HBTC由火币、OKEx等56家资本共同投资，主营币币、合约、杠杆、期权等业务，平台上主流币及合约交易拥有优秀流动性和深度。[2020/9/7]

在各类性能评估中，与原版LLaMA不相上下。

声音 | OKcoin副总裁徐坤：溯源成本、技术研发速度是决定落地速度的两大问题:OKcoin副总裁徐坤在微博针对“中共中央、国务院发布关于深化改革加强食品安全工作的意见”表示：区块链技术去中心化、可追溯、不可篡改等特性可有效解决食品安全溯源问题，保障食品从生产、出厂、运输到销售等一系列流程都有据可查、真实可信，有利于建立更为完善的食品安全体系。目前溯源成本、技术研发速度是决定落地速度的两大问题，大规模发展有赖于国家从战略层面推动。这个文件就是信号。[2019/5/21]

除了MPT-7BBase基础模型外还有三个变体。

MPT-7B-Instruct，用于遵循简短指令。

MPT-7B-Chat，用于多轮聊天对话。

MPT-7B-StoryWriter-65k+，用于阅读和编写故事，支持65ktokens的超长上下文，用小说数据集微调。

MosaicML由前英特尔AI芯片项目Nervana负责人NaveenRao创办。

该公司致力于降低训练神经网络的成本，推出的文本和图像生成推理服务成本只有OpenAI的1/15。

RedPajama，2070就能跑

RedPajama系列模型，在5TB的同名开源数据上训练而来。

除70亿参数基础模型外，还有一个30亿参数版本，可以在5年前发售的RTX2070游戏显卡上运行。

目前70亿版本完成了80%的训练，效果已经超过了同规模的Pythia等开源模型，略逊于LLamA。

预计在完成1Ttokens的训练后还能继续改进。

背后公司Together，由苹果前高管VipulVedPrakash，斯坦福大模型研究中心主任PercyLiang，苏黎世联邦理工大学助理教授张策等人联合创办。

开源模型发布后，他们的近期目标是继续扩展开源RedPajama数据集到两倍规模。

OneMoreThing

来自南美洲的无峰驼类动物一共4种，已被各家大模型用完了。

Meta发布LLaMA之后，斯坦福用了Alpaca，伯克利等单位用了Alpaca，JosephCheung等开发者团队用了Guanaco。

以至于后来者已经卷到了其他相近动物，比如IBM的单峰骆驼Dromedary，Databricks的Dolly来自克隆羊多莉。

国人研究团队也热衷于用古代传说中的神兽，如UCSD联合中山大学等推出的白泽。

港中文等推出的凤凰……

最绝的是哈工大基于中文医学知识的LLaMA微调模型，命名为华驼。

参考链接：

https://www.mosaicml.com/blog/mpt-7b

https://www.together.xyz/blog/redpajama-models-v1

https://twitter.com/karpathy/status/1654892810590650376?s=20

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

屎币ChatGPT 九大插件在网上爆火：网页制作神器，看图写菜谱、解析代码等样样齐活儿_CHA:What Do You Meme

来源：量子位新插件又双叒叕来了！继两个月前ChatGPT爆出插件功能后,这场插件狂欢真就是越来越热闹.

欧易交易所投资人必须关注的2023科技新风向_NFT:加密货币是什么意思是

「前言」对全球科技公司来说,2022年是非常艰难的一年。自新冠病爆发以来,全球经济遭受重大打击,作为面向未来的科技行业,很大程度上标志着世界对于经济发展的信心,因此我们可以看到,2022年的.

狗狗币MakerDAO推出DeFi借贷协议Spark_BTC:AMPT

金色财经报道,稳定币发行商MakerDAO宣布推出Spark,这是一种以DAI稳定币为中心的DeFi借贷协议。DAI是第四大稳定币,市值为47亿美元,仅次于USDT、USDC和BUSD.

SAND共享排序器：Rollup渐进式去中心化解决方案_ROL:ROLL

作者：563,Bankless；翻译：金色财经xiaozou如果你是像我一样的DeFi迷,你应该会喜欢有个好用的rollup,让代币互换、贷款、借款和交易体验顺畅无摩擦.

金智博客

两大可商用开源大模型同时发布！性能不输 LLaMA，羊驼家族名字都不够用了_MPT:Llama

金智博客