Stable Diffusion 团队放大招！新绘画模型直出 AI 海报，像素级生成_FLO:Deeper Network

来源：量子位

开源AI绘画扛把子，StableDiffusion背后公司StabilityAI再放大招！

全新开源模型DeepFloydIF，一下获星2千+并登上GitHub热门榜。

DeepFloydIF不光图像质量是照片级的，还解决了文生图的两大难题：

准确绘制文字。

以及准确理解空间关系。

多链质押基础设施Stader Labs与P2P期权协议Delta Theta达成合作:7月29日消息，多链质押基础设施Stader Labs宣布与P2P期权协议Delta Theta达成合作。通过此次合作，用户将能够使用Stader的流动质押代币Matic X创建期权并在Delta Theta上进行交易。[2022/7/29 2:46:18]

网友表示，这可是个大事，之前想让Midjourneyv5在霓虹灯招牌上写个字AI都是瞎划拉两笔，对于镜子理解的也不对。

多链数据经纪平台Itheum与Polkastarter Gaming达成合作:官方消息，多链数据经纪平台Itheum与链游Polkastarter Gaming达成合作，Polkastarter Gaming将加入Itheum的公会合作伙伴网络，采用Itheum独家的玩家护照（Gamer Passport），使玩家能够拥有和交易他们的数据。[2022/6/16 4:32:48]

使用DeepFloydIF，可以把指定文字巧妙放置在画面中任何地方。

霓虹灯招牌、街头涂鸦、服饰、手绘插画，文字都会以合适的字体、风格、排版出现在合理的地方。

Nethermind发布用Golang写的StarkNet节点实施Juno v0.1版:6月16日消息，以太坊客户端Nethermind区块链工程师Marcos表示，已发布Juno v0.1版。Juno是一个由Nethermind用Golang写的StarkNet节点实施，将为StarkNet带来去中心化，允许直接从Juno获取StarkNet数据。[2022/6/16 4:32:10]

这意味着，AI直出商品渲染图、海报等实用工作流程又打通一环。

还在视频特效上开辟了新方向。

目前DeepFloydIF以非商用许可开源，不过团队解释这是暂时的，获得足够的用户反馈后将转向更宽松的协议。

Gate.io Startup首发项目IDV认购成功并上线交易:据官方公告，Gate.io Startup 首发项目Idavoll Network (IDV)认购已成功，共有2,438人下单，下单总价值超过1,000万美金，认购系数约为0.02 。Gate.io将根据每个人的下单情况和每个下单币种的认购系数进行IDV分发，并已开通IDV交易和充提服务。[2021/3/4 18:14:02]

有需求的小伙伴可以抓紧反馈起来了。

像素级图像生成

DeepFloydIF仍然基于扩散模型，但与之前的StableDiffusion相比有两大不同。

ETH2.0客户端Lodestar现可连接至ETH2.0测试网:加拿大科技公司ChainSafe的项目经理Colin Schwarz发文称，其Lodestar团队（ETH2.0客户端之一）现在能够连接至Eth2.0测试网Topaz和Schlesi，并可进行同步。不过，目前Lodestar无法与Topaz和Schlesi保持长期连接。Lodestar团队下一步将继续加强信标节点，以通过稳定、长期运行的信标节点和验证程序客户端完全参与公共测试网。注，4月底，ETH2.0的多客户端测试网Schlesi已上线运行，已支持客户端Prysm和Lighthouse。另外，由Prysmatic Labs发起的ETH2.0测试网Topaz的创世时间为北京时间4月18日早上8点。[2020/5/19]

负责理解文字的部分从OpenAI的CLIP换成了谷歌T5-XXL，结合超分辨率模块中额外的注意力层，获得更准确的文本理解。

负责生成图像的部分从潜扩散模型换成了像素级扩散模型。

也就是扩散过程不再作用于表示图像编码的潜空间，而是直接作用于像素。

官方还提供了一组DeepFloydIF与其他AI绘画模型的直观对比。

可以看出，使用T5做文本理解的谷歌Parti和英伟达eDiff-1也都可以准确绘制文字，AI不会写字这事就是CLIP的锅。

不过英伟达eDiff-1不开源，谷歌的几个模型更是连个Demo都不给，DeepFloydIF就成了更实际的选择。

具体生成图像上DeepFloydIF与之前模型一致，语言模型理解文本后先生成64×64分辨率的小图，再经过不同层次的扩散模型和超分辨率模型放大。

在这种架构上，通过把指定图像缩小回64×64再使用新的提示词重新执行扩散，也实现以图生图并调整风格、内容和细节。

并且不需要对模型做微调就可直接实现。

另外，DeepFloydIF的优势还在于，IF-4.3B基础模型是目前扩散模型中U-Net部分有效参数是最多的。

在实验中，IF-4.3B取得了最好的FID分数，并达到SOTA。

谁是DeepFloyd

DeepFloydAIResearch是StabilityAI旗下的独立研发团队，深受摇滚乐队平克弗洛伊德影响，自称为一只“研发乐队”。

主要成员只有4人，从姓氏来看均为东欧背景。

这次除了开源代码外，团队在HuggingFace上还提供了DeepFloydIF模型的在线试玩。

我们也试了试，很可惜的是目前对中文还不太支持。

原因可能是其训练数据集LAION-A里面中文内容不多，不过既然开源了，相信在中文数据集上训练好的变体也不会太晚出现。

OneMoreThing

DeepFloydIF并不是StabilityAI昨晚在开源上的唯一动作

语言模型方面，他们也推出了首个开源并引入RLHF技术的聊天机器人StableVicuna，基于小羊驼Vicuna-13B模型实现。

目前代码和模型权重已开放下载。

完整的桌面和移动界面也即将发布。

DeepfloydIF在线试玩：

https://huggingface.co/spaces/DeepFloyd/IF

代码：

https://github.com/deep-floyd/IF

StableVicuna在线试玩：

https://huggingface.co/spaces/CarperAI/StableVicuna

权重下载：

https://huggingface.co/CarperAI/stable-vicuna-13b-delta

参考链接：

https://deepfloyd.ai/deepfloyd-if

https://stability.ai/blog/deepfloyd-if-text-to-image-model

https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

https://stable-diffusion-art.com/how-stable-diffusion-work/

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

欧易交易所app下载?BRC-721協議解析增強比特幣NFT集合的安全性和真實性 ordinals生態系統的標準_BRC:EST

作者：xiyu Twitter：@ohxiyu 一.背景 1.比特币ordinals缺乏将项目分组到集合中的标准化方法,因为这依赖于特定的、通常集中的服务和钱包.

Fil巨鲸退场 NFT市场进入至暗时刻_FES:SAFESHIB

近日,NFT?OG「Franklin」、「麻吉大哥」以及黄立成相继宣布退出NFT领域。BAYC巨鲸「Franklin」在宣布退出NFT领域后,更是大量抛售BAYC。NFT市场正在悄然发生着巨变.

ADA为什么说zkRollup的可行性起源于零知识证明的计算代理思想_CHA:BKchain

撰文：FoxTechCTO林彦熹,FoxTech首席科学家孟铉济前言 Prover和Verifier之间的计算代理思想是零知识证明的核心内容之一.

FilecoinChainBreaker：聊聊AIGC 在 Web3的应用_ATG:Floki Box

2023年4月7日21:00,「ChainBreakerPodcast」播客活动第四十六期拉开帷幕.

金智博客

Stable Diffusion 团队放大招！新绘画模型直出 AI 海报，像素级生成_FLO:Deeper Network

金智博客