Imagen:前所未有的文本到图像扩散模型

Imagen是什么?

Imagen AI 是一种文本到图像的扩散模型,由 Google Research Brain Team 于 2022 年开发。它具有前所未有的逼真度和深层次的语言理解能力。Google Imagen AI建立在大型 Transformer 语言模型理解文本的能力之上,并具有扩散模型在高保真图像生成方面的优势。简而言之,Imagen 是一个人工智能系统,可以根据输入文本创建逼真的图像。

 

价格:免费
功能:模型,文字转图像
开发者:谷歌

分享 Imagen

Facebook
Twitter
LinkedIn

Imagen 功能

  • 高效的大型预训练冻结文本编码器来处理文本转图像任务
  • 关键的缩放预训练文本编码器
  • 新的阈值扩散采样器,它可以使用非常大的无分类器指导权重。
  • 全新且高效的 U-Net 架构,具有更高的计算效率、更高的内存效率和更快的收敛速度

Imagen AI 价格

免费

Imagen AI 免费下载

目前没有可用的版本,但我们可以使用由 Google 提供支持的 Imagen Editor 和 Edit Bench。 Imagen Editor 是 Image AI 文本引导图像合成功能的微调版本。

Imagen AI Google以及Imagen AI Editing怎么用?

  1. 无需登录。单击 Imagen Editor & EditBench 并输入。
  2. 您可以找到 Imagen Editor 和 EditBench 的简要介绍。
  3. 点击Research Paper(研究论文)查看相关论文,点击EditBench(编辑台)下载使用软件。
step 1
step 2

Imagen AI 论文

点击此处查看相关学术论文。

用户评论

  • Google Research,Brain Team:Imagen 存在编码有害刻板印象和表征的风险,所以我们决定在没有进一步保护措施的情况下不发布 Imagen 供公众使用。
  • Jeremy Gray:Google 的 Imagen AI 可以从自然文本中生成具有惊人真实感的逼真图像。
  • Chitwan Saharia:Imagen AI 是目前最先进的文本转图像工具,在 COCO FID 和 DrawBench 测试中均排名第一。

常见问题

我们现在可以使用 Imagen 了吗?

目前谷歌不会发布 Imagen 供公众使用。

Imagen 的下一步是什么?

初步分析表明 Imagen 在生成活动、事件和物体的图像时编码了一系列社会和文化偏见。开发团队的下一步行动将试图解决这一挑战。

error: Content is protected !!