Imagen:前所未有的文本到图像扩散模型
Imagen是什么?
Imagen AI 是一种文本到图像的扩散模型,由 Google Research Brain Team 于 2022 年开发。它具有前所未有的逼真度和深层次的语言理解能力。Google Imagen AI建立在大型 Transformer 语言模型理解文本的能力之上,并具有扩散模型在高保真图像生成方面的优势。简而言之,Imagen 是一个人工智能系统,可以根据输入文本创建逼真的图像。
价格:免费
功能:模型,文字转图像
开发者:谷歌
分享 Imagen
Facebook
Twitter
LinkedIn
Imagen 功能
- 高效的大型预训练冻结文本编码器来处理文本转图像任务
- 关键的缩放预训练文本编码器
- 新的阈值扩散采样器,它可以使用非常大的无分类器指导权重。
- 全新且高效的 U-Net 架构,具有更高的计算效率、更高的内存效率和更快的收敛速度
Imagen AI 价格
免费
Imagen AI 免费下载
目前没有可用的版本,但我们可以使用由 Google 提供支持的 Imagen Editor 和 Edit Bench。 Imagen Editor 是 Image AI 文本引导图像合成功能的微调版本。
Imagen AI Google以及Imagen AI Editing怎么用?
- 无需登录。单击 Imagen Editor & EditBench 并输入。
- 您可以找到 Imagen Editor 和 EditBench 的简要介绍。
- 点击Research Paper(研究论文)查看相关论文,点击EditBench(编辑台)下载使用软件。
Imagen AI 论文
点击此处查看相关学术论文。
用户评论
- Google Research,Brain Team:Imagen 存在编码有害刻板印象和表征的风险,所以我们决定在没有进一步保护措施的情况下不发布 Imagen 供公众使用。
- Jeremy Gray:Google 的 Imagen AI 可以从自然文本中生成具有惊人真实感的逼真图像。
- Chitwan Saharia:Imagen AI 是目前最先进的文本转图像工具,在 COCO FID 和 DrawBench 测试中均排名第一。
常见问题
我们现在可以使用 Imagen 了吗?
目前谷歌不会发布 Imagen 供公众使用。
Imagen 的下一步是什么?
初步分析表明 Imagen 在生成活动、事件和物体的图像时编码了一系列社会和文化偏见。开发团队的下一步行动将试图解决这一挑战。