Stable Diffusion

stablediffusionfull

O que é Stable Diffusion?

Stable Diffusion é um modelo de IA de texto para imagem baseado em aprendizado profundo. Sua função é principalmente gerar imagens a partir de descrições de texto, podendo também ser utilizado para reparar imagens ou realizar tradução de imagens. A primeira versão do Stable Diffusion foi lançada pela Stability AI em 22 de agosto de 2022, hospedada no Hugging Face. O modelo é de código aberto desde que foi lançado e pode rodar na maioria dos hardwares de consumo com uma GPU normal com pelo menos 8 GB de VRAM, possibilitando que usuários regulares rodem o modelo também, o que é a maior diferença entre Stable Diffusion com outros modelos de imagem semelhantes, como DALL-E e Midjourney.
A tecnologia de Difusão Estável é baseada no modelo de difusão latente amplamente utilizado pelas equipes CompVis e Runway, e o processo de desenvolvimento foi liderado por Patrick Esser da Runway e Robin Rombach do Grupo de Pesquisa de Visão de Máquina e Aprendizagem da Universidade de Munique (anteriormente o laboratório CompVis da Universidade de Heidelberg), além disso, Stability AI, Eleuther AI e LAION fornecem suporte técnico, que é um exemplo de pesquisa entre equipes em modelos de IA.
O aplicativo de imagens oficial da Stable Diffusion, DreamStudio, gerou 170 milhões de fotos para mais de 1 milhão de usuários após seu lançamento em 2022.

Detalhes do StableDiffusion

Preço: A partir de 0,001/folha

Tag: Imagem,Modelo de código aberto, API

Tempo de lançamento: agosto de 2022

Desenvolvedor(es): Stability AI.

Recursos do Stable Diffusion

Recursos do Stable Diffusion 1.0

  • Texto para imagem
  • Imagem a imagem
  • Suporta geração de imagens com resolução de 512X512.

Recursos do Stable Diffusion 2.0

Em 24 de novembro de 2022, stable.AI anunciou uma grande atualização para Stable Diffusion com o lançamento público da versão 2.0. Stable Diffusion 2.0 agora apresenta os seguintes recursos:

  1. Texto para imagem: gera uma imagem com base em prompts textuais com resolução de até 2048X2048 ou superior.
  2. Imagem para imagem: gera uma nova imagem com base em uma imagem existente.
    Profundidade para imagem: transforma uma imagem original em uma nova, preservando a coerência e profundidade do original.
  3. Pintura de imagem guiada por texto: repara uma imagem com base em instruções textuais.

Compartilhe Stable Diffusion

Facebook
Twitter
LinkedIn
error: Content is protected !!