Stable Diffusion
O que é Stable Diffusion?
Stable Diffusion é um modelo de IA de texto para imagem baseado em aprendizado profundo. Sua função é principalmente gerar imagens a partir de descrições de texto, podendo também ser utilizado para reparar imagens ou realizar tradução de imagens. A primeira versão do Stable Diffusion foi lançada pela Stability AI em 22 de agosto de 2022, hospedada no Hugging Face. O modelo é de código aberto desde que foi lançado e pode rodar na maioria dos hardwares de consumo com uma GPU normal com pelo menos 8 GB de VRAM, possibilitando que usuários regulares rodem o modelo também, o que é a maior diferença entre Stable Diffusion com outros modelos de imagem semelhantes, como DALL-E e Midjourney.
A tecnologia de Difusão Estável é baseada no modelo de difusão latente amplamente utilizado pelas equipes CompVis e Runway, e o processo de desenvolvimento foi liderado por Patrick Esser da Runway e Robin Rombach do Grupo de Pesquisa de Visão de Máquina e Aprendizagem da Universidade de Munique (anteriormente o laboratório CompVis da Universidade de Heidelberg), além disso, Stability AI, Eleuther AI e LAION fornecem suporte técnico, que é um exemplo de pesquisa entre equipes em modelos de IA.
O aplicativo de imagens oficial da Stable Diffusion, DreamStudio, gerou 170 milhões de fotos para mais de 1 milhão de usuários após seu lançamento em 2022.
Detalhes do StableDiffusion
Preço: A partir de 0,001/folha
Tag: Imagem,Modelo de código aberto, API
Tempo de lançamento: agosto de 2022
Desenvolvedor(es): Stability AI.
Recursos do Stable Diffusion
Recursos do Stable Diffusion 1.0
- Texto para imagem
- Imagem a imagem
- Suporta geração de imagens com resolução de 512X512.
Recursos do Stable Diffusion 2.0
Em 24 de novembro de 2022, stable.AI anunciou uma grande atualização para Stable Diffusion com o lançamento público da versão 2.0. Stable Diffusion 2.0 agora apresenta os seguintes recursos:
- Texto para imagem: gera uma imagem com base em prompts textuais com resolução de até 2048X2048 ou superior.
- Imagem para imagem: gera uma nova imagem com base em uma imagem existente.
Profundidade para imagem: transforma uma imagem original em uma nova, preservando a coerência e profundidade do original. - Pintura de imagem guiada por texto: repara uma imagem com base em instruções textuais.