Stable Diffusion 是一種基於 Latent Diffusion Models (LDM) 的高效擴散模型,專注於生成高解析度的圖像,並在計算效率與生成質量之間實現了良好的平衡。
核心特性
-
基於潛在空間的擴散過程:
- 圖像在壓縮的潛在空間中進行擴散操作,而非像素空間。
- 顯著降低運算資源需求。
-
可控生成:
- 允許用戶使用文本提示、語義標籤或其他條件來指導生成過程。
- 使用 CLIP(Contrastive Language–Image Pretraining)嵌入來實現文本到圖像生成。
-
擴展性與開放性:
- 提供開放源代碼,便於研究者和開發者進一步開發和改進。
About 3 min