使用Kandinsky模型系列进行图像生成的指南
2025/04/01
Kandinsky模型是由俄罗斯AI研究团队AI Forever开发的一系列开源文本到图像(T2I)生成模型,旨在通过高质量和逼真的图像合成满足多种图像生成需求。Kandinsky-3是该系列的最新版本,采用基于潜在扩散模型的架构,结合了谷歌的Flan-UL2文本编码器,总参数量达119亿。它支持文本到图像生成、图像修复、图像融合、文本-图像融合及视频生成等多种任务。此外,Kandinsky-3还提供简化版本,推理速度提高3倍,仅需4步逆向过程。