通义万相
专用API
服务商:
阿里巴巴达摩院(杭州)科技有限公司
【更新时间: 2024.08.12】
通义万相-文本生成图像是基于自研的Composer组合生成框架的AI绘画创作大模型,能够根据用户输入的文字内容,生成符合语义描述的多样化风格的图像。通过知识重组与可变维度扩散模型,加速收敛并提升最终生成图片。
0元起
去服务商官网采购>
|
- API详情
- 定价
- 使用指南
- 关于我们
- 相关推荐
什么是通义万相?
通义万相-文本生成图像是基于自研的Composer组合生成框架的AI绘画创作大模型,能够根据用户输入的文字内容,生成符合语义描述的多样化风格的图像。通过知识重组与可变维度扩散模型,加速收敛并提升最终生成图片的效果,布局自然、细节丰富、画面细腻、结果逼真。AI深度理解中英文文本语义,让文字秒变精致AI画作。
什么是通义万相?
通义万相有哪些核心功能?
1. 当前模型支持的风格包括但不限于:水彩、油画、中国画、素描、扁平插画、二次元、3D卡通。
2. 支持中英文双语输入。
3. 支持客户自定义咒语书/修饰词,可生成不同风格、不同主题、不同派别的图片,满足个性创意的AI图片生成需求。
4. 支持输入参考图片进行参考内容或者参考风格迁移,支持更丰富的风格、主题和派别,AI作画质量更加高保真。
通义万相的核心优势是什么?
1.知识重组&可变维扩散模型:基于自研的Composer组合生成框架的AI绘画创作大模型,通过知识重组与可变维度扩散模型,生成符合语义描述的多样化风格的图像。
2.效果业界领先:生成图像语义一致性更精准,AI绘画创作布局自然、细节丰富、画面细腻、结果逼真。
在哪些场景会用到通义万相?
1. 广告与营销物料生成:文生图能够即时响应广告文案,生成符合品牌调性、产品特性和营销策略的视觉内容,节省了传统拍摄与后期制作的成本,广告内容根据实时热点迅速调整,实现高度定制化和敏捷营销。
2. 教育与培训资源制作:教育工作者和培训师利用文生图模型来创建生动、直观的教学素材,有助于提升教学内容的吸引力和理解度,定制化的图像资源还能用于制作互动课件、电子教科书,丰富教育资源库。
3. 新闻与媒体内容生产:新闻机构和内容平台采用文生图技术来增强报道的视觉呈现,即时生成的视觉内容不仅能吸引读者注意力,提高阅读体验,还能确保新闻报道的时效性和准确性。
4. 游戏与娱乐内容开发:游戏开发者借助文生图大模型来快速生成游戏内的角色、道具、环境元素等美术资源,用于动态生成游戏NPC(非玩家角色)外观或定制化的玩家角色,增加游戏世界的多样性和沉浸感。
模型服务 |
模型名称 |
计费单价 |
通义万相-文本生成图像 |
wanx-v1 |
0.16元/张 |
通义万相-人像风格重绘 |
wanx-style-repaint-v1 |
0.12元/张 |
通义万相-图像背景生成 |
wanx-background-generation-v2 |
0.08元/张 |
通义万相-涂鸦作画 |
wanx-sketch-to-image-lite |
0.06元/张 |
通义万相-Cosplay动漫人物生成 |
wanx-style-cosplay-v1 |
公测,免费额度300张 |
通义万相-AnyText图文融合 |
wanx-anytext-v1 |
公测,免费额度300张 |
- 已开通服务并获得API-KEY:API-KEY的获取与配置。
- 已安装最新版SDK:安装DashScope SDK。
模型服务 |
模型名称 |
计费单价 |
通义万相-文本生成图像 |
wanx-v1 |
0.16元/张 |
通义万相-人像风格重绘 |
wanx-style-repaint-v1 |
0.12元/张 |
通义万相-图像背景生成 |
wanx-background-generation-v2 |
0.08元/张 |
通义万相-涂鸦作画 |
wanx-sketch-to-image-lite |
0.06元/张 |
通义万相-Cosplay动漫人物生成 |
wanx-style-cosplay-v1 |
公测,免费额度300张 |
通义万相-AnyText图文融合 |
wanx-anytext-v1 |
公测,免费额度300张 |
- 已开通服务并获得API-KEY:API-KEY的获取与配置。
- 已安装最新版SDK:安装DashScope SDK。