通义万相

专用API

【更新时间: 2024.08.12】通义万相-文本生成图像是基于自研的Composer组合生成框架的AI绘画创作大模型，能够根据用户输入的文字内容，生成符合语义描述的多样化风格的图像。通过知识重组与可变维度扩散模型，加速收敛并提升最终生成图片。

0元起去服务商官网采购>

浏览次数

164

采购人数

试用次数

SLA: N/A

响应: N/A

适用于个人&企业

试用

书签名称

确定

相似API

Winston-AI图像探测器

Winston AI 是最先进的解决方案，用于检测 AI 生成的图像和使用 Midjourney、DALL-E、Stable Diffusion、Meta AI 等制作的深度伪造。

API详情
定价
使用指南
常见 FAQ
关于我们
相关推荐

产品介绍

什么是通义万相?

通义万相-文本生成图像是基于自研的Composer组合生成框架的AI绘画创作大模型，能够根据用户输入的文字内容，生成符合语义描述的多样化风格的图像。通过知识重组与可变维度扩散模型，加速收敛并提升最终生成图片的效果，布局自然、细节丰富、画面细腻、结果逼真。AI深度理解中英文文本语义，让文字秒变精致AI画作。

什么是通义万相接口？

由服务使用方的应用程序发起，以Restful风格为主、通过公网HTTP协议调用通义万相，从而实现程序的自动化交互，提高服务效率。

通义万相有哪些核心功能？

文本生成图像：用户可以输入文字描述，通义万相会根据这些描述生成不同风格的创意图像，如山水画、古代游船等。用户还可以对生成的图像进行点赞、不满意、生成相似图、下载原图和收藏等操作。
相似图像生成：用户上传任意图片后，通义万相可以进行创意发散，生成内容、风格相似的AI画作。
图像风格迁移：用户上传原图和风格图后，通义万相能够自动将原图处理为指定的风格图。
应用广场（虚拟模特）：在应用广场中，用户可以上传图片并替换模特及背景，创建个性化商品展示图

通义万相的核心优势是什么？

卓越的性能与可靠性：通义万相模型服务以其卓越的性能和稳定性著称，能够生成高质量的图像，即使在高并发和大流量环境下也能保持不低于99%的可用性。
简易的集成与使用体验：通义万相模型服务提供的API接口设计简洁明了，极大地简化了集成过程。即便是缺乏深度技术知识的用户，也能够迅速掌握如何利用通义万相的能力。
多元化应用场景拓展：通义万相模型服务的多功能性使其成为跨领域的理想选择。从将抽象概念转化为具体图像，到个性化涂鸦、人像艺术化、乃至定制化的人物肖像生成，通义万相为用户解锁了无限创意空间。
创新功能愿景：通义万相展现了强大的创新能力，例如在文生视频领域，它最出色的特点就是“最听话”，基本能很好地理解给到的长文本、复杂提示词，把想要的关键要素都完整地表达出来

在哪些场景会用到通义万相？

1. 广告与营销物料生成：文生图能够即时响应广告文案，生成符合品牌调性、产品特性和营销策略的视觉内容，节省了传统拍摄与后期制作的成本，广告内容根据实时热点迅速调整，实现高度定制化和敏捷营销。

2. 教育与培训资源制作：教育工作者和培训师利用文生图模型来创建生动、直观的教学素材，有助于提升教学内容的吸引力和理解度，定制化的图像资源还能用于制作互动课件、电子教科书，丰富教育资源库。

3. 新闻与媒体内容生产：新闻机构和内容平台采用文生图技术来增强报道的视觉呈现，即时生成的视觉内容不仅能吸引读者注意力，提高阅读体验，还能确保新闻报道的时效性和准确性。

4. 游戏与娱乐内容开发：游戏开发者借助文生图大模型来快速生成游戏内的角色、道具、环境元素等美术资源，用于动态生成游戏NPC（非玩家角色）外观或定制化的玩家角色，增加游戏世界的多样性和沉浸感。

产品价格

模型服务	模型名称	计费单价
通义万相-文本生成图像	wanx-v1	0.16元/张
通义万相-人像风格重绘	wanx-style-repaint-v1	0.12元/张
通义万相-图像背景生成	wanx-background-generation-v2	0.08元/张
通义万相-涂鸦作画	wanx-sketch-to-image-lite	0.06元/张
通义万相-Cosplay动漫人物生成	wanx-style-cosplay-v1	公测，免费额度300张
通义万相-AnyText图文融合	wanx-anytext-v1	公测，免费额度300张

使用指南

已开通服务并获得API-KEY：API-KEY的获取与配置。
已安装最新版SDK：安装DashScope SDK。

指南详情链接：https://help.aliyun.com/zh/dashscope/developer-reference/quick-start-1?spm=a2c4g.11186623.0.0.7f9f32510RcmTH

产品问答

通义万相的图像生成质量如何？

通义万相的图像生成质量非常高，可以达到与真实图像相媲美的水平。模型具有强大的语义理解能力，能够根据用户输入的文本提示生成符合用户意图的图像

使用通义万相时遇到API调用报错怎么办？

确认API密钥和访问权限配置正确，检查网络连接是否稳定，并参考官方文档和示例代码，确保调用参数和方法正确。

资源部署失败应如何解决？

确认云资源配置符合要求，如VPC、ECS和OSS等，查看部署日志和错误信息，定位问题原因并参考文档解决。

通义万相服务响应慢有什么解决方案？

检查网络连接和服务器负载情况，优化API调用参数，或联系阿里云技术支持寻求帮助。

通义万相有哪些技术优势？

稳定性与高可用性：通义万相保证了高并发下的稳定响应，可用性达到99%以上。 API友好接入：提供了标准化的HTTP API，使开发人员能够轻松集成AI绘画功能。知识重组&可变维扩散模型：基于自研的Composer组合生成框架的AI绘画创作大模型，通过知识重组与可变维度扩散模型，生成符合语义描述的多样化风格的图像。

通义万相是否支持视频生成？

是的，通义万相在2024年9月19日发布了全新视频生成模型，支持文生视频和图生视频，最长能够生成5秒的视频，每秒30帧，分辨率为720P

通义万相的用户体验如何？

应用程序的用户界面设计简洁明了，易于上手。但是，生成后的作品缺少直接的对比和编辑功能，对于追求完美作品的用户来说，这可能是个需要改进的地方

通义万相在AI绘画领域的表现如何？

通义万相在AI绘画领域展现了高度创新，多样化的创作工具和灵活的输出选项值得称赞。

关于我们

阿里巴巴达摩院（杭州）科技有限公司

企业

通义千问是由阿里云自主研发的大语言模型，用于理解和分析用户输入的自然语言，在不同领域和任务为用户提供服务和帮助。您可以通过提供尽可能清晰详细的指令，来获取符合您预期的结果。通义听悟API服务，在语音识别、翻译和发言人识别的基础上，提炼全文摘要、章节速览、发言总结、待办事项、PPT、问答、关键词等内容，对人与人交流的音视频进行分析与精简，帮助使用者快速了解音视频主要内容。

联系信息

服务时间： 00:00--24:00

电话号码： 86 571 8502 2600

邮箱： tingwu_contact@service.alibaba.com

达摩院成立于2017年10月，致力于探索科技未知，以人类愿景为驱动力，面向未来开展基础科学和创新性技术研究。希望打通应用基础研究和产业应用，探索技术产品化、产品市场化的转换路径。

达摩院在数字技术领域取得了一系列技术突破并实现规模化应用，构建了全方位的人工智能基础能力，推出了业界领先的通义系列大模型，孵化出平头哥半导体公司等。接下来，达摩院将继续聚焦中长期科学技术研究，重点布局人工智能、集成电路等前沿领域。

发展历程

2023年2月，天眼查App显示，阿里巴巴达摩院（杭州）科技有限公司发生工商变更，注册资本由1000万人民币增至3亿人民币，增幅2900%。
2023年6月，阿里巴巴达摩院（杭州）科技有限公司的“达摩院开放域自然对话合成算法”备案通过，应用于对话生成场景，服务于智能对话类的企业端客户，利用对话意图理解、对话内容生成等技术，通过API提供对话生成功能，备案号为网信算备330110507206401230019号；“达摩院图像合成算法”备案通过，应用于图像生成场景，服务于图像合成类的企业端客户，通过API提供文字信息转化为图像信息的功能，备案号为网信算备330110507206401230027号；“达摩院交互式多能型合成算法”备案通过，应用于开放域多模态内容生成场景，服务于问答、咨询类的企业端客户，通过API提供根据用户输入生成多模态信息的功能，备案号为网信算备330110507206401230035号。
2023年7月，阿里巴巴达摩院（杭州）科技有限公司发生工商变更，周明卸任法定代表人、执行董事兼总经理，由张建锋接任。
2023年8月，该公司达摩院语音合成算法、达摩院虚拟试衣合成算法、达摩院人脸融合合成算法备案通过。
2024年2月，阿里巴巴达摩院（杭州）科技有限公司的“达摩院服饰上身合成算法”备案通过，应用于图像生成场景，服务于企业端客户，根据用户上传的服饰参考图和模特图，将服饰图里的服饰融合到模特身上，生成对应服饰商品的广告图，备案号为网信算备330110507206401240055号。
2024年4月，该公司达摩院单图生成3D合成算法备案通过，主要应用于图像生成场景，服务于企业端客户，根据用户输入的需要被3D生成的单张单体物体的图片，生成该物体的任意视角下的图像，达到利用单张图像生成3D模型的效果。备案号为网信算备330110507206401240063号。
2024年4月，该公司达摩院人物姿态编辑合成算法备案通过，主要应用于图像生成场景，服务于企业端客户，根据用户输入的骨架图和人物图，生成人物姿态编辑后的结果图像。备案号为网信算备330110507206401240071号。
2024年6月，阿里巴巴达摩院（杭州）科技有限公司达摩院人物舞蹈视频合成算法备案通过，主要功能是应用于视频生成场景，服务于企业端客户，根据用户输入的人物参考图和所选的预设姿态序列，生成指定姿态序列下的人物舞蹈视频。备案号为330110507206401240089号。

最可能同场景使用的其他API

明星图像识别-天行数据专用API

【更新时间：2024.08.12】该服务名为“明星图像识别”，其主要功能是进行明星人物图像的识别与查询。它能够快速且准确地对输入的明星图像进行分析，帮助用户便捷地获取相关明星的具体信息，为用户提供高效的明星图像识别服务体验。

智能识别 > 图文识别

121

图像风格转换通用API

【更新时间：2024.08.12】提供多种艺术风格特效转化服务，还可自定义风格图像进行风格迁移。用于开展趣味活动，或集成到美图应用中对图像进行风格转换。

开发者工具 > 图像工具

116

图像色彩增强通用API

【更新时间：2024.08.12】图像色彩增强，能够智能化地对图片的色彩饱和度、亮度以及对比度进行调节。通过该处理，可让图片的内容细节得以更好呈现，色彩也会更加逼真生动，从而显著提升图片的整体质量和视觉效果。