
DeepSeek Janus-Pro 应用代码与图片链接实践
文心AI作画是基于百度文心 ERNIE-ViLG 模型的创新应用,旨在通过跨模态的技术实现文本到图像的智能转换。此技术不仅提升了人工智能在艺术创作领域的应用能力,还为用户提供了一种全新的视觉表达方式。
文心ERNIE-ViLG作为一个大型的中文跨模态生成模型,其参数规模达到100亿。通过将图像生成和文本生成统一建模,这个大模型显著提升了图文生成效果,能够生成不同风格、不同构图的图像作品。下图展示了ERNIE-ViLG生成的不同风格的图像。
文心AI作画API为用户提供了两个主要接口:提交请求和查询结果。这两个接口的设计旨在简化用户的操作流程,使其能够快速生成所需的图像。
提交请求接口是用户与AI进行交互的起点。通过传入文本、分辨率和风格参数,用户可以创建一项AI作画任务,并获得任务ID。这个过程允许用户根据自己的需求自定义生成1到6张图片。
查询结果接口用于在任务创建后,查看图片的生成状态。用户可以通过查询接口获取生成图片的地址链接,从而查看和下载自己所需的图像。
注册和获取百度智能云的API Key是使用文心AI作画服务的第一步。用户需要在 百度智能云 注册并创建应用,才能获得API Key和Secret Key。
首先,用户需要在百度智能云官方网站上注册一个免费账号,并登录进入控制台。在控制台中,用户可以找到“智能创作平台”项目,并领取免费的接口资源。
在“应用列表”中,用户需要创建应用以获取个人API Key和Secret Key。这些密钥是调用文心AI作画API所必需的。
文心AI作画的实现需要用户编写代码来调用API接口。以下是完整的代码实现过程。
import requests
import json
API_KEY = "自己申请的API Key"
SECRET_KEY = "自己申请的Secret Key"
def main():
url = "https://aip.baidubce.com/rpc/2.0/ernievilg/v1/txt2img?access_token=" + get_access_token()
payload = json.dumps({
"text": "中国山水画",#输入中文描述
"resolution": "1024*1024",#选择图片分辨率,可支持1024*1024、1024*1536、1536*1024
"style": "古风",#选择图像风格,古风、二次元、写实风格、浮世绘、未来主义、赛博朋克等等
"num": 2#输入要生成的图片数量,可选1~6张
})
headers = {
'Content-Type': 'application/json',
'Accept': 'application/json'
}
response = requests.request("POST", url, headers=headers, data=payload)
print(response.text)
#获取Access Token
def get_access_token():
"""
使用 AK,SK 生成鉴权签名(Access Token)
:return: access_token,或是None(如果错误)
"""
url = "https://aip.baidubce.com/oauth/2.0/token"
params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}
return str(requests.post(url, params=params).json().get("access_token"))
if __name__ == '__main__':
main()
import requests
import json
from io import BytesIO#BytesIO实现了在内存中读写bytes
from PIL import Image
import os
API_KEY = "自己申请的API Key"
SECRET_KEY = "自己申请的Secret Key"
def main():
#API接口的url
url = "https://aip.baidubce.com/rpc/2.0/ernievilg/v1/getImg?access_token=" + get_access_token()
#发送请求获取网页内容
payload = json.dumps({
"taskId": "提交请求代码返回的 'taskId' 的值"
})
headers = {
'Content-Type': 'application/json',
'Accept': 'application/json'
}
response = requests.request("POST", url, headers=headers, data=payload)
print('请求的返回值:',response.text)
json_result = json.loads(response.text)
imgUrls=json_result['data']['imgUrls']#返回imgUrls的结果
print("imgUrls的返回值:", imgUrls)#imgUrls":[{"image":"https://wenxin.baidu.com/younger/file/ERNIE-ViLG/4a90992981919xxxxxx"},{"image":"https://wenxin.baidu.com/younger/file/ERNIE-ViLG/4a90992981919a74f0b4xxxxx"}]
print("imgUrls类型:",type(imgUrls))#查看imgUrls类型,是列表
print("imgUrls数量:",len(imgUrls))
#获得图片网址并将图片保存到本地
for i in range(0,len(imgUrls)):
img_url=imgUrls[i]
print('imges_url:',img_url)
img_url=img_url['image']
print('image_url:',img_url)
#保存图片到本地
req=requests.get(img_url)#获取图片网址
image = Image.open(BytesIO(req.content))#在内存中打开图片
image.save(os.path.join('图片保存路径','{}.jpg'.format(i)), 'JPEG')
#获取Access Token
def get_access_token():
"""
使用 AK,SK 生成鉴权签名(Access Token)
:return: access_token,或是None(如果错误)
"""
url = "https://aip.baidubce.com/oauth/2.0/token"
params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}
return str(requests.post(url, params=params).json().get("access_token"))
if __name__ == '__main__':
main()
文心AI作画不仅限于简单的图像生成,还在多个领域展示其强大的应用潜力。以下是一些典型应用场景:
在艺术创作中,文心AI作画可以帮助艺术家快速生成灵感草图,节省大量的创作时间。通过输入简单的文字描述,艺术家可以获得多种风格的视觉作品作为参考。
在虚拟现实领域,文心AI作画可以快速生成沉浸式场景,为用户提供更丰富的视觉体验。无论是游戏设计还是影视制作,这项技术都能极大提升创作效率。
在图像编辑和设计领域,文心AI作画能够生成精美的图像素材,帮助设计师更快地完成项目。其生成的高质量图像可以直接应用于广告、海报等设计作品中。
文心AI作画的技术优势主要体现在其大规模的参数和跨模态的生成能力。这使得它能够在各种复杂的文本描述下生成高质量的图像。
文心ERNIE-ViLG拥有高达100亿的参数规模,这为模型的学习和生成能力提供了有力的支持。如此大规模的模型能够更好地理解和生成复杂的图像内容。
跨模态生成能力是文心AI作画的核心优势之一。它能够将文本和图像的生成过程统一建模,从而实现更精准的语义对齐和图像生成。
在使用文心AI作画时,用户需要注意一些细节,以确保使用过程的流畅性和安全性。
API Key是用户访问文心AI作画服务的唯一凭证,用户需要确保其安全性,避免泄露给他人。
在提交请求时,用户需要合理设置文本、分辨率和风格参数,以获得最佳的图像生成效果。过高的参数设置可能导致生成时间过长或失败。
文心AI作画的生成速度取决于用户选择的分辨率和图像数量。一般情况下,生成一张高分辨率图像需要几秒到几十秒不等。
用户可以通过查询结果接口获取生成图像的地址链接,然后下载到本地进行查看和使用。
目前,文心AI作画主要支持中文输入,用户需要使用中文进行文本描述。
生成的图像版权通常归属使用者,但用户应遵循相关法律法规,避免侵犯他人权益。
文心AI作画的使用限制包括每天的调用次数限制和生成图像的数量限制,具体可通过百度智能云的相关文档进行查阅。
通过以上对文心AI作画的全面解析,相信您已经对这项技术有了更深入的了解。无论是在技术实现还是应用场景中,文心AI作画都展示出其强大的潜力和广阔的前景。