所有文章 > 日积月累 > 14个文本转图像AI API
14个文本转图像AI API

14个文本转图像AI API

人工智能在相对较短的时间内成为一种无处不在的工具,各种 API 都提供视频、图像、文本甚至音频生成功能。下面,我们将介绍 14 个利用人工智能和 LLM 的最佳文本转图像 API。这些工具非常先进,提供最新的文本转图像和各种其他输入和输出格式,并有望在极短的时间内加速您的产品!

1.DALL·E 3

许多人认为 DALL·E 3和 OpenAI Image Generation 是过去十年 AI 图像生成器新运动的开端。其结果既接近人类,又高度可定制。DALL·E 在围绕 AI 的对话中几乎无处不在,“ChatGPT”通常被用作一个统称,既涵盖实际的 ChatGPT 框架,也涵盖 DALL·E 特定的实现。最近 DALL·E 被内置到 ChatGPT 作为核心功能,这种情况一直延续。在 OpenAI API 家族中,这种将功能合并到大型 API 中的做法仍在继续。

示例 API 请求

curl https://api.openai.com/v1/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"model": "dall-e-3",
"prompt": "a white siamese cat",
"n": 1,
"size": "1024x1024"
}'

2. Getty的生成式人工智能

关于 AI 生成的图像和提供文本到图像生成的模型,最大的悬而未决的问题之一是版权问题。虽然这些模型可以生成非常好的图像,但它们通常使用受版权保护的材料进行训练,这引发了关于在商业应用中使用此类图像的道德和合法性的讨论。这个问题尚未完全解决,但 Getty 通过提供提供商业安全图像的 API取得了领先优势。现在生成这些图像而不必担心未来立法或当前的道德问题,使该产品特别适合商业应用。

示例 API 请求

curl -X 'POST' \ 'https://api.gettyimages.com/v3/ai/image-generations' \ 
-H 'accept: application/json' \
-H 'Content-Type: application/json' \
-d '{"prompt": "an image of a person coding an API", "negative_prompt": "string", "aspect_ratio": "string", "media_type": "photography", "mood": "black_and_white", "product_id": 0, "project_code": "string", "notes": "string"}'

3. Google 的Imagen 2

Imagen 2 是一款引人注目的解决方案,由全球最大的数据公司之一谷歌提供支持。这本身就是一个强大的卖点——谷歌以其他 AI 或 LLM 提供商无法重现的方式进行数据交易。这些数据使 Imagen 2 能够创建令人难以置信的逼真和高质量图像,并通过Google Cloud Vertex AI 中的 Imagen API将其交付给开发人员。尽管谷歌是一家瞬息万变的公司,以关闭其产品线而闻名,但它已表示人工智能是该公司的重点,这可能会缓解其中的一些担忧。

4.Stability AI开发者平台

Stability AI 以其稳定扩散模型而闻名,该模型为 AI 图像生成设定了主要评判标准。Stability AI 付出了很多努力,将其 AI 产品打包成一个引人注目且实用的商业套件。这些努力的最终成果就是 Stability AI 开发者平台。虽然该平台使用尖端技术提供市场上一些最高质量的图像生成结果,但他们的许多其他解决方案(包括 AI 驱动的升级,甚至使用机器学习进行图像到图像的迭代)已将 Stability AI 推向许多流程的主力工具,包括设计、动画和视频编辑。

示例 API 请求

import base64
import requests
import os

url = "https://api.stability.ai/v1/generation/stable-diffusion-xl-1024-v1-0/text-to-image"

body = {
"steps": 40,
"width": 1024,
"height": 1024,
"seed": 0,
"cfg_scale": 5,
"samples": 1,
"text_prompts": [
{
"text": "an image of a person coding an API",
"weight": 1
},
{
"text": "blurry, dark",
"weight": -1
}
],
}

headers = {
"Accept": "application/json",
"Content-Type": "application/json",
"Authorization": "Bearer YOUR_API_KEY",
}

response = requests.post(
url,
headers=headers,
json=body,
)

if response.status_code != 200:
raise Exception("Non-200 response: " + str(response.text))

data = response.json()

# make sure the out directory exists
if not os.path.exists("./out"):
os.makedirs("./out")

for i, image in enumerate(data["artifacts"]):
with open(f'./out/txt2img_{image["seed"]}.png', "wb") as f:
f.write(base64.b64decode(image["base64"]))

5.ModelsLab API

ModelsLab 的主要价值主张是其 LLM 模型的深度和多样性。ModelsLab 不仅提供自己的原生 LLM 模型用于图像生成

示例 API 请求

OkHttpClient client = new OkHttpClient().newBuilder()
.build();
MediaType mediaType = MediaType.parse("application/json");
RequestBody body = RequestBody.create(mediaType, "{\n \"key\": \"\",\n \"prompt\": \"a person coding an API))\",\n \"negative_prompt\": null,\n \"width\": \"512\",\n \"height\": \"512\",\n \"samples\": \"1\",\n \"num_inference_steps\": \"20\",\n \"seed\": null,\n \"guidance_scale\": 7.5,\n\"safety_checker\":\"yes\",\n \"multi_lingual\":\"no\",\n \"panorama\":\"no\",\n \"self_attention\":\"no\",\n \"upscale\":\"no\",\n \"embeddings_model\":\"no\",\n \"webhook\": null,\n \"track_id\": null\n}");
Request request = new Request.Builder()
.url("https://modelslab.com/api/v3/text2img")
.method("POST", body)
.addHeader("Content-Type", "application/json")
.build();
Response response = client.newCall(request).execute();

6.Monster API

Monster API 是一种独特的解决方案,因为驱动其 API 的是相对庞大(双关语)的网络。这种稳定的传播解决方案利用全球加密挖掘设备的分散式计算来提供稳定、可扩展、全球本地化的图像生成解决方案。这最终意味着 Monster 的图像生成更节省资源,访问通常更加公平,让全球开发人员能够利用 AI 生成的强大功能,而到目前为止,这种方式主要局限于少数几个国家。

示例 API 请求

curl --request POST \
--url https://api.monsterapi.ai/v1/generate/txt2img \
--header 'accept: application/json' \
--header 'content-type: application/json'

7.Replicate API

Replicate 之所以功能强大,很大程度上归功于它能够生成的素材范围。虽然 Replicate 能够以令人难以置信的准确度和质量创建文本到图像的结果,但它已利用此模型扩展到视频、语音甚至音乐生成。这个多面系统还允许您微调输出,从而生成一个可以适应您的特定需求并在特定参数内生成图像的 API。因此,Replicate 是一个功能强大且可定制的解决方案,值得在任何工作流程中考虑。

示例 API 请求

import Replicate from 'replicate';
const replicate = new Replicate();

const input = {
prompt: "an astronaut riding a horse on mars, hd, dramatic lighting",
scheduler: "K_EULER"
};

const output = await replicate.run("stability-ai/stable-diffusion:ac732df83cea7fff18b8472768c88ad041fa750ff7682a21affe81863cbe77e4", { input });
console.log(output)
//=> ["https://replicate.delivery/pbxt/sWeZFZou6v3CPKuoJbqX46u...

8. AI 图像生成器

DeepAI 的图像生成 API 易于使用且设计简单。从很多方面来看,这既是它的吸引力,也是它的缺点。该工具易于使用、速度快,并且为其生成的图像的商业使用提供了强大的免费许可。话虽如此,这是一个简单的解决方案,除了图像生成之外,并没有提供太多功能。如果这就是你需要的,它可以做到,但不要指望它能做更多的事情。

示例 API 请求

curl \
-F 'text=YOUR_TEXT_HERE' \
-H 'api-key:YOUR_API_KEY' \
https://api.deepai.org/api/text2img

9. Hive 的图像生成 API

Hive 将自己定位为 AI 解决方案运营商,通过其 API 提供广泛的实现。虽然核心图像生成解决方案对开发人员和采用者来说仍然非常有价值,但基于该技术的其他工具(如审核工具、文本识别、洞察生成、文档 OCR 系统等)的加入使其成为许多大规模图像 AI 实现的基石。

示例 API 请求

curl --location --request POST 'https://api.thehive.ai/api/v2/task/async' \ 
--header 'authorization: Token <YOUR_TOKEN>' \
--header 'Content-Type: application/json' \
--data-raw '{ "options": { "neg_text": "grass, pool", "num_images": 3 }, "text_data": "modern architecture house", "callback_url": "example_url" }'

10.Cloudlayer.io​

Cloudlayer 是 AI 图像生成的业务专用实现,专注于创建图像驱动的营销和业务材料。这些材料当然包括图像之类的东西,但它们还提供从文本输入创建 PDF、用于结构化创建的预建模板等等。这个工具最好的部分可能是它可以获取 URL 并从中生成图像 – 这可以实现广泛的工作流程效率改进,并直接从预建结构生成图像。对于寻求比 meme-ish 艺术生成更强大的东西的企业来说,这是一个绝佳的解决方案,尽管如此,它仍然建立在与其他产品相同的概念中。

示例 API 请求

curl --request POST \
--url https://api.cloudlayer.io/v2/html/image \
--header 'Content-Type: application/json' \
--header 'x-api-key: <YOUR-API-KEY>' \
--data '{
"html": "PGh0bWw+PGJvZHk+PGgxPkhlbGxvIHdvcmxkITwvaDE+PC9ib2R5PjwvaHRtbD4="
}' \
--output "response.json"

11.Améthyste API

近年来最重大的转变之一是从平台解决方案转向更加分散和民主化的系统。Améthyste API 延续了这一趋势,提供了一种具有非常具体形式和功能的 AI 图像生成解决方案:与 Discord 及其文化相关的模因和图像。虽然这种关注限制了它的使用,但它仍然是专门构建的超特定生成模型解决方案的完美示例,已成为包括 OpenAI 在内的许多 AI 提供商的新关注点。

示例 API 请求

https://v1.api.amethyste.moe/generate/challenger

12. Synthesia 生成 API

虽然 Synthesia 的核心产品传统上是视频生成,但值得注意的是,其输出通常具有高度动态性,并且可以拆分为单独的帧。因此,虽然它不是真正的文本到图像 AI 生成器,但它仍然可以作为一个生成器,通过相对强大的 API 为关键帧艺术、图像效果等创建可行的选项。同样值得注意的是,Synthesia 拥有大量集成功能,这使其比其他单个产品更具优势。

示例 API 请求

curl https://api.synthesia.io/v2/videos \ 
-H "Authorization: ${API_KEY}" \
-H "Content-Type: application/json" \ -X POST \
-d '{"test": true, "input": [{"scriptText": "Hello, World! This is my first synthetic video, made with the Synthesia API!", "avatar": "anna_costume1_cameraA", "background": "green_screen"}] }'

13. Bannerbear 的图像生成 API

Bannerbear 是一款针对其消费者群体的利基解决方案。它专为电子商务和营销功能而构建,与营销工作流程和流程的集成使其成为该领域的杰出选择。值得注意的是,Bannerbear 可以非常轻松地生成图像以及在生成后操纵和更改这些图像 – 这是其他强大的解决方案(如 DALL·E 3)中不常见的功能,DALL·E 3 通常可以在迭代过程中对图像进行大量更改,足以从营销角度将其视为新设计。

示例 API 请求

var data = {
"template" : "jJWBKNELpQPvbX5R93Gk",
"modifications": [
{
"name": "layer1",
"text": "This is my text"
},
{
"name": "photo",
"image_url" : "https://www.pathtomyphoto.com/1.jpg"
}
]
}
fetch('https://api.bannerbear.com/v2/images', {
method: 'POST',
body: JSON.stringify(data),
headers: {
'Content-Type': 'application/json',
'Authorization': `Bearer ${API_KEY}`
}
})

14.Eden人工智能

Eden AI 与此列表中的其他产品不同,它实际上并不是一个单一的 AI 图像生成器。它更像是利用机器学习和人工智能的专有和开放图像生成器集合的前端。所有这些的优点在于 Eden 具有完整的功能集,它既提供图像生成,又提供各种 OCR、面部识别、对象识别和通用检测解决方案,使其广泛适用于除生成图像之外的各种用例。

示例 API 请求

curl --request POST \
--url https://api.edenai.run/v2/image/generation \
--header 'accept: application/json' \
--header 'content-type: application/json' \
--data'
{
"response_as_dict": true,
"attributes_as_list": false,
"show_original_response": false,
"resolution": "512x512",
"num_images": 2,
"providers": "stabilityai,amazon,deepai,replicate,openai",
"text": "A huge red balloon flying outside the city."
}

结论

文本转图像 AI 生成模型是 LLM 驱动创作的前沿技术,此列表中的系统只会越来越好。这些功能强大的 API 为创意和专业材料开发提供了复杂的引擎,应该被视为未来几年媒体创作的宝贵资源。

原文地址:https://nordicapis.com/14-text-to-image-ai-apis/

#你可能也喜欢这些API文章!