Gemini API 申请指南

什么是Gemini API？

Gemini是谷歌最新发布的大型多模态人工智能模型，能够处理文本、图像、音频、视频等多种数据形式。随着AI技术的快速发展，Gemini在功能和性能上都代表着当前的顶尖水平。本文将详细介绍如何申请Gemini API，并通过实际案例展示其使用方法。

如何申请Gemini Pro API

申请Gemini API的过程相对简单，只需按照以下步骤操作即可：

准备谷歌账号：若没有谷歌账号，需要先注册一个。注册完成后，确保账号已登录。
网络环境：建议使用美国IP地址访问，以避免后续可能的访问限制问题。
访问申请页面：打开 Google AI Studio网站，进入API申请页面。
创建API Key：在左侧菜单中选择“Get API key”，然后点击“Create API key in new project”以创建新的API Key。确保保存好API Key以备后续使用。

免费模式与付费模式

Gemini API提供两种使用模式：

免费模式：每分钟允许60次请求，适合个人用户和小型开发测试使用。
付费模式：按使用量付费，输入字符每千字符0.00025美元，输出字符每千字符0.0005美元，图片处理每张0.0025美元。付费模式适合大规模应用。

使用MakerSuite平台

MakerSuite是一个基于浏览器的IDE，用于快速原型设计和测试生成式AI模型。以下是使用MakerSuite进行模型交互的步骤：

选择模型：推荐选择Gemini Pro（文本）或Gemini Pro Vision（图片）。
设置模型参数：
- Temperature：决定模型的创造力水平，值越高创造力越强，值越低输出越稳定。
- Safety settings：调整对不当言论的屏蔽程度。
- Top K和Top P：控制输出的多样性和随机性。
创建新交互：在左侧菜单选择“Create new”以开始新项目。

Freeform prompt 文本/图片提示

通过输入一段提示文字或图像，模型将根据提示生成相关内容。这种方式适合快速生成内容并进行创意探索。

Structured prompt 结构化提示

通过表格输入多组输入输出对，让模型学习并基于这些案例生成新的响应。这种方式适合需要特定格式输出的场景。

API调用示例

使用Gemini API可以通过Python库进行调用，以下是一个简单的代码示例：

import google.generativeai as genai

genai.configure(api_key='YOUR_API_KEY')  # 填入自己的api_key

for m in genai.list_models():
    print(m.name)
    print(m.supported_generation_methods)

内容生成示例

使用Gemini生成内容的简单示例：

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("告诉我太阳系中最大行星的相关知识")
print(response.text)

流式输出

Gemini支持流式输出功能，可以在请求过程中实时获取响应数据，提升用户体验。

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("给我上海3日游攻略", stream=True)

for chunk in response:
    print(chunk.text)
    print("_"*80)

聊天模式

Gemini还支持聊天模式，可以模拟聊天机器人进行对话。

import google.generativeai as genai

genai.configure(api_key='YOUR_API_KEY')  # 填入自己的api_key

model = genai.GenerativeModel(model_name="gemini-pro")

chat = model.start_chat(history=[])

response = chat.send_message("你好，我叫Wayne")
print(response.text)

response = chat.send_message("怎么称呼你啊?")
print(response.text)

response = chat.send_message("你还记得我叫什么吗？")
print(response.text)

for message in chat.history:
    print(f'**{message.role}**: {message.parts[0].text}')