如何获取Gemini API Key 密钥（分步指南）

Gemini 是谷歌目前最新最强的大语言模型，支持多模态（文字，图片，音频，视频等等）处理。将Gemini-Google的LLM（原名Bard）集成到您的内部应用和产品中，能够彻底改变员工与应用的互动方式以及客户使用产品的方式。但在通过API请求访问Gemini模型之前，首要条件就是创建一个API密钥。下面，我们会逐步介绍获取Gemini API密钥的方法，并进行初步的可用性测试，以及在使用过程中需要考虑的其他关键因素。

步骤 1：登录 Google 账户

注册前建议使用美国节点访问，登录到Google 主页，右上角有个注册按钮。

‍

步骤 2：访问 “Google AI Studio”

您可以在此处找到该登陆页面。然后，点击 “Gemini API “标签或点击 “了解有关 Gemini API 的更多信息 “按钮。

或者，也可以直接访问Gemini API 登陆页面。

步骤 3：点击 “在 Google AI Studio 获取 API 密钥”。

点击页面中央的按钮获取API秘钥

步骤 4：审批服务条款

页面会弹出一个窗口，要求您选择是否同意 Google API 服务条款和 Gemini API 附加服务条款。

您可以选择性地订阅电子邮件通知，以便获取Google AI的最新动态，并参与Google AI的特定研究项目，虽然这不是强制要求的。

勾选第一个方框，其它方框也可以选择性的勾选，然后点击继续。

步骤 5：创建API密钥

现在您可以点击 “创建 API 密钥”。

然后，选择在新项目中或通过现有项目创建 API 密钥。

Pop-up that asks you where to create the API key

选择其中一个选项后，API 密钥就会自动生成！

一定要谨记将此 API 密钥存储在安全的位置，以防止未经授权的访问。

文本生成代码API调用示例

# setup

import google.generativeai as genai



genai.configure(api_key='xxx')  # 填入自己的api_key



# 查询模型

for m in genai.list_models():

    print(m.name)

    print(m.supported_generation_methods)

内容生成

model = genai.GenerativeModel('gemini-1.5-flash')

response = model.generate_content("告诉我你是谁？")

print(response.text)

{

    "id": "chatcmpl-9a7620aa7def44329cc3f79d334d15b1",

    "model": "gemini-1.5-flash",

    "object": "chat.completion",

    "created": 1730879061,

    "choices": [

        {

            "index": 0,

            "message": {

                "role": "assistant",

                "content": "我是一个大型语言模型，由 Google 训练。"

            },

            "finish_reason": "stop"

        }

    ],

    "usage": {

        "prompt_tokens": 12,

        "completion_tokens": 17,

        "total_tokens": 29

    }

}

构建Gemini API的其他注意事项

在构建 Gemini API之前，您还应了解并掌握以下几个方面：

定价计划

Gemini 1.5 Flash、Gemini 1.5 Pro 和 Gemini 1.0 Pro 的定价方案各不相同。不过，它们都有免费层和现收现付层。

在这些模式中，两级之间的主要区别在于费率限制、输入和输出的定价、是否提供上下文缓存以及输入和输出是否用于改进其产品。

通过此链接了解更多关于Gemini定价计划的信息。

费率限制

如前所述，费率限额因机型和计划而异。每种模式和计划的速率限制也有几种衡量方法。更具体地说，它们是按每分钟请求数、每分钟代币数和每天请求数来衡量的。

The rate limits for Gemini 1.5 Flash’s free plan — *Gemini 1.5 Flash 免费计划的费率限制*

在此了解有Gemini费率限制的更多信息。

应注意的错误

虽然您可能会遇到各种各样的错误，但以下几种常见错误值得注意：

400 invalid_argument： 请求体中有错别字、缺少字段或其他导致请求失败的问题
404 NOT_FOUND： 服务器中没有找到您请求的资源
403 PERMISSION_DENIED：您的 API 密钥不具备访问模型的适当权限级别；和/或您未通过适当的身份验证流程就试图访问已调整的模型
500 INTERNAL：问题出在 Gemini 端。您可以尝试向另一个模型提出同样的请求，或者等待并重试请求

点击此处了解更多有关使用 Gemini 时可能遇到的 API 错误的信息。

SDK

为了帮助您更快、更少地建立集成，您可以使用 Gemini API 的任何一个 SDK。

他们的 SDK 涵盖多种语言，包括 Python、Node.js、Go、Dart、Android、Swift、Web 和 REST。

您可以在此了解使用每个 SDK 的先决条件、安装说明等更多信息。

可用能力

使用 Gemini API，您可以访问LLM的各种功能。

以下是您可以做的事情的一个缩影：

文本生成： 通过输入，您可以获得文本摘要、视觉资产描述、将文本翻译成不同语言、以特定格式（如博客文章）和特定语气及语调创建副本等输出‍。
视觉您可以使用图像或视频作为输入，并获得有关该视频或图像的摘要或具体问题的解答。
音频： 使用录音作为输入，您可以获得音频文件的摘要、某些问题的答案或转录（您可以定义转录的长度和您想要的部分）‍。
长语境： 使用 Gemini 模型的上下文窗口（例如，Gemini 1.5 Pro 可提供 200 万个token），您可以在输入中使用长格式文本、视频和录音，并获得特定问题的答案、接收摘要、以特定方式编辑视频（例如，添加字幕）等。

安全过滤器

虽然双子座应用程序接口会防止输出 “核心危害”，但您可以调整特定请求中的某些安全过滤器–骚扰、仇恨言论、性露骨和危险，使输出更符合您的需求。

您将在 API 响应中收到类别分数（低、中、高），根据这些分数，内容可能会被阻止，也可能不会被阻止。

在此处了解更多有关使用 Gemini API 安全过滤的信息。

常见问题

1、Gemini 可在哪些区域使用？

Gemini 1.0 Pro 和 Gemini 1.0 Pro Vision 可在亚洲、美国和欧洲区域使用。

2、如何使用我的输入数据？

Google 通过健全的数据治理实践（包括审核 Google Cloud 在其产品开发中使用的数据），确保 Google 团队遵循我们的 AI/机器学习隐私权承诺。

3、我的数据会被缓存吗？

Google 可能缓存客户的 Gemini 模型的输入和输出，以加快对客户后续提示的回答速度。缓存的内容最多可存储 24 小时。默认情况下，系统会为每个 Google Cloud 项目启用数据缓存。Google Cloud 项目的相同缓存设置适用于所有区域。您可以使用以下 curl 命令来获取缓存状态、停用缓存或重新启用缓存。

4、如何解决发出 API 请求时的配额 (429) 错误？

需求过多或请求超出了每个项目的配额。请检查您的请求速率是否小于项目的配额。如需查看项目配额，请转到Google Cloud控制台中的配额页面。

总结

本文总结了获取Gemini-Google LLM（原名Bard）API密钥的详细步骤，从登录Google账户、访问Google AI Studio，到获取API密钥并进行初步可用性测试，为开发者提供了全面的指南。同时，文章还探讨了在使用Gemini API过程中需要考虑的关键因素，包括定价计划、费率限制、常见错误处理、SDK使用、可用能力和安全过滤器等，帮助开发者更有效地将多模态处理能力集成到应用中，并确保API调用的顺利进行。