如何获取Llama API密钥(分步指南)
如何获取Gemini API密钥(分步指南)
Gemini 是谷歌目前最新最强的大语言模型,支持多模态(文字,图片,音频,视频等等)处理。将Gemini-Google的LLM(原名Bard)集成到您的内部应用和产品中,能够彻底改变员工与应用的互动方式以及客户使用产品的方式。但在通过API请求访问Gemini模型之前,首要条件就是创建一个API密钥。下面,我们会逐步介绍获取Gemini API密钥的方法,并进行初步的可用性测试,以及在使用过程中需要考虑的其他关键因素。
步骤 1:登录 Google 账户
注册前建议使用美国节点访问,登录到Google 主页,右上角有个注册按钮。
第 2 步:访问 “Google AI Studio”
您可以在此处找到该登陆页面。然后,点击 “Gemini API “标签或点击 “了解有关 Gemini API 的更多信息 “按钮。
或者,也可以直接访问Gemini API 登陆页面。
第 3 步:点击 “在 Google AI Studio 获取 API 密钥”。
点击页面中央的按钮获取API秘钥
步骤 4:审批服务条款
页面会弹出一个窗口,要求您选择是否同意 Google API 服务条款和 Gemini API 附加服务条款。
您可以选择性地订阅电子邮件通知,以便获取Google AI的最新动态,并参与Google AI的特定研究项目,虽然这不是强制要求的。
勾选第一个方框,其它方框也可以选择性的勾选,然后点击继续。
第 5 步:创建API密钥
现在您可以点击 “创建 API 密钥”。
然后,选择在新项目中或通过现有项目创建 API 密钥。
选择其中一个选项后,API 密钥就会自动生成!
一定要谨记将此 API 密钥存储在安全的位置,以防止未经授权的访问。
文本生成代码API调用示例
# setup
import google.generativeai as genai
genai.configure(api_key='xxx') # 填入自己的api_key
# 查询模型
for m in genai.list_models():
print(m.name)
print(m.supported_generation_methods)
内容生成
model = genai.GenerativeModel('gemini-1.5-flash')
response = model.generate_content("告诉我你是谁?")
print(response.text)
{
"id": "chatcmpl-9a7620aa7def44329cc3f79d334d15b1",
"model": "gemini-1.5-flash",
"object": "chat.completion",
"created": 1730879061,
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "我是一个大型语言模型,由 Google 训练。"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 12,
"completion_tokens": 17,
"total_tokens": 29
}
}
构建Gemini API的其他注意事项
在构建 Gemini API之前,您还应了解并掌握以下几个方面:
定价计划
Gemini 1.5 Flash、Gemini 1.5 Pro 和 Gemini 1.0 Pro 的定价方案各不相同。不过,它们都有免费层和现收现付层。
在这些模式中,两级之间的主要区别在于费率限制、输入和输出的定价、是否提供上下文缓存以及输入和输出是否用于改进其产品。
通过此链接了解更多关于Gemini定价计划的信息。
费率限制
如前所述,费率限额因机型和计划而异。每种模式和计划的速率限制也有几种衡量方法。更具体地说,它们是按每分钟请求数、每分钟代币数和每天请求数来衡量的。
在此了解有Gemini费率限制的更多信息。
应注意的错误
虽然您可能会遇到各种各样的错误,但以下几种常见错误值得注意:
- 400 invalid_argument: 请求体中有错别字、缺少字段或其他导致请求失败的问题
- 404 NOT_FOUND: 服务器中没有找到您请求的资源
- 403 PERMISSION_DENIED:您的 API 密钥不具备访问模型的适当权限级别;和/或您未通过适当的身份验证流程就试图访问已调整的模型
- 500 INTERNAL:问题出在 Gemini 端。您可以尝试向另一个模型提出同样的请求,或者等待并重试请求
点击此处了解更多有关使用 Gemini 时可能遇到的 API 错误的信息。
SDK
为了帮助您更快、更少地建立集成,您可以使用 Gemini API 的任何一个 SDK。
他们的 SDK 涵盖多种语言,包括 Python、Node.js、Go、Dart、Android、Swift、Web 和 REST。
您可以在此了解使用每个 SDK 的先决条件、安装说明等更多信息。
可用能力
使用 Gemini API,您可以访问LLM的各种功能。
以下是您可以做的事情的一个缩影:
- 文本生成: 通过输入,您可以获得文本摘要、视觉资产描述、将文本翻译成不同语言、以特定格式(如博客文章)和特定语气及语调创建副本等输出。
- 视觉 您可以使用图像或视频作为输入,并获得有关该视频或图像的摘要或具体问题的解答。
- 音频: 使用录音作为输入,您可以获得音频文件的摘要、某些问题的答案或转录(您可以定义转录的长度和您想要的部分)。
- 长语境: 使用 Gemini 模型的上下文窗口(例如,Gemini 1.5 Pro 可提供 200 万个token),您可以在输入中使用长格式文本、视频和录音,并获得特定问题的答案、接收摘要、以特定方式编辑视频(例如,添加字幕)等。
安全过滤器
虽然双子座应用程序接口会防止输出 “核心危害”,但您可以调整特定请求中的某些安全过滤器–骚扰、仇恨言论、性露骨和危险,使输出更符合您的需求。
您将在 API 响应中收到类别分数(低、中、高),根据这些分数,内容可能会被阻止,也可能不会被阻止。
在此处了解更多有关使用 Gemini API 安全过滤的信息。
常见问题
1、Gemini 可在哪些区域使用?
Gemini 1.0 Pro 和 Gemini 1.0 Pro Vision 可在亚洲、美国和欧洲区域使用。
2、如何使用我的输入数据?
Google 通过健全的数据治理实践(包括审核 Google Cloud 在其产品开发中使用的数据),确保 Google 团队遵循我们的 AI/机器学习隐私权承诺。
3、我的数据会被缓存吗?
Google 可能缓存客户的 Gemini 模型的输入和输出,以加快对客户后续提示的回答速度。缓存的内容最多可存储 24 小时。默认情况下,系统会为每个 Google Cloud 项目启用数据缓存。Google Cloud 项目的相同缓存设置适用于所有区域。您可以使用以下 curl 命令来获取缓存状态、停用缓存或重新启用缓存。
4、如何解决发出 API 请求时的配额 (429) 错误?
需求过多或请求超出了每个项目的配额。请检查您的请求速率是否小于项目的配额。如需查看项目配额,请转到Google Cloud控制台中的配额页面。
总结
本文总结了获取Gemini-Google LLM(原名Bard)API密钥的详细步骤,从登录Google账户、访问Google AI Studio,到获取API密钥并进行初步可用性测试,为开发者提供了全面的指南。同时,文章还探讨了在使用Gemini API过程中需要考虑的关键因素,包括定价计划、费率限制、常见错误处理、SDK使用、可用能力和安全过滤器等,帮助开发者更有效地将多模态处理能力集成到应用中,并确保API调用的顺利进行。