Gemini Pro 模型的初学者指南

一.什么是Gemini?

上个月,谷歌宣布推出 Gemini 最新、最强大的人工智能模型,旨在与 OpenAI 的 GPT 正面交锋。Gemini 在构建时考虑到了多模态,这意味着它能够理解文本、图像、视频、音频和代码。

Gemini一共有三个版本。Nano 和 Pro 现在已经上市,“Ultra”将于明年初上市

一.

二.什么是Goohle AI Studio?

Google AI Studio是一个是一个免费的基于网络的工具,提供访问谷歌的人工智能生成模型,包括双子座。它可以让你轻松地测试谷歌的人工智能模型,并试验不同的场景和用例。GoogleAI Studio 允许您导出许多流行编程语言的代码,包括 Python、 JavaScript 和其他语言。

三.如何使用Goohle AI Studio?

让我们首先浏览一下 Google AI Studio 的用户界面,看看如何立即开始测试并为我们的应用程序生成代码。

访问 Google AI Studio

先说第一件事!前往 Google AI 网站并使用您的 Google 帐户登录。

单击“在 Google AI Studio 中获取 API 密钥”后,您将被重定向到我们将创建第一个提示的主页。

创建新提示

单击“新建” (如下所示)后,您将有几个选项可供选择。继续并选择“自由格式提示”。它只是一个交互式文本区域,您可以在其中编写提示并从模型生成响应。

Gemini Pro 与 Gemini Pro Vision

目前,Vertex AI Gemini API 和 Google AI Studio 支持以下模型:

  • Gemini Pro: 用于自然语言任务、多轮文本和代码生成。
  • Gemini Pro Vision: 支持多模态提示。这意味着提示可以包括文本、图像和视频。

选择 Gemini Pro Vision 进行多模式提示

好的,对于这个示例,我们将切换到Gemini Pro Vision模型并编写由文本和下面的图像组成的多模式提示:

Gemini 将处理文本提示,然后识别图像中的内容,然后根据给定的信息响应提示。

我们开始做吧:

  1. 输入我们的提示
  2. 插入我们的图片
  3. 单击“运行”(或者,您可以使用CMD+return)

什么在这种情况下,Gemini Pro Vision 犹豫了一下并做出了如下回应:

“纯素食者不食用任何动物产品,因此不会喝牛奶。可以订购植物性牛奶替代品,例如燕麦奶、豆奶或杏仁奶。”

我向 GPT-4 询问了同样的问题,这就是答案:

您提供的图片显示了一杯咖啡,饮料表面似乎有拿铁艺术。如果饮料是用牛奶制成的,则它不适合纯素食者,就像纯素食者一样不食用乳制品。然而,如果用来制作拉花艺术的牛奶是植物性替代品,例如豆奶、杏仁奶、燕麦奶或任何其他不含乳制品的牛奶,那么它就适合纯素饮食。”

总体体验下来觉得,还是先用GPT-4V吧