2023年12月13日·阅读约1分钟

Google 推出经过进化的多模态 AI 模型 Gemini Pro,用于开发目的

Google 的多模式 AI 模型 Gemini Pro 的最新进展为开发人员提供了更多工具。

Google 推出经过进化的多模态 AI 模型 Gemini Pro,用于开发目的

最近,科技巨头Google公布了与其新推出的多模态人工智能模型 Gemini 相关的一系列创新更新。就在这一尖端技术发布一周后,该技术有望增强开发人员的创意工作。

在揭幕时,谷歌强调了 Gemini 的三个不同版本的可用性:Ultra、Pro 和 Nano。这些是根据不同的尺寸和复杂性要求量身定制的。值得注意的是,Gemini Nano 已随 Pixel 8 Pro 融入 Android 中。此外,Google Bard 现在受益于 Gemini Pro 的改编版本。

Google开辟了新天地,现已宣布开发人员可以通过 Gemini API 访问 Gemini Pro 提供的广泛功能。开发人员可以使用函数调用、嵌入、语义检索、自定义知识基础和聊天功能。

还向开发人员介绍了使用 Gemini Pro 的两种主要方式:Google AI Studio 和 Google Cloud 上的 Vertex AI。 Google AI Studio 被认为是一个简单的起点,它提供了一个基于网络的开发工具、每分钟 60 个请求的免费配额以及快速启动模板,以帮助开发人员轻松进入该模型。

谷歌在 Google Cloud 上的 Vertex AI 被誉为更复杂的选择,它是一个机器学习平台,允许完全定制 Gemini。通过加载其他实用功能,例如完整的数据控制以及与其他 Google Cloud 模块的集成,开发人员可以满足安全、隐私和治理需求。

目前,在 Vertex AI 中使用 Gemini 是免费的,费率与 Google AI Studio 的免费配额相同。尽管如此,该规定仅持续到其普遍可用(预计在明年)为止。此后,1000 个字符的费用为 0.00025 美元,每张图像的费用为 0.0025 美元。

Google 详细阐述了 Vertex AI 环境的复杂功能,包括利用公司数据增强 Gemini 的能力,以及在类似于 AppMaster 等强大平台所提供的low-code环境中开发搜索和对话代理的能力。

目前,Gemini Pro 接收并输出文本。但对于渴望尝试图像的开发人员来说,专用的 Gemini Pro Vision endpoint可以接受图像和文本并输出文本。

谷歌预计将于明年初推出 Gemini Ultra,进一步激发了人们的期待。这是一个针对更复杂任务的更大模型。谷歌还考虑将 Gemini 与 Chrome 和 Firebase 开发者平台集成。

今天,这家科技巨头的图像生成模型 Imagen 2 的升级版也正式发布。该模型现已向 Google 许可名单中的所有 Vertex AI 用户开放。

Imagen 的这一高级迭代能够在自然语言提示的指导下生成美观、高质量且逼真的图像。其引人入胜的新功能包括用于在图像上创建文本叠加的文本渲染、徽标生成以及用于生成标题的视觉问题和答案。

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started
Google 推出经过进化的多模态 AI 模型 Gemini Pro,用于开发目的 | AppMaster