2月5日谷歌宣布,其最新AI模型套件Gemini 2.0正式向所有用户开放使用。据谷歌表示,这是该公司迄今为止“最强大”的AI模型套件。
此前在去年12月,谷歌仅向开发者和受信任的测试者开放了部分功能,并将一些特性整合进谷歌的核心产品。如今全面开放后,所有新模型都可通过谷歌AI Studio和Gemini API供开发者使用。
Gemini 2.0套件包括三款针对不同应用场景的子模型:
Gemini 2.0 Flash:被称为“主力模型”,适用于高容量、高频率任务,现已全面上市。
Gemini 2.0 Pro:专注提升编程性能,是迄今为止最出色的编程支持工具,支持200万tokens的输入容量,能够一次性分析和处理大量信息,现已发布。
Gemini 2.0 Flash-Lite:谷歌称其为“迄今为止最具成本效益的模型”,其成本和速度均优于1.5 Flash,具有100万个tokens上下文窗口和多模式输入,现已公开发布预览版。
模型特性
Gemini 2.0 Flash 提供了一套全面的特性,包括原生工具使用、100 万 Token 上下文窗口和多模态输入。目前,它支持文本输出,而图像和音频输出功能以及多模态 Live API 计划在未来几个月内全面推出。Gemini 2.0 Flash-Lite 经过成本优化,适用于大规模文本输出用例。

模型性能
Gemini 2.0 模型在各种基准测试中,相较于 Gemini 1.5 实现了显著的性能提升。

与 之前的模型 类似,Gemini 2.0 Flash 默认采用简洁风格,这使其更易于使用并降低了成本。此外,它还可以通过 提示 来使用更详尽的风格,从而在面向聊天的用例中获得更出色的结果。
Gemini 2.0 定价
Google 持续 通过 Gemini 2.0 Flash 和 2.0 Flash-Lite 降低成本。这两款模型都对每种输入类型采用单一价格,取消了 Gemini 1.5 Flash 在短上下文请求和长上下文请求之间所做的区分。这意味着,尽管 2.0 Flash 和 Flash-Lite 都带来了性能提升,但在混合上下文工作负载下,它们的成本可能比 Gemini 1.5 Flash 更低。

注:对于 Gemini 模型,一个 tonkes 大约相当于 4 个字符。100 个词元大约相当于 60-80 个英语单词。
横向对比API价格,Gemini 2.0 Flash和Lite的输入价格分别为0.10美元/每100万Tokens,以及0.075美元/每100万Tokens。用谷歌自己的话来讲,就是使用Gemini 2.0 Flash-Lite模型,为4万张独特图片各生成1行标题,所需的费用大约为1美元。
在击中缓存的情况下,价格将下降至0.025美元/每100万Tokens(不包含音频)和0.01875美元/每100万Tokens。
在同样的条件下,OpenAI的性价比模型(gpt-4o-mini)最低只能做到0.075美元/每100万Tokens。
目前性价比更加突出、性能更强的DeepSeek-V3模型,在集中缓存的情况只需要0.014美元/每100万Tokens。不过DeepSeek已经宣布,从2月8日开始,价格会翻5倍至0.07美元/每100万Tokens。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...