谷歌Gemini 1.5 Pro在基准测试中超越GPT-4o，成为新一代AI模型霸主

linx阅读：2024-09-16 08:40:05

生成式人工智能领域迎来了新霸主——Gemini 1.5 Pro。在8月1日的**基准测试中，谷歌的这款新模型超越了OpenAI的GPT-4o，成为了新的**。

谷歌Gemini的突围

尽管谷歌的Gemini 1.5 Pro在发布时并未大张旗鼓，但它迅速引起了人工智能社区的关注。该模型的实验版本被标记为“实验性”，但其**的基准测试成绩使其成为了讨论的焦点。

基准测试的变革

自GPT-3问世以来，OpenAI的ChatGPT一直在生成式AI领域占据主导地位。特别是GPT-4o与Anthropic的Claude-3，在大多数主流基准测试中均遥遥**。最受欢迎的测试之一是LMSYS Chatbot Arena，该测试评估模型在各种任务中的能力。

在**的基准测试中，GPT-4o的得分为1,286，Claude-3则获得了1,271分。Gemini 1.5 Pro的前一个版本得分为1,261，而新发布的实验版本（Gemini 1.5 Pro 0801）则以1,300分打破了记录。这一成绩显示，Gemini 1.5 Pro在总体表现上超越了目前的竞争对手。

AI社区的兴奋

尽管基准测试提供了有价值的比较，但它并不总能**反映AI模型的实际能力。随着市场上AI聊天机器人的逐渐成熟，用户**将决定哪种模型最适合他们的需求。

Gemini 1.5 Pro的发布在社交媒体上引发了热烈讨论。许多用户对其表现赞不绝口，一位Reddit用户甚至表示，该模型“**超越了4o”。

尽管Gemini 1.5 Pro的实验版本目前广泛可用，但由于其处于早期测试阶段，未来是否会成为默认版本尚未确定。谷歌可能会根据测试反馈进行调整或撤销该模型，以确保其安全性和稳定性。

本文地址：https://licai.bestwheel.com.cn/qk/30339.html

文章标题：谷歌Gemini 1.5 Pro在基准测试中超越GPT-4o，成为新一代AI模型霸主