您好,欢迎来到一起上网站目录!
当前位置:一起上网站目录 » 站长资讯 » 行业新闻 » 文章详细 订阅RssFeed

冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

来源:站长之家 浏览:58次 时间:2025-02-06

声明:本文来自于微信公众号 机器之心,作者:机器之心,授权站长之家转载发布。

Jeff Dean:一次生成就能出正确代码。

DeepSeek 的强烈攻势下,这次轮到谷歌坐不住了。

本周三,该公司全面发布 Gemini2.0Flash、 Gemini2.0Flash-Lite 以及新一代旗舰大模型 Gemini2.0Pro 实验版本,并且还在 Gemini App 中推出了其推理模型 Gemini2.0Flash Thinking。

下图为三个模型在通用、代码、推理、事实性、多语言、数学、长上下文、图像、音频和视频等多领域任务中的性能指标。

在大模型排行榜上,Gemini2.0-Pro 在 Chatbot Arena 所有类别中排名第一。Pro 版在代码等复杂任务上表现突出,Gemini Advanced 用户目前已经可以在 App 上进行试用了。

与此同时,排名并列第三的 Gemini-2.0-Flash 已通过 Google AI Studio 和 Vertex AI 向开发人员广泛开放(价格是0.1美元 / M token),Flash-lite 也以更低的成本进入了前十。谷歌还在 Gemini 应用程序中推出了旗下「推理」模型 Gemini2.0Flash Thinking。

新版本 Gemini2.0可以做到很多以前做不到的事。谷歌首席科学家 Jeff Dean 表示 Gemini2.0Pro 模型可以编写完整的代码,包括所有正确的数据结构和搜索算法,一次尝试就可以获得正确的数据结构。

更多第三方试用的结果也已陆续出现在社交网络上,可见 Gemini2.0的性能提升明显,可以生成代码实现一些模拟物理规律的效果。

提示词:创建一个自行动的贪吃蛇游戏,其中100条蛇相互竞争。(单次尝试)

提示词:编写一个脚本,显示一个球在旋转的六边形内弹跳。球应该受到重力和摩擦力的影响,并且必须逼真地从旋转的墙壁上弹起,在 p5.js 中实现。(单次尝试)

提示词:编写一个 p5.js 脚本,模拟圆柱形容器真空空间中的25个粒子,它们在容器边界内弹跳。为每个球使用不同的颜色,并确保它们留下显示其运动的轨迹。添加容器的缓慢旋转,以便更好地查看场景中发生的事情。确保创建适当的碰撞检测和物理规则,以确保粒子留在容器中。添加外部球形容器。为整个场景添加缓慢放大和缩小效果。

种种迹象表明,进入2025年之后,全球大模型领域的竞争烈度又上了一个台阶。谷歌正式发布 Gemini2系列的同时,OpenAI 立即作出回应,宣布将其 AI 搜索功能面向所有免费用户开放。

值得注意的是,有媒体报道称在谷歌发布新模型之际,科技界的注意力仍然集中在 DeepSeek 上。DeepSeek 的模型在性能上媲美甚至超越了美国科技公司提供的领先 AI 模型。与此同时,企业可以通过 DeepSeek 的 API 以相对低廉的价格使用其模型。

谷歌和 DeepSeek 都在去年12月发布了 AI 推理模型,但 DeepSeek 的 R1模型获得了更多关注。现在,谷歌可能正试图通过其广受欢迎的 Gemini app,让更多人了解其 Gemini2.0Flash Thinking 模型。

至于 Gemini2.0Pro,作为谷歌去年2月推出的 Gemini1.5Pro 模型的继任者,谷歌表示它现在是 Gemini AI 模型家族中的领先模型。

在价格方面,谷歌将继续通过 Gemini2.0Flash 和2.0Flash-Lite 降低成本。两者均采用单一输入类型的定价模式,取消了 Gemini1.5Flash 中对短上下文和长上下文请求的区分。这意味着,尽管2.0Flash 和 Flash-Lite 在性能上有所提升,但在混合上下文工作负载下,两者的成本可能低于 Gemini1.5Flash。

谷歌 Gemini2.0三大模型:全方位加强

Gemini2.0Pro 实验版本

首次是新一代旗舰 Gemini2.0Pro 实验版本,它是谷歌迄今为止在编码和复杂指令任务中表现最好的模型。

在 Gemini2.0早期实验版本中(如 Gemini-Exp-1206),开发人员已经发现了这些模型的优势和最佳用例,比如编码、复杂指令。

此次,Gemini2.0Pro 实验版本进一步强化了这些功能,具备了最强大的编码性能和处理复杂指令的能力,并且比谷歌此前发布的任何模型都具备更好的理解和推理世界知识的能力。

据介绍,该模型支持了谷歌最长的200万 tokens 上下文窗口,可以处理2小时视频、22小时音频、6万+ 行代码和140万 + 单词,从而能够全面分析和理解海量信息。同时,该模型还支持调用 Google 搜索和代码执行等工具。

目前,Gemini2.0Pro 已经作为实验模型提供给 Google AI Studio 和 Vertex AI 的开发人员使用,并且 Gemini Advanced 用户在桌面和移动设备中也可以体验。

Gemini2.0Flash

其次来看 Gemini2.0Flash,它是谷歌 Flash 系列模型的最新「成员」。

在2024年谷歌 I/O 大会上,Gemini2.0Flash(实验版本)首次亮相,此后便作为强大的主力模型而深受开发者的喜爱,并最适合大规模处理高容量、高频率任务,并能够通过100万 tokens 上下文窗口对海量信息进行多模态推理。

当前,Gemini2.0Flash 已经在谷歌的 AI 产品中向更多人全面开放使用。据介绍,该模型提供了全面的功能,包括原生工具使用。目前支持文本输出,并即将推出图像生成与文本转语音功能,未来几个月还将提供多模态 Live API。

目前,用户既可以在 Gemini App 中试用该模型,也可以在 Google AI Studio 和 Vertex AI 中使用 Gemini API。

Gemini2.0Flash-Lite

最后是 Gemini2.0Flash-Lite,它是谷歌目前为止性价比最高的模型。该模型针对大规模文本输出用例进行了成本优化。

谷歌表示,他们收到了关于 Gemini1.5Flash 在价格和速度方面的积极反馈,并希望在保持成本与速度优势的同时继续提升模型质量。因此,Gemini2.0Flash-Lite 在性能上更强,在大多数基准测试中均优于1.5Flash,并且速度和成本相当。

此外,与2.0Flash 一样,Gemini2.0Flash-Lite 支持100万 tokens 上下文窗口和多模态输入。比如,该模型可以为大约4万张不同的照片生成相关的单行字幕(或标题),在 Google AI Studio 付费套餐中仅花费不到1美元。

目前,Gemini2.0Flash-Lite 在 Google AI Studio 和 Vertex AI 中提供公开预览版。

下图为三个模型的一些参数汇总,可以看出图像和音频功能即将上线。

改变游戏规则?

Gemini2.0全面开放后,其领先能力在机器学习社区被热烈讨论。有评论认为,在这代模型推出后包括 OCR 等一些领域的游戏规则已被改变。

Gemin2.0在处理真实文档时已经可以做到极高的准确率和低成本,实测很少会出现具体数值被误读的情况。除了表格解析之外,Gemini 在 PDF 到 Markdown 转换的所有其他方面可以始终提供近乎完美的准确性。所有特性结合在一起,你将获得一个极其简单、可扩展且便宜的索引流程。

我们一直在等的大模型技术革命,已经在很多领域出现了。

参考链接:

https://developers.googleblog.com/en/gemini-2-family-expands/

https://blog.google/technology/google-deepmind/gemini-model-updates-february-2025/

https://techcrunch.com/2025/02/05/google-launches-new-ai-models-and-brings-thinking-to-gemini/

https://news.ycombinator.com/item?id=42952605

推荐站点

  • 0502站长工具网0502站长工具网

    0502站长工具网为您提供json格式化,json代码压缩,json校验解析,json数组解析,json转xml,xml转json,json解析,json在线解析,json在线解析及格式化,unix时间戳转换,CSS美化压缩,json美化,json格式化输出,json数组,json实体类,json视图等

    www.0502.net
  • 24gym24gym

    24gym是国内领先的健身房智能化整体解决方案提供商,致力于研发健身领域的软硬件产品,打造24小时健身房,颠覆传统健身房,创建10分钟健身圈,欢迎意向投资健身房、智能健身房加盟的人士与我们联系,将为你提供健身房经营更优解决方案。

    www.24gym.cn
  • 堆糖堆糖

    堆糖,美图壁纸兴趣社区。收录几十亿高清优质图片,数千万用户的珍藏分享,一键收藏下载美图,点亮生活无限灵感,做你的美好研究所:拥有高清壁纸、情侣头像、明星爱豆、影视动漫、情感文字、表情包、绘画手帐、P图教程、美妆穿搭、歌词台词、可爱萌宠等多种图片分类。你想要的风景壁纸、聊天背景、朋友圈背景、动漫头像都可以在这里找到。

    www.duitang.com
  • 图片之家图片之家

    图片之家_是以摄影图片大全为主国内综合性图片的网站,致力于打造各类好看的图片,包括奇闻异事图片,装修效果图,搞笑图片,搞笑动态图片,美女图片,美女人体艺术,发型图片,创意家居,创意广告设计,桌面壁纸,摄影作品等精选图片大全等你来挖掘。

    www.tupianzj.com
  • 煎蛋煎蛋

    煎蛋以译介方式传播网络新鲜资讯

    jandan.net