全新通用大模型Gemini基准测评30项碾压GPT-4,谷歌演示视频上演现实版的“贾维斯”

来源: aicg搜索 日期:2025-05-08 12:20:50
aicg搜索首页AI教程资讯 → 全新通用大模型Gemini基准测评30项碾压GPT-4,谷歌演示视频上演现实版的“贾维斯”

最新更新:当地时间12月8日,谷歌发言人在外媒彭博社的采访中承认,官方发布的 Gemini 演示视频并非真实交互效果实时录制。换而言之,仅仅只是广告效果。


谷歌于2023年12月8日发布了Gemini大模型,这是一款由6000亿个参数组成的多模态语言模型。Gemini是谷歌人工智能团队在LaMDA和PaLM的基础上开发的,能够处理文本、代码、音频、图像和视频等多种格式的信息。 Gemini在32项学术基准测试中都达到了SOTA水平,在MMLU测试中,Gemini Ultra的得分率高达90.0%,是第一个超过人类专家的模型。

谷歌Gemini大模型里边体积最小的Gemini Nano搭配AICore, 可用 LoRA 来做 Fine Tune。

这天迟早要来,但没想到这么快!

简单的一张架构图,开启在智能手机上实现大语言模型和生成式 AI 的序幕。

变革应该只是开始而已,将来做 IC 设计 、 AI Compute Architecture 和手机上的生成式 AI 应用的等等,未来几年有得忙了!

这段谷歌的Gemini演示Demo视频,简直可谓是现实版的“贾维斯”,非常震撼,很好的展示了多模态大模型的未来!

【视频简介】

视频中展示了谷歌Gemini大模型的各种功能,如识别使用者画的图、猜出手部游戏的答案等,甚至还能理解手绘图中的逻辑并播放音乐。这标志着谷歌在AI领域取得了巨大进步。

【视频时间戳】

谷歌全新多模态大型语言模型Gemini,涵盖文字、声音、图像和影片处理,适用于不同应用场景。

00:01谷歌发布多模态大型语言模型Gemini

00:31 鸭子识别:Gemini能够识别使用者画的鸭子并调侃鸭子的颜色

01:08手绘图识别:Gemini能够识别手绘图,并推理出其中的逻辑,还能够识别手绘图中的文字

读完这篇文章后,您心情如何?

  • 0 喜欢喜欢
  • 0 顶
  • 0 无聊无聊
  • 0 围观围观
  • 0 囧
  • 0 难过难过
相关资讯
推荐阅读
网友评论

热门评论

最新评论

发表评论

昵称:
表情: 高兴 可 汗 我不要 害羞 好 下下下 送花 屎 亲亲
字数: 0/500 (您的评论需要经过审核才能显示)
相关推送
1CodeGeex查看 2免费ChatGPT中文版—ChatGai查看 3AI提示语查看 4Tiamat AI查看 5BibiGPT - AI音视频一键总结查看 6Replace Background— ClipDrop查看 7iFoto查看 8 AutoDraw查看
AI使用攻略
更多+

CG艺术长廊 | AI技术前沿 | 创新应用案例 | 行业深度解析 | 搜索技巧指南 | 社区互动论坛 | AI教程资讯 | 网站地图

Copyright 2009-2016 //www.aisoh.cc/ 版权所有