谷歌大模子Gemini能否打败GPT4？-香港期货-远大期货｜香港远大国际期货【官方网站】

新闻资讯

RESEARCH CENTER

新闻资讯

主页-新闻动态-新闻资讯- 谷歌大模子Gemini能否打败GPT4？-香港期货

谷歌大模子Gemini能否打败GPT4？-香港期货

2023-12-07｜来源:远大期货

‍"幽静"已久的谷歌终于放大招了。

美国当地时间12月6日，谷歌宣布多模态大模子Gemini。谷歌DeepMind直接宣布，Gemini是“谷歌*、最强的人工智能模子”。

Google Deepmind 的官方账号截图，泉源：谷歌DeepMind

Gemini谷歌是重新最先构建的多模态模子，这也是更靠近人类熟悉天下的方式。

作为谷歌用来应对GPT-4的“杀手锏”。Gemini在32个多模态基准测试中取得了30个SOTA（State Of The Art，即当前*效果）的纪录，是*个在MMLU（大规模多义务语言明白）测评上跨越人类专家的模子。Gemini在此项取得的成就是90.0%，作为对比，人类专家的成就为89.8%，GPT-4为86.4%。

Gemini共有三个版本：

Gemini Ultra：适用于高度庞大的义务；

Gemini Pro：适用于扩展至种种义务的Gemini模子；

Gemini Nano：体量较小，适用于特界说务和移动装备。

"Gemini的多样性让它能够在从移动装备到大型数据中央的所有装备上运行。"谷歌DeepMind产物副总裁Eli Collins说，“我们离新一代人工智能模子的愿景越来越近了。”

“有了人工智能，我们将有时机以更大规模做一些主要的事情。”谷歌CEO Sundar Pichai在谷歌确立25周年公然信中就特意提到了人工智能。面临强势的OpenAI，优等生谷歌需要一款征象级产物，证实自己在人工智能领域的实力。

Gemini就是谷歌交出的答卷。

1、“打的就是精锐”

谷歌的Gemini模子的焦点优势在于其原生多模态（natively multimodal）的特征。

以往的多模态大模子往往是通过划分针对差异模态训练单独的组件，再将这些组件组合起来以模拟多模态功效的方式构建的。虽然在某些义务（好比图像形貌）上显示优越，但在处置需要更深条理看法明白和庞大推理的义务时，它们的显示往往不尽人意。

而谷歌的Gemini模子从一最先就在差异模态上举行预训练，再通过使用分外的多模态数据举行微调，进一步提升了模子的有用性。这种原生的多模态训练方式使得Gemini在处置多种类型的数据和庞大义务时更为高效和精准，从而在多模态人工智能领域树立了新的尺度。

而且，Gemini的推出主要是"瞄准OpenAI的GPT-4"而来。用《亮剑》里李云龙的话来说就是——“打的就是精锐”。

在运算效能方面，Gemini险些“周全吊打”GPT-4。Gemini Ultra在大模子研发被普遍使用的32个学术基准测试集中，在其中30个测试集的性能跨越此前SOTA效果。其中，在多选问题、数学问题、Python代码义务、阅读等方面，Gemini的性能都跨越了此前*进的水平。

谷歌称，他们对MMLU接纳了新的基准方式，使Gemini能够行使推理能力在回覆难题之前举行更仔细的思索，相比仅仅凭证问题的*印象作答，Gemini的显示有显著改善。

Gemini Ultra在多个编码基准测试中显示精彩，包罗HumanEval和Natural2Code。其中仅Gemini仅在HellaSWAG数据集上的测试逊色于GPT-4。

HellaSWAG数据集主要用于研究扎根的知识推理能力，然则一位NLP领域的研究专家向「甲子光年」示意："这并不能说明GPT4的知识推理性能更好，由于不能清扫ChatGPT的模子在HellaSWAG数据集上训练过。"

Gemini模子与GPT-4部门测试评分对比，图片泉源：谷歌

此外，在多模态方面，Gemini Ultra在新的MMMU基准测试中取得了59.4%的*进得分，突显了其多模态性和庞大推理能力。

在图像基准方面的测试中，Gemini Ultra不需要从图像中提取文本就能举行OCR处置，显示优于之前*进的模子。

Gemini模子在多模态方面的与GPT-4V的测试对比，图片泉源：谷歌

县城咖啡生计考察-国际黄金

Gemini 1.0被训练用于同时识别和明白文本、图像、音频等，因此它能更好地明白具有细微差其余信息，回覆与庞大主题相关的问题，尤其善于注释数学和物理等庞大科目中的推理。

“推理缺陷”也是GPT系列存在的问题。著名语言模子指斥者Gary Marcus博士曾锐评道：“大语言模子没法做一些有严酷界说的事情：遵守国际象棋规则、五位数字相乘、在家谱中举行可靠的推理、对照差异物体的重量等等。”

只管手艺提高显著，但AI天生的虚伪或捏造信息的问题依然存在。Eli Collins指出，这仍是一个未被完全解决的研究难题。

但他同时也强调，Gemini接受了谷歌迄今最为周全的平安评估，以确保其可靠性和平安性。谷歌对Gemini举行了一系列匹敌性测试，模拟恶意用户使用模子，并输入种种提醒词，以检测模子是否会发生愤恨言论或显示出政治私见。这些测试包罗了“真实毒性提醒词”，由网络网络的跨越10万个提醒词组成，用以周全磨练模子的反映。

值得注重的是，Gemini是在谷歌自研的云芯片Tensor Processing Units（TPU）上完成训练的。稀奇是TPU v5p版本，在性能上有了显著提升，使得模子训练速率相比前一代提高了2.8倍。据悉，TPU v5p芯片是专为数据中央训练及大型模子运行而设计。

从12月13日起，开发职员和企业客户可以通过Google AI Studio或Google Cloud Vertex AI来接见Gemini Pro模子。Google AI Studio是一个基于网络的免费开发工具，为开发职员提供API密钥，从而快速确立原型并启动应用程序。Vertex AI提供了定制化的Gemini以提供更为周全和治理的人工智能平台，并具有完整的数据控制功效，能行使谷歌云的分外功效，包罗企业级的平安性、隐私珍爱以及数据治理和合规性。

此外，从Pixel 8 Pro装备最先，Android开发职员还可以通过Android 14中的新系统功效AICore来使用Gemini Nano。Gemini Nano是专为装备端义务设计的高效模子，通过注册AICore的早期预览版，开发职员可以深入探索其潜力，更便捷地行使Gemini的先进手艺，并在Android生态系统的应用开发中迸发更多可能性。

到2024年，谷歌设计推出Bard Advanced，它与AI agent的低级形态十分相似。Bard Advanced将借助Gemini Ultra提供支持，可以迅速明白多模态输入，包罗文本、图像、音频和视频，并作出响应的响应。

2、谷歌 VS OpenAI

在OpenAI的GPTs大放异彩时，谷歌似乎过于幽静了。

今年2月，谷歌在巴黎举行流动时，因其谈天机械人Bard的一处失误，市值蒸发了1000亿美元，也引发了外界对于Bard准确性的担忧。

随着OpenAI推出了ChatGPT，尤其是在必应搜索中整合了GPT手艺，并首次在应用程序下载量上逾越了谷歌后，人们最先思索谷歌是否在已人工智能领域落伍于竞争对手。

事实上，谷歌才是在2017年提出的Transformer模子、为今天这场游戏制订规则的先行者。

谷歌对大模子"高地"的竞争意识并不比OpenAI晚。2021年，谷歌便推出了1.6万亿参数的Switch Transformer，强调希罕多模态结构的潜力。同时，谷歌还提出了Flan-T5模子，通过更多监视数据降低了模子规模，比GPT-3模子参数更少但性能更佳。

对于手艺上的评估，《经济学人》在今年1月曾举行了一项对照测试，向ChatGPT和谷歌基于Lamda的机械人Bard提出了数学、阅读和约会建议等问题。

测试效果显示，谷歌AI在数学问题上显示更佳，但ChatGPT在知识问题上更准确。几天后OpenAI升级了ChatGPT，再次测试中在数学问题上与谷歌AI持平。只管ChatGPT作为一个大型语言模子训练成本高、迭代难，但也显示了它连续进化的伟大潜力。值得注重的是，谷歌的语言模子与ChatGPT在性能上是旗鼓相当的。

在这场对决中，谷歌和微软都需要成本效益更高的解决方案。谷歌在AI领域取得了不少研究希望，但尚未将这些功效部署和变现，类似于微软在已往的某些时期。这可能是由于谷歌低估了微软和OpenAI的竞争实力，或者过于自信于自己在搜索引擎领域的主导职位。

「甲子光年」综合多方看法剖析得出，谷歌在手艺前瞻性上*，OpenAI更专注于产物的打磨。

在Sam Altman向导下的OpenAI专注于产物为导向的事情，致力于扩展和优化模子，主要关注细节精调方式。

谷歌则在手艺生长的偏向上始终保持着起劲和前瞻的态度，不外在整体战略设计上却频频调整。

谷歌在希罕模子架构上举行了深入探索。只是两年后的，万亿级其余Switch Transformer险些没发生任何水花，而千亿参数级其余GPTs系列却风生水起。同样，被频频改善的Flan-T5模子虽然在性能上逾越了GPT-3，但其优化希望相对缓慢。

在谷歌"选择难题症"时代，OpenAI已经完成了对ChatGPT的训练。

在2022年9月，谷歌旗下的DeepMind推出了麻雀（Sparrow）模子，和ChatGPT一样，接纳了基于人类反馈的强化学习（RL）框架。该模子接纳了小型参数设置，与谷歌看重的LaMDA和PaLM模子的思绪有显著差异。只是谷歌并未能迅速确定麻雀模子是否是*选择，这也导致了麻雀模子的产物化滞缓，最终未能"飞上枝头变凤凰"。

"犹豫不决"似乎一直是谷歌的宿疾。“但迟到总比不做好！终于有了OpenAI王座的有力竞争者。”在Google宣布新闻后，英伟达AI科学家Jim Fan谈论道。

今年4月，谷歌将Google Brain和DeepMind团队合并，确立 Google DeepMind。有人将这一团队戏称为“AI复仇者同盟”。原Google AI产物认真人Eli Collins被委以重任，担任新团队的产物副总裁。

现在，Gemini Pro和Gemini Nano已在谈天机械人Bard和智能手机Pixel 8 Pro上集成，实现了更为高级的推理、设计、明白等能力。而更为壮大的Gemini Ultra将在明年宣布。

不知OpenAI会若何"应战"呢？或许我们很快便可以等到GPT-5的宣布了。

不外，优等生谷歌并不完全在意这一时之战，而是在着眼未来。

“我们对谜底的探索将在未来25年推动特殊的手艺提高。到2048年时，若是有一位青少年在天下上的某个地方，看着我们用人工智能制作的一切耸耸肩，我们就知道我们乐成了。然后，我们就回去事情。”谷歌CEO Sundar Pichai在谷歌确立25周年公然信中如是说。

目录

首页

关于我们

客户服务

交易产品

软件下载

新闻动态

联系我们

加盟代理

新闻资讯

新闻资讯

投资策略

最新公告

精彩专题

大咖分享

新闻资讯

谷歌大模子Gemini能否打败GPT4？-香港期货

2023-12-07｜来源:远大期货

返回列表

上一篇：昆山新设3支基金，总规模达15亿元-香港期货

下一篇：告辞加拿大鹅的年轻人-香港期货

关于我们

远大国际期货（香港）有限公司前身是一家拥有超过15年历史的证券和期货公司，于2000年10月4日正式注册成立，目前经营环球期货经纪业务，香港交易所期貨交易商。

联系我们

在线客服

客服QQ

客服热线