河马

注册

 

发新话题 回复该主题

大模型聚会国内卷价格,国外卷能力 [复制链接]

1#

在中美AI大模型的竞争上,正衍生出两种不同的路径。

继北京时间5月14日凌晨OpenAI春季发布会上,OpenAI推出兼具听、看、说能力的GPT-4o后。北京时间5月15日凌晨谷歌I/O开发者大会上,谷歌CEO桑达尔·皮查伊发布数十款Google和AI结合产品,堪称“全家桶”级别,全面围剿OpenAI。

其中包括支持万token长文本的Gemini1.5Pro和Gemini1.5Flash,对标Sora的Veo,开源模型Gemma2,支持生成式搜索的AIOverviews、第六代TPU等。

整场开发者大会最大的看点为,谷歌推出的AI语音助手——Astra,它能够通过摄像头识别物体、代码和各种东西。现场演示视频中,用户要求Astra在看到发出声音的东西时告诉她,助手回答说,它可以看到一个发出声音的扬声器。对于一闪而过的苹果,Astra居然也能够准确回答出在眼镜旁边。

除Astra外,谷歌还推出基于Gemini的多款通用AIAgent子系列产品。如音频的NotebookLM、音乐的MusicAISandbox、视频的Veo、图像的Imagen3,直接对标OpenAI发布的GPT-4o、Dall-E和Sora。

和谷歌、OpenAI围绕技术之争不同的是,国内大模型或将迎来价格战时代。在5月15日字节举办春季火山引擎Force原动力大会上,字节推出3款AI产品,包括AI生图产品PicPic、AI教育产品河马爱学、AI剧情互动产品猫箱。

除这三款产品外,字节面向TOC端的产品还包括定位AI教育的Gauth,定位AI对话的豆包和CiCi;定位AI工具的小悟空ChitChop;定位AlBot创建平台的Coze和扣子;定位AI互动剧情的BagelBel等。

但字节率先启动行业价格战,火山引擎总裁谭待表示,豆包大模型将开启付费商业化,且定价远低于行业价格。以豆包通用模pro-32k版为例,模型推理输入价格仅为0.元/千Tokens。市面上同规格模型的定价一般为0.12元/千Tokens,是豆包模型价格的倍。

字节本轮降价后,后续国内其他大模型厂商或将跟随。但降价能否帮助国内大模型厂商带来更多新增用户和付费用户,仍值得商榷。

GPT-4o和谷歌Gemini不断宣传现阶段AI能力大幅度提高,两家谁的大模型能力更强呢?基于此,我们也对GPT-4o和Gemini展开了多维度的测试。

01.文本输出:Gemini和GPT-4o愈发接近,部分能力已赶超

因GPT-4o和Gemini均属于世界TOP级的大模型,在测试两家大模型的文本输出能力上,我们直接将难度升级。

为什么很多国家仍以油车为主?你觉得影响新能源汽车海外渗透率提高的因素有哪些?我们将这一问题同时给到GPT-4o和Gemini,二者均指出充电基础设施建设、购置成本、技术进步、政策支持、消费者文化习惯是很多国家仍以燃油车为主的原因。

但相较于GPT-4o,Gemini不仅识别到我们提问的是两个问题,且均给出答案,也回答出GPT-4o没有指出的车企方面、宣传教育方面的问题。也就是说,Gemini的回答可能更为完整。

图源:基于Gemini和GPT-4o生成内容整理DoNews制图

我们继续追问要求两个大模型同时给我们撰写一份字全球新能源汽车报告,并要求报告中需要包括行业价格战、电池技术、未来发展方向、产业趋势。

但此时两个大模型的表现已经出现明显差异,GPT-4o给我们生成七大章节的框架,每个框架下也要对应的小框架。但就是不输出我们要求的内容,这或许和当前GPT-4o在长文本能力上的欠佳有关。

图源:GPT-4o

分享 转发
TOP
发新话题 回复该主题