近日,谷歌旗下 AI 模型 Gemini 在中文互联网上遭遇了一场“翻车式”的口碑滑铁卢。部分网友将其戏称为“北美大豆包”,戏谑其“又大又笨”,甚至直言其为“最蠢 AI”。这一辛辣调侃迅速引发热议:作为谷歌对标 ChatGPT 的王牌产品,Gemini 为何会落得如此评价?其实际使用体验究竟如何?

网友调侃背后:功能与预期的巨大落差

“北美大豆包”这个梗,源于 Gemini 早期在图像生成功能上的一桩“丑闻”。当用户要求生成“美洲殖民时期人物”或“二战德国士兵”时,Gemini 因过度追求“种族多样性”而强行给白人历史人物加入黑人、亚裔等非合理肤色,导致历史失真。这种“政治正确过头”的操作不仅让海外用户大跌眼镜,更被国内网友调侃为“北美大豆包”——外表光鲜,内里却像是被“注水”的廉价产品,笨重且不实用。

但“最蠢 AI”的标签,远不止于此。不少用户反映,Gemini 在应对中文语境下的复杂问题时,表现远逊于 ChatGPT 和国内的大模型。例如,有用户要求 Gemini 对一段包含双关、谐音梗的网络热词进行解释,Gemini 给出的答案要么文不对题,要么只能机械地拆解字面含义,完全无法理解其中的“梗文化”。相比之下,GPT-4 和文心一言等模型至少能尝试给出上下文关联解释。这种“水土不服”,让本就对谷歌 AI 期待不高的国内用户更加失望。

为什么 Gemini 会如此“难用”?

从技术层面看,Gemini 的“难用”并非偶然。首先,谷歌在 AI 模型训练上长期受制于“政治正确”的枷锁。为了规避种族、性别歧视等敏感问题,Gemini 的审核机制被过度强化,导致大量符合常理的输出被拒,或是给出“安全但无用”的废话。例如,有用户询问“如何评价某位历史人物的贡献”,Gemini 可能直接回复“为避免冒犯,我无法提供具体评价”。这种“过度防守”,让模型失去了实际对话价值。

其次,Gemini 在中文语料库的丰富度和精调程度上,明显落后于本土模型。尽管谷歌声称其多模态能力强大,但在实际使用中,用户发现 Gemini 对中文长文本的理解经常出现逻辑跳跃、甚至事实性错误。比如,有用户让它总结《红楼梦》中林黛玉的性格特点,Gemini 却引用了《水浒传》的人物关系。这种低级错误频出,让人怀疑其底层模型是否真的经过了充分的中文优化。

此外,生成速度与稳定性也是一大槽点。相比 ChatGPT 几乎秒回的输出,Gemini 的响应时间有时长达近一分钟,且频繁出现“服务不可用”或“生成被中断”的提示。有网友调侃:“每次等 Gemini 回复,都像是在等一个还没睡醒的程序员加班写代码。”

个人使用感受:理想丰满,现实骨感

作为长期关注 AI 产品的使用者,笔者曾对 Gemini 寄予厚望。毕竟谷歌拥有 DeepMind 的强大技术储备,其多模态能力应当超越文本生成本身。然而,实际体验后,笔者不得不承认:Gemini 更像是一个“实验室里的优等生”,而非“实战中的战士”。

在尝试使用 Gemini 辅助写作时,它常常给出风格生硬的表达,像是机器翻译的痕迹未清理干净。例如,让它写一段“夏日傍晚的公园场景”,Gemini 的回复是:“在夏季的傍晚,小型公园中的灯光开始闪耀,人们散步时记录生活的瞬间。” 这种文白夹杂、缺乏意境的句子,很难让人满意。而在翻译中文成语时,Gemini 更是频频翻车,将“杯弓蛇影”直译为“杯子弓蛇影子”,让笔者哭笑不得。

更令人沮丧的是,Gemini 的“主观意识”过强——它频繁拒绝回答本不属于敏感范围的问题,甚至对用户下达指令。比如,当笔者要求它“假设你是一位历史老师,分析秦朝灭亡的原因”,Gemini 却回复:“我不能提供假设性回答,因为这可能引起历史解读的争议。” 这种“爹味”十足的态度,让对话变得毫无乐趣,更谈不上“智能助手”的初衷。

结语:AI 竞赛中的谷歌正在“失速”?

总体来看,网友调侃 Gemini 为“北美大豆包”,虽然有夸张成分,但确实反映了其在实际应用中的尴尬处境:技术实力强大,却因过度保守和优化不足,沦为“中看不中用”的典型。在 ChatGPT 不断迭代、国产大模型飞速进化的当下,谷歌若不能尽快解决“政治正确绑架性能”和“本土化适配”这两大痛点,恐怕只会继续在“最蠢 AI”的争议声中,逐渐失去用户耐心。

对于普通用户而言,Gemini 目前更像一个“测试版”产品,距离“好用”仍有不小的距离。而那句“北美大豆包”的调侃,或许正是市场对谷歌 AI 策略的一次最直白的警示。