神秘AI工具「纳米香蕉」引流狂潮，LMArena流量暴涨10倍_硬件资讯

编辑：元宇

在2023年8月，一款名为「纳米香蕉」的神秘AI图像编辑工具异军突起，以惊人的速度登顶了Image Edit Arena的榜首，显著推动了LMArena的流量增长，实现了整整十倍的提升。月活跃用户数突破了300万大关，这一切都得益于纳米香蕉的出色表现和用户的热情参与。

自LMArena启动盲测以来，「纳米香蕉」在短短两周内便引发了超过500万次的投票，总投票量中，超过250万次为其直接投票，创下了历史的最高参与度。人们对纳米香蕉的神秘身份产生了诸多猜测，一度认为它是谷歌正式推出的产品，最终在谷歌确认将其命名为Gemini 2.5 Flash Image之后，得到了众人的认可。

LMArena不仅是一个图像编辑，更是一个为各大模型提供真实交互的。用户们在这里可以近距离接触各种最新的AI模型，参与投票并提供反馈，促使大模型之间进行激烈的比拼与评测。通过这种方式，LMArena为模型提供商提供了宝贵的真实用例数据，帮助他们更精准地进行产品迭代和优化。

「纳米香蕉」的火爆使LMArena的流量呈现出指数级增长，首席技术官Wei-Lin Chiang证实，的月活跃用户已经达到了300万。谷歌和LMArena毫问是这一波流量狂潮的最大受益者。

LMArena作为一个面向公众的评测，最初源于2023年伯克利大学的一项研究项目，原名Chatbot Arena。这个通过匿名、众包的方式进行评测，改变了以往依赖学科测试评估AI技术的传统做法。它允许用户自主选择模型进行评测和对比，用户的反馈直接影响着模型在榜单上的排名。

随着ChatGPT、Llama 1等大型模型的发布，LMArena吸引了越来越多的用户参与评测，迅速增长为行业内广受关注的评测。各个AI公司纷纷向LMArena申请将自己的产品纳入排行榜，渴望能在这个上获得更高的曝光和认可。正因如此，LMArena不仅成为了业界对AI性能评价的风向标，更成为科技公司密切关注的焦点，其重要性像华尔街的交易标的一般，让许多决策者把目光投向这里。

这场流量盛宴不仅取决于纳米香蕉自身的魅力，也归功于LMArena所营造的开放社区氛围。Wei-Lin Chiang希望这个能够真正服务于用户，让更多人参与进来，通过投票和交流表达自己的观点与偏好，从而帮助社区对模型进行更准确的评估和反馈。

在LMArena的流行过程中，「纳米香蕉」凭借匿名登场和盲测机制迅速赢得了用户的喜爱。普通用户无法直接选择纳米香蕉，只能在与其他模型的对战中偶然遇到它，这种千人千面的随机体验也激发了社区的热烈讨论，大家纷纷分享着「刷很多局才等到香蕉」的有趣遭遇。

Gemini 2.5 Flash Image在LMArena的评价中获得了双份荣誉，不仅在Image Edit Arena中名列前茅，同时在Text-to-Image领域也取得了耀眼的成绩。从LMArena的排行榜上还能看到各个领域表现最佳的模型。例如，编码领域的Dino排名最佳，创意领域则由Gemini稳居前列。这些榜单不仅为用户提供了选择的参考，也对AI厂商有所警醒，让他们意识到自己的技术所处的竞争环境。

业内大模型的厂商，如OpenAI、谷歌、Anthropic等，为什么都热衷于将模型放在LMArena等排行榜上？除了寻求品牌曝光，还希望能通过用户反馈来提升自身的技术竞争力。LMArena凭借百万次的投票与反馈数据，帮助这些公司清晰地看到市场反应，实现快速迭代。这种反馈机制，已经被Elo评分系统所强化，让每一个用户的投票都能真实反映出模型的性能表现。

Chiang希望将LMArena进一步打造成一个开放的空间，让所有用户都能参与到模型评测中来。LMArena不仅是模型之间的竞技场，更是一个真实的用户社群，鼓励不同的声音，构建一个全面的AI使用环境。

当所有模型逐渐逼近市场的标准时，对于新的基准测试需求是否依然存在？Chiang相信这种需求是极有必要的。新基准应该根植于真实的应用场景，通过与用户的真实需求接轨，推动AI的实际应用发展。例如，LMArena最新推出的WebDev基准测试，能够让用户通过提示词指示模型完成特定的任务。这样的基准将更紧密地结合技术与实际使用场景，为AI的发展打开新的路径。

随着AI技术的不断发展，LMArena正在成为推动行业前行的重要力量。无论是用户的积极参与，还是厂商的反馈与改进，这一切都建立在一个开放和透明的基础之上。正如Chiang所言，LMArena希望创建一个人人共建的评测，让更多的智慧汇聚在一起，共同推动AI的未来。