2026/2/11 2:55:40
网站建设
项目流程
做淘宝网站规范 百度知道,天津市企业网站设计公司,typecho 抄wordpress,创意网站建设价格多少有这么一个神仙平台。
大厂把它当成新模型的「试炼场」。DeepSeek、OpenAI、谷歌#xff0c;都曾在这里秘密测试。
普通用户可以在这里薅羊毛。
你可以免费体验 GPT-5.2、Gemini 3 Pro、Claude Opus 4.5、Grok 4.1#xff0c;还有 DeepSeek、智谱、MiniMax 这些国产大佬。…有这么一个神仙平台。大厂把它当成新模型的「试炼场」。DeepSeek、OpenAI、谷歌都曾在这里秘密测试。普通用户可以在这里薅羊毛。你可以免费体验GPT-5.2、Gemini 3 Pro、Claude Opus 4.5、Grok 4.1还有 DeepSeek、智谱、MiniMax 这些国产大佬。图像模型可以免费用Nano Banana Pro、GPT-Image-1.5和FLUX 2。两周前这个平台刚完成 1.5 亿美元 A 轮融资估值 17 亿美元成了独角兽。从伯克利两个博士生的校园项目到 17 亿美元用了不到三年时间。昨天它又上线了 Video Arena 网页版。15 个顶级视频模型免费玩Veo 3.1、Sora 2、可灵 2.6 Pro、Seedance v1.5 Pro、Wan 2.5、Hailuo 2.3全都有。它就是 LMArenalmarena.ai。LMArena 不测跑分只测「真人偏好」。你输入一个问题系统随机分配两个匿名模型回答。你不知道谁是谁只能凭回答质量投票选出更好的那个。投票后才揭晓身份。就像开盲盒。600 万次真人投票累积下来平台用类似国际象棋 Elo 评分系统计算排名。赢一场加分输一场扣分最终形成大模型榜单。没有标准化试卷题目来自全球 150 个国家、500 万月活用户的真实提问。跑分可以刷榜让模型提前背答案。但真人投票很难作弊。所以大厂都认这个榜。OpenAI、谷歌、Anthropic、xAI新模型发布前都会先送测 LMArena。LMArena 有个传统新模型发布前厂商会取个代号匿名测试。DeepSeek R1正式发布前几个月就在这里偷跑了。OpenAI 的GPT-5代号「summit」谷歌Gemini 2.5 Flash Image代号「nano-banana」后者曾经红极一时登顶图像生成和编辑榜榜首。这个平台 2023 年还只是伯克利两个博士生的校园项目叫 Chatbot Arena。顾问是 Ion StoicaDatabricks 联合创始人。2025 年 5 月商业化拿了 a16z 领投的 1 亿美元种子轮。8 个月后又完成 1.5 亿美元 A 轮估值 17 亿成了独角兽。现在年化收入超 3000 万美元靠企业付费评测养活。测试和公开榜单对普通用户免费。LMArena 最初只有文本对话一个赛道现在已经扩展到八个。想聊天有Gemini 3 Pro、GPT-5.2、Claude Opus 4.5、Grok 4.1还有DeepSeek R1、GLM-4.7。谷歌目前霸占着 Text Arena 的榜首。想让 AI 看图说话Vision Arena 里谷歌同样遥遥领先。想写代码Code Arena曾叫 WebDev Arena可以一键生成前端页面让你打分。Claude Opus 4.5稳居第一Anthropic 在编程这个赛道杀疯了。想生成图片Text-to-Image Arena 累计超 420 万票GPT-Image-1.5、FLUX 2、Ideogram 3都能免费用。国产的腾讯Hunyuan Image 3.0和字节Seedream 4.5也榜上有名。想修图Image Edit Arena 里 OpenAI 刚反超谷歌拿下榜首。谷歌的Nano Banana Pro屈居第二累计 50 万票。想生成视频昨天刚上线的 Video Arena 有 15 个顶级模型Sora 2 Pro和Veo 3.1并列第一。这些平时要付费的模型在 LMArena 上全免费。那么怎么用打开lmarena.ai直接输入问题你甚至都不用注册。默认是 Battle 模式。你输入问题系统随机分配两个匿名模型回答你按照结果投票投完才揭晓背后的模型。划重点这个模式有机会遇到还没发布的神秘模型。比如谷歌即将发布的Gemini 3 Flash Image也就是大香蕉Nano Banana Pro的弟弟。如果你想指定模型对比点击左上角的「Side-by-Side」手动选两个模型 PK。比如想看Claude Opus 4.5和GPT-5.2谁更强直接选了对比。如果只想正常聊天不投票选「Direct Chat」挑一个模型用。想生成图像或修图点输入框下方的「图像」按钮输入提示词或者上传图片。想生成视频访问lmarena.ai/video输入提示词就能生成视频可以下载。注意需要登录才能玩视频生成注册免费。说完优点再泼一泼冷水。LMArena 的本职工作是收集投票数据做排行榜不是生产力工具。所以白嫖只是顺便。用 Battle 模式每轮对话后必须投票不能跳过。模型响应速度有时比官方慢。频繁使用会触发限制。时不时还可能弹人机验证。但白嫖还要啥自行车。600 万次真人投票骗不了人。我是木易Top2 美国 Top10 CS 硕现在是 AI 产品经理。关注「AI信息Gap」让 AI 成为你的外挂。