OpenRouter 免费模型白嫖指南:文本、编程与 Agent 模型推荐
根据 OpenRouter 2026 年 5 月免费模型合集,重新整理适合文本处理、编程、Agent 工作流和长上下文实验的免费模型,并说明免费额度、限流与使用策略。
OpenRouter 免费模型白嫖指南:文本、编程与 Agent 模型推荐
OpenRouter 的免费模型更新非常快。之前一些热门免费模型可能突然下架、换 provider、限流,或者不再出现在免费模型榜单里。尤其是之前很多人关注的 1T 级别免费模型,现在已经不适合作为主推对象。
所以这篇文章不再写成“某一个模型永远最强”,而是按用途整理:文本处理、编程、Agent 工作流、长上下文实验分别选不同模型。
OpenRouter 免费模型页面:https://openrouter.ai/models?q=free
OpenRouter 免费模型合集:https://openrouter.ai/collections/free-models
OpenRouter 官方免费模型合集页面显示,当前排名是基于 2026 年 5 月真实使用数据更新的。官方也说明,免费模型主要用于实验、学习和低成本尝试,未来是否继续提供并不能保证。因此,免费模型适合学习、测试、个人项目和轻量工作流,不适合完全当作长期生产主力。
官方说明:OpenRouter Free Models、OpenRouter Free Models Router、OpenRouter API Rate Limits、OpenRouter Pricing
一、先说结论:现在免费模型应该怎么选?
如果你只是想快速白嫖,可以先记住这个组合:
txt 文本处理:GLM 4.5 Air / Gemma 4 31B / gpt-oss-120b 编程任务:Poolside Laguna M.1 / gpt-oss-120b / DeepSeek V4 Flash Agent 工作流:Owl Alpha / Nemotron 3 Super / MiniMax M2.5 复杂审查:Nemotron 3 Super / gpt-oss-120b / Trinity Large Thinking 长上下文实验:Owl Alpha / Nemotron 3 Super / DeepSeek V4 Flash 通用备用:openrouter/free
我的建议是:不要只押一个免费模型。免费模型的核心玩法是“多模型分工 + fallback”。写文章用文本模型,写代码用 coding 模型,做 Agent 用支持工具调用和长上下文的模型。这样比死守一个模型更稳。
二、当前值得优先关注的免费模型
根据 OpenRouter 当前免费模型合集,下面这些模型值得重点测试:
| 优先级 | 模型 ID | 适合用途 | 简评 |
|---|---|---|---|
| S | openrouter/owl-alpha | Agent、长上下文、自动化工作流 | 当前免费榜头部模型,1M 上下文,适合 Claude Code / OpenClaw 这类生产力工具实验 |
| S | nvidia/nemotron-3-super-120b-a12b:free | 复杂推理、代码审查、多 Agent | 120B MoE,1M 上下文,适合复杂规划、长文档分析和跨文档推理 |
| S- | poolside/laguna-m.1:free | 编程、Coding Agent | 面向复杂软件工程任务,支持 tool calling 和 reasoning,适合代码生成和工具调用 |
| A+ | openai/gpt-oss-120b:free | 推理、工具调用、结构化输出 | OpenAI 开源权重 MoE 模型,适合通用推理、Agent 实验和代码审查 |
| A+ | deepseek/deepseek-v4-flash:free | 长上下文、代码、Agent | 1M 上下文,适合快速响应、长上下文任务和 coding assistant |
| A | z-ai/glm-4.5-air:free | 中文、通用问答、轻量 Agent | 中文体验较好,支持 thinking / non-thinking 模式,适合作为文本和轻量推理备用 |
| A | minimax/minimax-m2.5:free | 办公自动化、Agent、代码 | 面向真实生产力任务,适合 Word、Excel、PPT、代码和多软件工作流理解 |
| A- | poolside/laguna-xs-2:free | 轻量编程、Coding Agent | Laguna M.1 的轻量替代,适合作为代码 fallback |
| A- | arcee-ai/trinity-large-thinking:free | 推理、Agent、复杂审查 | 开源 reasoning 模型,适合保留 reasoning 的 Agent 工作流实验 |
| B+ | baidu/cobuddy:free | 代码生成、AI Agent | 百度代码模型,支持 tool calling 和 reasoning,适合轻量代码和中文代码解释 |
| B+ | openai/gpt-oss-20b:free | 轻量推理、结构化输出 | 比 120B 更轻,适合低延迟和普通结构化任务 |
| B | nvidia/nemotron-3-nano-30b-a3b:free | 轻量 Agent、私有化研究 | 轻量 MoE,适合测试 specialized agentic AI systems |
| B | openrouter/free | 临时测试免费路由 | 自动选择免费模型,方便但不稳定,不适合正式调试 |
注意:免费模型列表会变化。你真正使用前,最好先打开模型页面确认它是否仍然免费、是否支持工具调用、上下文长度是多少、是否有 provider 限流。
三、文本处理免费模型推荐
文本处理包括中文文章润色、摘要、翻译、长文档整理、知识库整理、邮件写作、说明文改写等。
文本模型优先级
| 优先级 | 模型 ID | 适合用途 | 简评 |
|---|---|---|---|
| S | z-ai/glm-4.5-air:free | 中文问答、文章润色、轻量推理 | 中文体验较好,适合作为日常文本主力 |
| S- | google/gemma-4-31b-it:free | 多语言文本、文档理解、普通写作 | 稳定通用,适合普通文本处理和多语言任务 |
| A+ | openai/gpt-oss-120b:free | 结构化改写、复杂总结、观点梳理 | 推理能力强,适合复杂文本审查和逻辑重构 |
| A | nvidia/nemotron-3-super-120b-a12b:free | 长文档、复杂文本分析 | 适合大段内容分析,但未必适合高频轻量润色 |
| A- | deepseek/deepseek-v4-flash:free | 长上下文整理、快速摘要 | 适合需要塞长内容、日志或资料的场景 |
| B+ | openrouter/free | 临时聊天、快速测试 | 方便,但路由不固定 |
文本处理首选组合
- 日常中文文章润色:z-ai/glm-4.5-air:free
- 多语言文本与文档理解:google/gemma-4-31b-it:free
- 复杂观点分析:openai/gpt-oss-120b:free
- 长文档结构化整理:nvidia/nemotron-3-super-120b-a12b:free
- 超长上下文整理:deepseek/deepseek-v4-flash:free
如果你只是写博客、改文章、做摘要,不一定要上来就用最大模型。普通中文文章可以先试 z-ai/glm-4.5-air:free 或 google/gemma-4-31b-it:free。如果要做复杂观点审查、长文章重构、逻辑分析,再切到 openai/gpt-oss-120b:free 或 nvidia/nemotron-3-super-120b-a12b:free。
四、编程免费模型推荐
编程任务包括写 Python、解释报错、修改 bug、生成脚本、阅读代码仓库、做代码审查、辅助开发 AI Agent 等。
编程模型优先级
| 优先级 | 模型 ID | 适合用途 | 简评 |
|---|---|---|---|
| S | poolside/laguna-m.1:free | Coding Agent、复杂软件工程 | 面向复杂软件工程任务,适合代码生成、工具调用和 agentic coding workflows |
| S- | openai/gpt-oss-120b:free | 代码推理、结构化输出、工具调用 | 适合代码解释、代码审查和 Agent 实验 |
| A+ | deepseek/deepseek-v4-flash:free | 长上下文代码、快速修复 | 适合长代码、快速响应和 coding assistant |
| A | poolside/laguna-xs-2:free | 轻量代码、低成本 Agent | 适合替代 M.1 做 fallback |
| A | baidu/cobuddy:free | 代码生成、中文代码解释 | 适合轻量代码任务,尤其是中文解释和工具调用实验 |
| A- | minimax/minimax-m2.5:free | 工程任务、办公自动化、Agent | 适合真实生产力场景,不只局限代码 |
| B+ | nvidia/nemotron-3-super-120b-a12b:free | 代码审查、架构分析 | 适合高级参谋,不建议直接无监督大规模改仓库 |
编程首选组合
- 代码生成主力:poolside/laguna-m.1:free
- 代码推理与结构化输出:openai/gpt-oss-120b:free
- 长上下文代码任务:deepseek/deepseek-v4-flash:free
- 轻量代码备用:poolside/laguna-xs-2:free
- 中文代码解释:baidu/cobuddy:free
- 复杂代码审查:nvidia/nemotron-3-super-120b-a12b:free
如果你在做类似 Claude Code、Cline、Roo Code、OpenCode 这类工具调用项目,不要只看模型聊天能力。更重要的是看下面几点:
1. 是否支持 tool calling; 2. 是否能稳定输出结构化格式; 3. 是否能理解长上下文; 4. 是否能按步骤执行任务; 5. 是否容易胡乱改文件。
我的排序是:poolside/laguna-m.1:free 负责代码生成,openai/gpt-oss-120b:free 负责推理和结构化输出,nvidia/nemotron-3-super-120b-a12b:free 负责复杂审查和架构判断。
五、Agent / 工具调用免费模型推荐
Agent 模型不是简单聊天模型。它要能读任务、拆步骤、调用工具、看工具结果、继续推理,并且尽量不要乱输出格式。
Agent 模型优先级
| 优先级 | 模型 ID | 适合用途 | 简评 |
|---|---|---|---|
| S | openrouter/owl-alpha | Agent、长上下文、自动化工作流 | 当前免费榜头部模型,适合 Claude Code / OpenClaw 等工具实验 |
| S | nvidia/nemotron-3-super-120b-a12b:free | 多 Agent、复杂规划、长上下文 | 1M 上下文,适合长期任务规划、跨文档推理和多步任务 |
| S- | minimax/minimax-m2.5:free | 办公自动化、Agent、多软件工作流 | 面向真实生产力环境,适合办公 Agent 思路 |
| A+ | openai/gpt-oss-120b:free | 工具调用、结构化输出、推理 | 适合 Agent 框架测试 |
| A+ | poolside/laguna-m.1:free | Coding Agent | 适合代码类 Agent |
| A | deepseek/deepseek-v4-flash:free | 长上下文 Agent、快速响应 | 适合高吞吐和长上下文任务 |
| A- | arcee-ai/trinity-large-thinking:free | reasoning Agent、复杂任务 | 适合保留 reasoning 的 Agent 工作流实验 |
| B+ | z-ai/glm-4.5-air:free | 轻量 Agent、中文任务 | 适合通用备用 |
| B | openrouter/free | 临时免费路由 | 方便但不可控,不适合正式调试 |
OpenRouter 还有一个特殊模型路由:openrouter/free。
它会自动从免费模型中选择可用模型,适合临时聊天和快速测试。但如果你正在写自己的 Agent 框架,不建议长期使用 openrouter/free,因为每次实际路由到的模型可能不同,行为不稳定,调试会很痛苦。
六、重点模型简评
1. openrouter/owl-alpha
模型页面:OpenRouter Owl Alpha
Owl Alpha 是当前 OpenRouter 免费模型榜中非常值得关注的模型。OpenRouter 对它的介绍强调 agentic workloads、tool use、long-context tasks、code generation、automated workflows 和 complex instruction execution,并且标注它兼容 Claude Code、OpenClaw 等生产力工具。
我的定位:
txt 适合:Agent、长上下文、自动化工作流、Claude Code-like 工具实验 不适合:对稳定性要求极高的生产环境
它很适合拿来测试 AgentLab、Claude Code-like CLI、多步任务规划。但它带有 alpha 属性,实际稳定性和输出风格需要自己测试。
2. nvidia/nemotron-3-super-120b-a12b:free
模型页面:NVIDIA Nemotron 3 Super 120B A12B Free
NVIDIA Nemotron 3 Super 是 120B 参数 MoE 模型,每次激活约 12B 参数。OpenRouter 当前介绍它支持 1M token context,面向 long-term agent coherence、cross-document reasoning 和 multi-step task planning。
我的定位:
txt 适合:复杂推理、长文档分析、代码审查、Agent 规划 不适合:完全无监督自动接管项目
它适合当“高级参谋”:审查代码、解释架构、规划任务、分析长文本。但如果直接接入自动写代码工具,最好先小范围测试,避免误改文件或输出格式不稳定。
3. poolside/laguna-m.1:free
Laguna M.1 是 Poolside 的 coding agent 模型,OpenRouter 页面介绍它面向 complex software engineering tasks,支持 tool calling 和 reasoning,适合 agentic coding workflows。
我的定位:
txt 适合:代码生成、代码解释、Coding Agent、工具调用 不适合:中文长文润色,不如通用文本模型自然
如果你只想选一个免费代码模型,优先试它。
4. openai/gpt-oss-120b:free
gpt-oss-120b 是 OpenAI 的开源权重 MoE 模型。OpenRouter 页面介绍它适合 high-reasoning、agentic 和 general-purpose use cases,并支持 native tool use、function calling、browsing 和 structured output generation。
我的定位:
txt 适合:复杂推理、结构化输出、工具调用、代码审查 不适合:无脑替代所有付费模型
它适合作为 Agent 框架里的“推理层”或“审查层”。如果你做的是工具调用实验,它比普通聊天模型更值得测。
5. deepseek/deepseek-v4-flash:free
DeepSeek V4 Flash 是效率优化的 MoE 模型。OpenRouter 当前页面介绍它支持 1M-token context window,适合 coding assistants、chat systems 和 agent workflows。
我的定位:
txt 适合:长上下文、快速响应、代码助手、Agent workflow 不适合:需要极强审美表达的中文写作
它的重点是长上下文和效率。如果你要塞很多文件、很多日志、很多项目说明,它值得测试。
6. minimax/minimax-m2.5:free
模型页面:MiniMax M2.5 Free
MiniMax M2.5 面向 real-world productivity。OpenRouter 页面提到它覆盖 Word、Excel、PowerPoint 等办公软件环境,也强调 coding expertise 和 planning。
我的定位:
txt 适合:办公自动化、文档处理、表格任务、生产力 Agent 不适合:只做闲聊时浪费额度
如果你研究的是“AI 如何帮我处理实际办公任务”,这个模型值得单独测试。
7. arcee-ai/trinity-large-thinking:free
模型页面:Arcee AI Trinity Large Thinking Free
Trinity Large Thinking 是 Arcee AI 的开源 reasoning 模型。OpenRouter 页面强调它适合 agentic workloads 和 reasoning tasks,并提示这类模型最好保留 reasoning 过程。
我的定位:
txt 适合:复杂推理、Agent 任务拆解、审查类任务 不适合:低延迟闲聊和普通短文本润色
它可以作为 gpt-oss-120b:free 和 nvidia/nemotron-3-super-120b-a12b:free 之外的 reasoning 备用。
七、我的最终白嫖优先级
综合白嫖榜
| 排名 | 模型 ID | 主要用途 | 推荐理由 |
|---|---|---|---|
| 1 | openrouter/owl-alpha | Agent、长上下文 | 当前免费榜头部,1M 上下文,适合自动化工作流实验 |
| 2 | poolside/laguna-m.1:free | 编程、Coding Agent | 代码任务优先测试 |
| 3 | nvidia/nemotron-3-super-120b-a12b:free | 复杂推理、代码审查 | 1M 上下文,适合复杂分析和跨文档推理 |
| 4 | openai/gpt-oss-120b:free | 推理、工具调用 | 适合结构化输出和 Agent 测试 |
| 5 | deepseek/deepseek-v4-flash:free | 长上下文、快速响应 | 1M 上下文,适合长任务 |
| 6 | minimax/minimax-m2.5:free | 办公 Agent、生产力任务 | 适合文档、表格、PPT 类工作流 |
| 7 | z-ai/glm-4.5-air:free | 中文通用、轻量推理 | 中文备用模型,适合文章润色和普通问答 |
| 8 | google/gemma-4-31b-it:free | 文本、多语言、文档理解 | 日常文本处理备用 |
| 9 | arcee-ai/trinity-large-thinking:free | reasoning、Agent 审查 | 复杂推理备用 |
| 10 | baidu/cobuddy:free | 轻量代码、中文代码解释 | 代码备用 |
| 11 | openrouter/free | 临时测试 | 自动路由方便,但不稳定 |
如果你只想记住 5 个
- 写文章:z-ai/glm-4.5-air:free
- 写代码:poolside/laguna-m.1:free
- 做 Agent:openrouter/owl-alpha
- 做复杂审查:nvidia/nemotron-3-super-120b-a12b:free
- 做长上下文:deepseek/deepseek-v4-flash:free
八、推荐配置方式
如果你要把这些模型接入自己的项目,可以按用途配置:
env TEXT_MODEL=z-ai/glm-4.5-air:free CODING_MODEL=poolside/laguna-m.1:free AGENT_MODEL=openrouter/owl-alpha REVIEW_MODEL=nvidia/nemotron-3-super-120b-a12b:free REASONING_MODEL=openai/gpt-oss-120b:free LONG_CONTEXT_MODEL=deepseek/deepseek-v4-flash:free FALLBACK_MODEL=openrouter/free
如果你在做 AI Agent,可以设置一个简单的 fallback 策略:
txt 第一步:用 Owl Alpha 做任务规划和长上下文 Agent 测试 第二步:用 Laguna M.1 写代码 第三步:用 gpt-oss-120b 做结构化推理和工具调用 第四步:用 Nemotron 3 Super 做代码审查和架构判断 第五步:如果限流,切换到 DeepSeek V4 Flash、GLM 4.5 Air 或 openrouter/free
这样比只依赖一个免费模型更稳。
九、白嫖注意事项
1. 免费模型变化很快
这篇文章已经删掉了之前的 1T 模型主推内容,因为它不再适合作为当前免费模型推荐核心。免费模型列表会变,写配置时不要迷信旧文章。
2. 不要把免费模型当生产主力
免费模型可能随时改变价格、限流、provider 或可用性。个人学习没问题,正式产品要准备付费 fallback。
3. 不要在免费模型里放敏感信息
免费模型适合公开资料、学习项目、普通文章和非敏感代码。涉及隐私、客户资料、商业机密时,不要随便丢给免费模型。
4. 不要只看参数大小
大模型不一定适合你的任务。写文章看中文表达,写代码看代码能力,做 Agent 看工具调用稳定性。
5. 不要迷信 openrouter/free
openrouter/free 很方便,但模型路由不固定。做正式项目时,最好固定具体模型 ID。
6. 免费额度要省着用
免费用户每日请求数有限,失败请求也可能消耗额度。测试 Agent 时尤其容易一轮任务就调用很多次,所以最好加缓存、限制最大轮数、设置 fallback。
十、总结
OpenRouter 免费模型的价值很高,尤其适合学生、独立开发者、AI Agent 学习者和个人网站作者。
我的最终建议是:
- 文本处理:优先 GLM 4.5 Air 或 Gemma 4 31B
- 编程任务:优先 Poolside Laguna M.1
- Agent 推理:优先 Owl Alpha
- 复杂审查:使用 Nemotron 3 Super 或 gpt-oss-120b
- 超长上下文:实验 DeepSeek V4 Flash
免费模型的核心玩法不是“找一个最强模型用到底”,而是根据任务分工:文本用文本模型,代码用代码模型,Agent 用推理和工具调用更强的模型。这样才能真正把免费额度用出价值。
参考链接
- OpenRouter 免费模型搜索
- OpenRouter 免费模型合集
- OpenRouter Free Models Router
- OpenRouter API Rate Limits
- OpenRouter Pricing
- OpenRouter Owl Alpha
- NVIDIA Nemotron 3 Super 120B A12B Free
- Poolside Laguna M.1 Free
- OpenAI gpt-oss-120b Free
- DeepSeek V4 Flash Free
- MiniMax M2.5 Free
- Arcee AI Trinity Large Thinking Free
- Baidu Qianfan CoBuddy Free
Share
评论