AIMay 8, 2026Words 3901Read time≈ 10 min

OpenRouter 免费模型白嫖指南：文本、编程与 Agent 模型推荐

根据 OpenRouter 2026 年 5 月免费模型合集，重新整理适合文本处理、编程、Agent 工作流和长上下文实验的免费模型，并说明免费额度、限流与使用策略。

OpenRouter 免费模型白嫖指南：文本、编程与 Agent 模型推荐

OpenRouter 的免费模型更新非常快。之前一些热门免费模型可能突然下架、换 provider、限流，或者不再出现在免费模型榜单里。尤其是之前很多人关注的 1T 级别免费模型，现在已经不适合作为主推对象。

所以这篇文章不再写成“某一个模型永远最强”，而是按用途整理：文本处理、编程、Agent 工作流、长上下文实验分别选不同模型。

OpenRouter 免费模型页面：https://openrouter.ai/models?q=free

OpenRouter 免费模型合集：https://openrouter.ai/collections/free-models

OpenRouter 官方免费模型合集页面显示，当前排名是基于 2026 年 5 月真实使用数据更新的。官方也说明，免费模型主要用于实验、学习和低成本尝试，未来是否继续提供并不能保证。因此，免费模型适合学习、测试、个人项目和轻量工作流，不适合完全当作长期生产主力。

官方说明：OpenRouter Free Models、OpenRouter Free Models Router、OpenRouter API Rate Limits、OpenRouter Pricing

一、先说结论：现在免费模型应该怎么选？

如果你只是想快速白嫖，可以先记住这个组合：

txt 文本处理：GLM 4.5 Air / Gemma 4 31B / gpt-oss-120b 编程任务：Poolside Laguna M.1 / gpt-oss-120b / DeepSeek V4 Flash Agent 工作流：Owl Alpha / Nemotron 3 Super / MiniMax M2.5 复杂审查：Nemotron 3 Super / gpt-oss-120b / Trinity Large Thinking 长上下文实验：Owl Alpha / Nemotron 3 Super / DeepSeek V4 Flash 通用备用：openrouter/free

我的建议是：不要只押一个免费模型。免费模型的核心玩法是“多模型分工 + fallback”。写文章用文本模型，写代码用 coding 模型，做 Agent 用支持工具调用和长上下文的模型。这样比死守一个模型更稳。

二、当前值得优先关注的免费模型

根据 OpenRouter 当前免费模型合集，下面这些模型值得重点测试：

优先级	模型 ID	适合用途	简评
S	`openrouter/owl-alpha`	Agent、长上下文、自动化工作流	当前免费榜头部模型，1M 上下文，适合 Claude Code / OpenClaw 这类生产力工具实验
S	`nvidia/nemotron-3-super-120b-a12b:free`	复杂推理、代码审查、多 Agent	120B MoE，1M 上下文，适合复杂规划、长文档分析和跨文档推理
S-	`poolside/laguna-m.1:free`	编程、Coding Agent	面向复杂软件工程任务，支持 tool calling 和 reasoning，适合代码生成和工具调用
A+	`openai/gpt-oss-120b:free`	推理、工具调用、结构化输出	OpenAI 开源权重 MoE 模型，适合通用推理、Agent 实验和代码审查
A+	`deepseek/deepseek-v4-flash:free`	长上下文、代码、Agent	1M 上下文，适合快速响应、长上下文任务和 coding assistant
A	`z-ai/glm-4.5-air:free`	中文、通用问答、轻量 Agent	中文体验较好，支持 thinking / non-thinking 模式，适合作为文本和轻量推理备用
A	`minimax/minimax-m2.5:free`	办公自动化、Agent、代码	面向真实生产力任务，适合 Word、Excel、PPT、代码和多软件工作流理解
A-	`poolside/laguna-xs-2:free`	轻量编程、Coding Agent	Laguna M.1 的轻量替代，适合作为代码 fallback
A-	`arcee-ai/trinity-large-thinking:free`	推理、Agent、复杂审查	开源 reasoning 模型，适合保留 reasoning 的 Agent 工作流实验
B+	`baidu/cobuddy:free`	代码生成、AI Agent	百度代码模型，支持 tool calling 和 reasoning，适合轻量代码和中文代码解释
B+	`openai/gpt-oss-20b:free`	轻量推理、结构化输出	比 120B 更轻，适合低延迟和普通结构化任务
B	`nvidia/nemotron-3-nano-30b-a3b:free`	轻量 Agent、私有化研究	轻量 MoE，适合测试 specialized agentic AI systems
B	`openrouter/free`	临时测试免费路由	自动选择免费模型，方便但不稳定，不适合正式调试

注意：免费模型列表会变化。你真正使用前，最好先打开模型页面确认它是否仍然免费、是否支持工具调用、上下文长度是多少、是否有 provider 限流。

三、文本处理免费模型推荐

文本处理包括中文文章润色、摘要、翻译、长文档整理、知识库整理、邮件写作、说明文改写等。

文本模型优先级

优先级	模型 ID	适合用途	简评
S	`z-ai/glm-4.5-air:free`	中文问答、文章润色、轻量推理	中文体验较好，适合作为日常文本主力
S-	`google/gemma-4-31b-it:free`	多语言文本、文档理解、普通写作	稳定通用，适合普通文本处理和多语言任务
A+	`openai/gpt-oss-120b:free`	结构化改写、复杂总结、观点梳理	推理能力强，适合复杂文本审查和逻辑重构
A	`nvidia/nemotron-3-super-120b-a12b:free`	长文档、复杂文本分析	适合大段内容分析，但未必适合高频轻量润色
A-	`deepseek/deepseek-v4-flash:free`	长上下文整理、快速摘要	适合需要塞长内容、日志或资料的场景
B+	`openrouter/free`	临时聊天、快速测试	方便，但路由不固定

文本处理首选组合

日常中文文章润色：z-ai/glm-4.5-air:free
多语言文本与文档理解：google/gemma-4-31b-it:free
复杂观点分析：openai/gpt-oss-120b:free
长文档结构化整理：nvidia/nemotron-3-super-120b-a12b:free
超长上下文整理：deepseek/deepseek-v4-flash:free

如果你只是写博客、改文章、做摘要，不一定要上来就用最大模型。普通中文文章可以先试 z-ai/glm-4.5-air:free 或 google/gemma-4-31b-it:free。如果要做复杂观点审查、长文章重构、逻辑分析，再切到 openai/gpt-oss-120b:free 或 nvidia/nemotron-3-super-120b-a12b:free。

四、编程免费模型推荐

编程任务包括写 Python、解释报错、修改 bug、生成脚本、阅读代码仓库、做代码审查、辅助开发 AI Agent 等。

编程模型优先级

优先级	模型 ID	适合用途	简评
S	`poolside/laguna-m.1:free`	Coding Agent、复杂软件工程	面向复杂软件工程任务，适合代码生成、工具调用和 agentic coding workflows
S-	`openai/gpt-oss-120b:free`	代码推理、结构化输出、工具调用	适合代码解释、代码审查和 Agent 实验
A+	`deepseek/deepseek-v4-flash:free`	长上下文代码、快速修复	适合长代码、快速响应和 coding assistant
A	`poolside/laguna-xs-2:free`	轻量代码、低成本 Agent	适合替代 M.1 做 fallback
A	`baidu/cobuddy:free`	代码生成、中文代码解释	适合轻量代码任务，尤其是中文解释和工具调用实验
A-	`minimax/minimax-m2.5:free`	工程任务、办公自动化、Agent	适合真实生产力场景，不只局限代码
B+	`nvidia/nemotron-3-super-120b-a12b:free`	代码审查、架构分析	适合高级参谋，不建议直接无监督大规模改仓库

编程首选组合

代码生成主力：poolside/laguna-m.1:free
代码推理与结构化输出：openai/gpt-oss-120b:free
长上下文代码任务：deepseek/deepseek-v4-flash:free
轻量代码备用：poolside/laguna-xs-2:free
中文代码解释：baidu/cobuddy:free
复杂代码审查：nvidia/nemotron-3-super-120b-a12b:free

如果你在做类似 Claude Code、Cline、Roo Code、OpenCode 这类工具调用项目，不要只看模型聊天能力。更重要的是看下面几点：

1. 是否支持 tool calling； 2. 是否能稳定输出结构化格式； 3. 是否能理解长上下文； 4. 是否能按步骤执行任务； 5. 是否容易胡乱改文件。

我的排序是：poolside/laguna-m.1:free 负责代码生成，openai/gpt-oss-120b:free 负责推理和结构化输出，nvidia/nemotron-3-super-120b-a12b:free 负责复杂审查和架构判断。

五、Agent / 工具调用免费模型推荐

Agent 模型不是简单聊天模型。它要能读任务、拆步骤、调用工具、看工具结果、继续推理，并且尽量不要乱输出格式。

Agent 模型优先级

优先级	模型 ID	适合用途	简评
S	`openrouter/owl-alpha`	Agent、长上下文、自动化工作流	当前免费榜头部模型，适合 Claude Code / OpenClaw 等工具实验
S	`nvidia/nemotron-3-super-120b-a12b:free`	多 Agent、复杂规划、长上下文	1M 上下文，适合长期任务规划、跨文档推理和多步任务
S-	`minimax/minimax-m2.5:free`	办公自动化、Agent、多软件工作流	面向真实生产力环境，适合办公 Agent 思路
A+	`openai/gpt-oss-120b:free`	工具调用、结构化输出、推理	适合 Agent 框架测试
A+	`poolside/laguna-m.1:free`	Coding Agent	适合代码类 Agent
A	`deepseek/deepseek-v4-flash:free`	长上下文 Agent、快速响应	适合高吞吐和长上下文任务
A-	`arcee-ai/trinity-large-thinking:free`	reasoning Agent、复杂任务	适合保留 reasoning 的 Agent 工作流实验
B+	`z-ai/glm-4.5-air:free`	轻量 Agent、中文任务	适合通用备用
B	`openrouter/free`	临时免费路由	方便但不可控，不适合正式调试

OpenRouter 还有一个特殊模型路由：openrouter/free。

它会自动从免费模型中选择可用模型，适合临时聊天和快速测试。但如果你正在写自己的 Agent 框架，不建议长期使用 openrouter/free，因为每次实际路由到的模型可能不同，行为不稳定，调试会很痛苦。

六、重点模型简评

1. `openrouter/owl-alpha`

模型页面：OpenRouter Owl Alpha

Owl Alpha 是当前 OpenRouter 免费模型榜中非常值得关注的模型。OpenRouter 对它的介绍强调 agentic workloads、tool use、long-context tasks、code generation、automated workflows 和 complex instruction execution，并且标注它兼容 Claude Code、OpenClaw 等生产力工具。

我的定位：

txt 适合：Agent、长上下文、自动化工作流、Claude Code-like 工具实验不适合：对稳定性要求极高的生产环境

它很适合拿来测试 AgentLab、Claude Code-like CLI、多步任务规划。但它带有 alpha 属性，实际稳定性和输出风格需要自己测试。

2. `nvidia/nemotron-3-super-120b-a12b:free`

模型页面：NVIDIA Nemotron 3 Super 120B A12B Free

NVIDIA Nemotron 3 Super 是 120B 参数 MoE 模型，每次激活约 12B 参数。OpenRouter 当前介绍它支持 1M token context，面向 long-term agent coherence、cross-document reasoning 和 multi-step task planning。

我的定位：

txt 适合：复杂推理、长文档分析、代码审查、Agent 规划不适合：完全无监督自动接管项目

它适合当“高级参谋”：审查代码、解释架构、规划任务、分析长文本。但如果直接接入自动写代码工具，最好先小范围测试，避免误改文件或输出格式不稳定。

3. `poolside/laguna-m.1:free`

模型页面：Poolside Laguna M.1 Free

Laguna M.1 是 Poolside 的 coding agent 模型，OpenRouter 页面介绍它面向 complex software engineering tasks，支持 tool calling 和 reasoning，适合 agentic coding workflows。

我的定位：

txt 适合：代码生成、代码解释、Coding Agent、工具调用不适合：中文长文润色，不如通用文本模型自然

如果你只想选一个免费代码模型，优先试它。

4. `openai/gpt-oss-120b:free`

模型页面：OpenAI gpt-oss-120b Free

gpt-oss-120b 是 OpenAI 的开源权重 MoE 模型。OpenRouter 页面介绍它适合 high-reasoning、agentic 和 general-purpose use cases，并支持 native tool use、function calling、browsing 和 structured output generation。

我的定位：

txt 适合：复杂推理、结构化输出、工具调用、代码审查不适合：无脑替代所有付费模型

它适合作为 Agent 框架里的“推理层”或“审查层”。如果你做的是工具调用实验，它比普通聊天模型更值得测。

5. `deepseek/deepseek-v4-flash:free`

模型页面：DeepSeek V4 Flash Free

DeepSeek V4 Flash 是效率优化的 MoE 模型。OpenRouter 当前页面介绍它支持 1M-token context window，适合 coding assistants、chat systems 和 agent workflows。

我的定位：

txt 适合：长上下文、快速响应、代码助手、Agent workflow 不适合：需要极强审美表达的中文写作

它的重点是长上下文和效率。如果你要塞很多文件、很多日志、很多项目说明，它值得测试。

6. `minimax/minimax-m2.5:free`

模型页面：MiniMax M2.5 Free

MiniMax M2.5 面向 real-world productivity。OpenRouter 页面提到它覆盖 Word、Excel、PowerPoint 等办公软件环境，也强调 coding expertise 和 planning。

我的定位：

txt 适合：办公自动化、文档处理、表格任务、生产力 Agent 不适合：只做闲聊时浪费额度

如果你研究的是“AI 如何帮我处理实际办公任务”，这个模型值得单独测试。

7. `arcee-ai/trinity-large-thinking:free`

模型页面：Arcee AI Trinity Large Thinking Free

Trinity Large Thinking 是 Arcee AI 的开源 reasoning 模型。OpenRouter 页面强调它适合 agentic workloads 和 reasoning tasks，并提示这类模型最好保留 reasoning 过程。

我的定位：

txt 适合：复杂推理、Agent 任务拆解、审查类任务不适合：低延迟闲聊和普通短文本润色

它可以作为 gpt-oss-120b:free 和 nvidia/nemotron-3-super-120b-a12b:free 之外的 reasoning 备用。

七、我的最终白嫖优先级

综合白嫖榜

排名	模型 ID	主要用途	推荐理由
1	`openrouter/owl-alpha`	Agent、长上下文	当前免费榜头部，1M 上下文，适合自动化工作流实验
2	`poolside/laguna-m.1:free`	编程、Coding Agent	代码任务优先测试
3	`nvidia/nemotron-3-super-120b-a12b:free`	复杂推理、代码审查	1M 上下文，适合复杂分析和跨文档推理
4	`openai/gpt-oss-120b:free`	推理、工具调用	适合结构化输出和 Agent 测试
5	`deepseek/deepseek-v4-flash:free`	长上下文、快速响应	1M 上下文，适合长任务
6	`minimax/minimax-m2.5:free`	办公 Agent、生产力任务	适合文档、表格、PPT 类工作流
7	`z-ai/glm-4.5-air:free`	中文通用、轻量推理	中文备用模型，适合文章润色和普通问答
8	`google/gemma-4-31b-it:free`	文本、多语言、文档理解	日常文本处理备用
9	`arcee-ai/trinity-large-thinking:free`	reasoning、Agent 审查	复杂推理备用
10	`baidu/cobuddy:free`	轻量代码、中文代码解释	代码备用
11	`openrouter/free`	临时测试	自动路由方便，但不稳定

如果你只想记住 5 个

写文章：z-ai/glm-4.5-air:free
写代码：poolside/laguna-m.1:free
做 Agent：openrouter/owl-alpha
做复杂审查：nvidia/nemotron-3-super-120b-a12b:free
做长上下文：deepseek/deepseek-v4-flash:free

八、推荐配置方式

如果你要把这些模型接入自己的项目，可以按用途配置：

env TEXT_MODEL=z-ai/glm-4.5-air:free CODING_MODEL=poolside/laguna-m.1:free AGENT_MODEL=openrouter/owl-alpha REVIEW_MODEL=nvidia/nemotron-3-super-120b-a12b:free REASONING_MODEL=openai/gpt-oss-120b:free LONG_CONTEXT_MODEL=deepseek/deepseek-v4-flash:free FALLBACK_MODEL=openrouter/free

如果你在做 AI Agent，可以设置一个简单的 fallback 策略：

txt 第一步：用 Owl Alpha 做任务规划和长上下文 Agent 测试第二步：用 Laguna M.1 写代码第三步：用 gpt-oss-120b 做结构化推理和工具调用第四步：用 Nemotron 3 Super 做代码审查和架构判断第五步：如果限流，切换到 DeepSeek V4 Flash、GLM 4.5 Air 或 openrouter/free

这样比只依赖一个免费模型更稳。

九、白嫖注意事项

1. 免费模型变化很快

这篇文章已经删掉了之前的 1T 模型主推内容，因为它不再适合作为当前免费模型推荐核心。免费模型列表会变，写配置时不要迷信旧文章。

2. 不要把免费模型当生产主力

免费模型可能随时改变价格、限流、provider 或可用性。个人学习没问题，正式产品要准备付费 fallback。

3. 不要在免费模型里放敏感信息

免费模型适合公开资料、学习项目、普通文章和非敏感代码。涉及隐私、客户资料、商业机密时，不要随便丢给免费模型。

4. 不要只看参数大小

大模型不一定适合你的任务。写文章看中文表达，写代码看代码能力，做 Agent 看工具调用稳定性。

5. 不要迷信 `openrouter/free`

openrouter/free 很方便，但模型路由不固定。做正式项目时，最好固定具体模型 ID。

6. 免费额度要省着用

免费用户每日请求数有限，失败请求也可能消耗额度。测试 Agent 时尤其容易一轮任务就调用很多次，所以最好加缓存、限制最大轮数、设置 fallback。

十、总结

OpenRouter 免费模型的价值很高，尤其适合学生、独立开发者、AI Agent 学习者和个人网站作者。

我的最终建议是：

文本处理：优先 GLM 4.5 Air 或 Gemma 4 31B
编程任务：优先 Poolside Laguna M.1
Agent 推理：优先 Owl Alpha
复杂审查：使用 Nemotron 3 Super 或 gpt-oss-120b
超长上下文：实验 DeepSeek V4 Flash

免费模型的核心玩法不是“找一个最强模型用到底”，而是根据任务分工：文本用文本模型，代码用代码模型，Agent 用推理和工具调用更强的模型。这样才能真正把免费额度用出价值。

OpenRouter 免费模型白嫖指南：文本、编程与 Agent 模型推荐

OpenRouter 免费模型白嫖指南：文本、编程与 Agent 模型推荐

一、先说结论：现在免费模型应该怎么选？

二、当前值得优先关注的免费模型

三、文本处理免费模型推荐

文本模型优先级

文本处理首选组合

四、编程免费模型推荐

编程模型优先级

编程首选组合

五、Agent / 工具调用免费模型推荐

Agent 模型优先级

六、重点模型简评

1. `openrouter/owl-alpha`

2. `nvidia/nemotron-3-super-120b-a12b:free`

3. `poolside/laguna-m.1:free`

4. `openai/gpt-oss-120b:free`

5. `deepseek/deepseek-v4-flash:free`

6. `minimax/minimax-m2.5:free`

7. `arcee-ai/trinity-large-thinking:free`

七、我的最终白嫖优先级

综合白嫖榜

如果你只想记住 5 个

八、推荐配置方式

九、白嫖注意事项

1. 免费模型变化很快

2. 不要把免费模型当生产主力

3. 不要在免费模型里放敏感信息

4. 不要只看参数大小

5. 不要迷信 `openrouter/free`

6. 免费额度要省着用

十、总结

参考链接

评论

分享这篇文章

OpenRouter 免费模型白嫖指南：文本、编程与 Agent 模型推荐

OpenRouter 免费模型白嫖指南：文本、编程与 Agent 模型推荐

一、先说结论：现在免费模型应该怎么选？

二、当前值得优先关注的免费模型

三、文本处理免费模型推荐

文本模型优先级

文本处理首选组合

四、编程免费模型推荐

编程模型优先级

编程首选组合

五、Agent / 工具调用免费模型推荐

Agent 模型优先级

六、重点模型简评

1. openrouter/owl-alpha

2. nvidia/nemotron-3-super-120b-a12b:free

3. poolside/laguna-m.1:free

4. openai/gpt-oss-120b:free

5. deepseek/deepseek-v4-flash:free

6. minimax/minimax-m2.5:free

7. arcee-ai/trinity-large-thinking:free

七、我的最终白嫖优先级

综合白嫖榜

如果你只想记住 5 个

八、推荐配置方式

九、白嫖注意事项

1. 免费模型变化很快

2. 不要把免费模型当生产主力

3. 不要在免费模型里放敏感信息

4. 不要只看参数大小

5. 不要迷信 openrouter/free

6. 免费额度要省着用

十、总结

参考链接

评论

分享这篇文章

1. `openrouter/owl-alpha`

2. `nvidia/nemotron-3-super-120b-a12b:free`

3. `poolside/laguna-m.1:free`

4. `openai/gpt-oss-120b:free`

5. `deepseek/deepseek-v4-flash:free`

6. `minimax/minimax-m2.5:free`

7. `arcee-ai/trinity-large-thinking:free`

5. 不要迷信 `openrouter/free`