💰 最省錢的 AI 模型排行
預算黨福音 —— 從完全免費到最貴的旗艦模型,全部排好了。還有 5 個省錢技巧幫你把帳單壓到最低。
🏆 費用排行榜(從便宜到貴)
| # | 模型 | 變體 | 輸入 ($/M) | 輸出 ($/M) |
|---|---|---|---|---|
| #1 | 🧪 智譜 GLM | GLM-4-Flash 免費 | 免費 | 免費 |
| #2 | 🦙 Llama | 自部署 (Self-hosted) 免費 | 免費 | 免費 |
| #3 | ☁️ 通義千問 | Qwen3.5-Flash | $0.028 | $0.28 |
| #4 | 🔬 DeepSeek | V3.2 (快取命中) | $0.028 | $0.42 |
| #5 | 🫘 豆包 | 1.5 Lite | $0.042 | $0.083 |
| #6 | ⚡ MiniMax | abab6.5 | $0.069 | $0.14 |
| #7 | 💎 Gemini | 2.5 Flash-Lite | $0.1 | $0.4 |
| #8 | 🫘 豆包 | 1.5 Pro | $0.11 | $0.28 |
| #9 | ☁️ 通義千問 | Qwen3.5-Plus | $0.11 | $0.67 |
| #10 | 🦙 Llama | Llama 4 Scout (API) | $0.12 | $0.35 |
| #11 | 🌙 Kimi | K1.5 | $0.14 | $0.56 |
| #12 | ⚡ MiniMax | Text-01 | $0.14 | $1.39 |
| #13 | 🤖 GPT | GPT-4o-mini | $0.15 | $0.6 |
| #14 | 🦙 Llama | Llama 4 Maverick (API) | $0.2 | $0.6 |
| #15 | 🔬 DeepSeek | V3.2 (快取未命中) | $0.28 | $0.42 |
| #16 | 🌙 Kimi | K2 | $0.28 | $0.83 |
| #17 | 💎 Gemini | 2.5 Flash | $0.3 | $2.5 |
| #18 | ☁️ 通義千問 | Qwen3-Max | $0.35 | $1.4 |
| #19 | 🧠 Claude | Haiku 4.5 | $1.0 | $5.0 |
| #20 | 🤖 GPT | o4-mini | $1.1 | $4.4 |
| #21 | 💎 Gemini | 2.5 Pro | $1.25 | $10.0 |
| #22 | 🤖 GPT | o3 | $2.0 | $8.0 |
| #23 | 🤖 GPT | GPT-4o | $2.5 | $10.0 |
| #24 | 🧠 Claude | Sonnet 4.6 | $3.0 | $15.0 |
| #25 | 🧠 Claude | Opus 4.6 | $5.0 | $25.0 |
| #26 | 🧪 智譜 GLM | GLM-4-Plus | $6.94 | $6.94 |
🆓 免費模型推薦
完全免費,零費用使用。有速率限制但個人學習和輕度開發完全夠用。中文理解能力不錯,推薦作為入門首選。
模型完全開源免費,但需要自己的 GPU 伺服器。適合有技術團隊且調用量大的公司,長期來看最省錢。
🎯 5 個省錢技巧
1. 善用快取(Prompt Caching)
如果你的 system prompt 很長且不常變,開啟快取可以大幅降低輸入成本。DeepSeek 的快取命中價格只有原價的 1/10。Anthropic 和 OpenAI 也支援 prompt caching。
2. 提示詞壓縮(Prompt Compression)
把囉嗦的提示詞精簡到最核心的指令。「請幫我把下面的文章翻譯成英文,要求準確通順自然」 → 「翻譯為英文」。Token 少了,費用就少了。
3. 模型路由(Model Routing)
不是每個任務都需要最強的模型。簡單分類用 GPT-4o-mini ($0.15/M),複雜推理用 Claude Opus ($5/M)。用一個小模型先判斷任務難度,再決定調用哪個大模型,能省 70%+ 的費用。
4. 批量 API(Batch API)
OpenAI 的 Batch API 價格只有實時 API 的 50%,但需要等最多 24 小時。如果不急,用批量介面可以直接砍半費用。
5. 錯峰使用 + 預算告警
設定 API 費用上限和告警,避免程式碼 bug 導致的意外大額帳單。很多開發者的第一筆大帳單都是因為死迴圈調用 API……
📌 場景化推薦
學生/個人學習
預算 $0-5/月:GLM-4-Flash(免費)或 Gemini Flash-Lite($0.10/M 輸入)。夠用、夠便宜。
推薦: GLM-4-Flash獨立開發者
預算 $5-30/月:DeepSeek V3.2 或 GPT-4o-mini。性價比之王,能覆蓋大多數開發場景。
推薦: DeepSeek V3.2小團隊
預算 $30-200/月:Gemini 2.5 Flash + Claude Sonnet 混合使用。Flash 處理日常任務,Sonnet 處理複雜任務。
推薦: 混合策略中大型企業
預算 $200+/月:根據任務類型選擇模型路由策略,或考慮 Llama 自部署。量越大,自部署越划算。
推薦: 模型路由 + 自部署