💰 最省錢的 AI 模型排行

預算黨福音 —— 從完全免費到最貴的旗艦模型,全部排好了。還有 5 個省錢技巧幫你把帳單壓到最低。

這個計算器有幫助嗎?

🏆 費用排行榜(從便宜到貴)

# 模型 變體 輸入 ($/M) 輸出 ($/M)
#1🧪 智譜 GLMGLM-4-Flash 免費免費免費
#2🦙 Llama自部署 (Self-hosted) 免費免費免費
#3☁️ 通義千問Qwen3.5-Flash $0.028$0.28
#4🔬 DeepSeekV3.2 (快取命中) $0.028$0.42
#5🫘 豆包1.5 Lite $0.042$0.083
#6⚡ MiniMaxabab6.5 $0.069$0.14
#7💎 Gemini2.5 Flash-Lite $0.1$0.4
#8🫘 豆包1.5 Pro $0.11$0.28
#9☁️ 通義千問Qwen3.5-Plus $0.11$0.67
#10🦙 LlamaLlama 4 Scout (API) $0.12$0.35
#11🌙 KimiK1.5 $0.14$0.56
#12⚡ MiniMaxText-01 $0.14$1.39
#13🤖 GPTGPT-4o-mini $0.15$0.6
#14🦙 LlamaLlama 4 Maverick (API) $0.2$0.6
#15🔬 DeepSeekV3.2 (快取未命中) $0.28$0.42
#16🌙 KimiK2 $0.28$0.83
#17💎 Gemini2.5 Flash $0.3$2.5
#18☁️ 通義千問Qwen3-Max $0.35$1.4
#19🧠 ClaudeHaiku 4.5 $1.0$5.0
#20🤖 GPTo4-mini $1.1$4.4
#21💎 Gemini2.5 Pro $1.25$10.0
#22🤖 GPTo3 $2.0$8.0
#23🤖 GPTGPT-4o $2.5$10.0
#24🧠 ClaudeSonnet 4.6 $3.0$15.0
#25🧠 ClaudeOpus 4.6 $5.0$25.0
#26🧪 智譜 GLMGLM-4-Plus $6.94$6.94

🆓 免費模型推薦

🧪 智譜 GLM-4-Flash

完全免費,零費用使用。有速率限制但個人學習和輕度開發完全夠用。中文理解能力不錯,推薦作為入門首選。

🦙 Llama 自部署

模型完全開源免費,但需要自己的 GPU 伺服器。適合有技術團隊且調用量大的公司,長期來看最省錢。

🎯 5 個省錢技巧

1. 善用快取(Prompt Caching)

如果你的 system prompt 很長且不常變,開啟快取可以大幅降低輸入成本。DeepSeek 的快取命中價格只有原價的 1/10。Anthropic 和 OpenAI 也支援 prompt caching。

2. 提示詞壓縮(Prompt Compression)

把囉嗦的提示詞精簡到最核心的指令。「請幫我把下面的文章翻譯成英文,要求準確通順自然」 → 「翻譯為英文」。Token 少了,費用就少了。

3. 模型路由(Model Routing)

不是每個任務都需要最強的模型。簡單分類用 GPT-4o-mini ($0.15/M),複雜推理用 Claude Opus ($5/M)。用一個小模型先判斷任務難度,再決定調用哪個大模型,能省 70%+ 的費用。

4. 批量 API(Batch API)

OpenAI 的 Batch API 價格只有實時 API 的 50%,但需要等最多 24 小時。如果不急,用批量介面可以直接砍半費用。

5. 錯峰使用 + 預算告警

設定 API 費用上限和告警,避免程式碼 bug 導致的意外大額帳單。很多開發者的第一筆大帳單都是因為死迴圈調用 API……

📌 場景化推薦

學生/個人學習

預算 $0-5/月:GLM-4-Flash(免費)或 Gemini Flash-Lite($0.10/M 輸入)。夠用、夠便宜。

推薦: GLM-4-Flash

獨立開發者

預算 $5-30/月:DeepSeek V3.2 或 GPT-4o-mini。性價比之王,能覆蓋大多數開發場景。

推薦: DeepSeek V3.2

小團隊

預算 $30-200/月:Gemini 2.5 Flash + Claude Sonnet 混合使用。Flash 處理日常任務,Sonnet 處理複雜任務。

推薦: 混合策略

中大型企業

預算 $200+/月:根據任務類型選擇模型路由策略,或考慮 Llama 自部署。量越大,自部署越划算。

推薦: 模型路由 + 自部署