💰 最省錢的 AI 模型排行

預算黨福音 —— 從完全免費到最貴的旗艦模型，全部排好了。還有 5 個省錢技巧幫你把帳單壓到最低。

這個計算器有幫助嗎？

🏆 費用排行榜（從便宜到貴）

#	模型	變體	輸入 ($/M)	輸出 ($/M)
#1	🧪 智譜 GLM	GLM-4-Flash 免費	免費	免費
#2	🦙 Llama	自部署 (Self-hosted) 免費	免費	免費
#3	☁️ 通義千問	Qwen3.5-Flash	$0.028	$0.28
#4	🔬 DeepSeek	V3.2 (快取命中)	$0.028	$0.42
#5	🫘 豆包	1.5 Lite	$0.042	$0.083
#6	⚡ MiniMax	abab6.5	$0.069	$0.14
#7	💎 Gemini	2.5 Flash-Lite	$0.1	$0.4
#8	🫘 豆包	1.5 Pro	$0.11	$0.28
#9	☁️ 通義千問	Qwen3.5-Plus	$0.11	$0.67
#10	🦙 Llama	Llama 4 Scout (API)	$0.12	$0.35
#11	🌙 Kimi	K1.5	$0.14	$0.56
#12	⚡ MiniMax	Text-01	$0.14	$1.39
#13	🤖 GPT	GPT-4o-mini	$0.15	$0.6
#14	🦙 Llama	Llama 4 Maverick (API)	$0.2	$0.6
#15	🔬 DeepSeek	V3.2 (快取未命中)	$0.28	$0.42
#16	🌙 Kimi	K2	$0.28	$0.83
#17	💎 Gemini	2.5 Flash	$0.3	$2.5
#18	☁️ 通義千問	Qwen3-Max	$0.35	$1.4
#19	🧠 Claude	Haiku 4.5	$1.0	$5.0
#20	🤖 GPT	o4-mini	$1.1	$4.4
#21	💎 Gemini	2.5 Pro	$1.25	$10.0
#22	🤖 GPT	o3	$2.0	$8.0
#23	🤖 GPT	GPT-4o	$2.5	$10.0
#24	🧠 Claude	Sonnet 4.6	$3.0	$15.0
#25	🧠 Claude	Opus 4.6	$5.0	$25.0
#26	🧪 智譜 GLM	GLM-4-Plus	$6.94	$6.94

🧪 智譜 GLM-4-Flash

完全免費，零費用使用。有速率限制但個人學習和輕度開發完全夠用。中文理解能力不錯，推薦作為入門首選。

🦙 Llama 自部署

模型完全開源免費，但需要自己的 GPU 伺服器。適合有技術團隊且調用量大的公司，長期來看最省錢。

如果你的 system prompt 很長且不常變，開啟快取可以大幅降低輸入成本。DeepSeek 的快取命中價格只有原價的 1/10。Anthropic 和 OpenAI 也支援 prompt caching。

把囉嗦的提示詞精簡到最核心的指令。「請幫我把下面的文章翻譯成英文，要求準確通順自然」 → 「翻譯為英文」。Token 少了，費用就少了。

不是每個任務都需要最強的模型。簡單分類用 GPT-4o-mini ($0.15/M)，複雜推理用 Claude Opus ($5/M)。用一個小模型先判斷任務難度，再決定調用哪個大模型，能省 70%+ 的費用。

OpenAI 的 Batch API 價格只有實時 API 的 50%，但需要等最多 24 小時。如果不急，用批量介面可以直接砍半費用。

設定 API 費用上限和告警，避免程式碼 bug 導致的意外大額帳單。很多開發者的第一筆大帳單都是因為死迴圈調用 API……

預算 $0-5/月：GLM-4-Flash（免費）或 Gemini Flash-Lite（$0.10/M 輸入）。夠用、夠便宜。

預算 $5-30/月：DeepSeek V3.2 或 GPT-4o-mini。性價比之王，能覆蓋大多數開發場景。

預算 $30-200/月：Gemini 2.5 Flash + Claude Sonnet 混合使用。Flash 處理日常任務，Sonnet 處理複雜任務。

預算 $200+/月：根據任務類型選擇模型路由策略，或考慮 Llama 自部署。量越大，自部署越划算。