๐ฐ ๊ฐ์ฅ ์ ๋ ดํ AI ๋ชจ๋ธ ์์
์ ์์ฐ ์ ์ ๋ณต์ โ ์์ ๋ฌด๋ฃ๋ถํฐ ์ ์ผ ๋น์ผ ํ๋๊ทธ์ญ ๋ชจ๋ธ๊น์ง, ๋ค ์์๋ก ์ ๋ ฌํ์ด. ๊ณ์ฐ์๋ฅผ ์ต๋ํ ๋ฎ์ถ๋ 5๊ฐ์ง ์ ์ฝ ๊ธฐ์ ๋ ์์ด.
๐ ๋น์ฉ ์์ (์ ๋ ดํ ๊ฒ๋ถํฐ ๋น์ผ ๊ฒ๊น์ง)
| # | ๋ชจ๋ธ | ๋ณํ | ์ ๋ ฅ ($/M) | ์ถ๋ ฅ ($/M) |
|---|---|---|---|---|
| #1 | ๐งช ๆบ่ฐฑ GLM | GLM-4-Flash ๋ฌด๋ฃ | ๋ฌด๋ฃ | ๋ฌด๋ฃ |
| #2 | ๐ฆ Llama | ์์ฒด ํธ์คํ (Self-hosted) ๋ฌด๋ฃ | ๋ฌด๋ฃ | ๋ฌด๋ฃ |
| #3 | โ๏ธ ้ไนๅ้ฎ | Qwen3.5-Flash | $0.028 | $0.28 |
| #4 | ๐ฌ DeepSeek | V3.2 (์บ์ ํํธ) | $0.028 | $0.42 |
| #5 | ๐ซ ๋๋ฐ์ค | 1.5 Lite | $0.042 | $0.083 |
| #6 | โก MiniMax | abab6.5 | $0.069 | $0.14 |
| #7 | ๐ Gemini | 2.5 Flash-Lite | $0.1 | $0.4 |
| #8 | ๐ซ ๋๋ฐ์ค | 1.5 Pro | $0.11 | $0.28 |
| #9 | โ๏ธ ้ไนๅ้ฎ | Qwen3.5-Plus | $0.11 | $0.67 |
| #10 | ๐ฆ Llama | Llama 4 Scout (API) | $0.12 | $0.35 |
| #11 | ๐ Kimi | K1.5 | $0.14 | $0.56 |
| #12 | โก MiniMax | Text-01 | $0.14 | $1.39 |
| #13 | ๐ค GPT | GPT-4o-mini | $0.15 | $0.6 |
| #14 | ๐ฆ Llama | Llama 4 Maverick (API) | $0.2 | $0.6 |
| #15 | ๐ฌ DeepSeek | V3.2 (์บ์ ๋ฏธ์ค) | $0.28 | $0.42 |
| #16 | ๐ Kimi | K2 | $0.28 | $0.83 |
| #17 | ๐ Gemini | 2.5 Flash | $0.3 | $2.5 |
| #18 | โ๏ธ ้ไนๅ้ฎ | Qwen3-Max | $0.35 | $1.4 |
| #19 | ๐ง Claude | Haiku 4.5 | $1.0 | $5.0 |
| #20 | ๐ค GPT | o4-mini | $1.1 | $4.4 |
| #21 | ๐ Gemini | 2.5 Pro | $1.25 | $10.0 |
| #22 | ๐ค GPT | o3 | $2.0 | $8.0 |
| #23 | ๐ค GPT | GPT-4o | $2.5 | $10.0 |
| #24 | ๐ง Claude | Sonnet 4.6 | $3.0 | $15.0 |
| #25 | ๐ง Claude | Opus 4.6 | $5.0 | $25.0 |
| #26 | ๐งช ๆบ่ฐฑ GLM | GLM-4-Plus | $6.94 | $6.94 |
๐ ๋ฌด๋ฃ ๋ชจ๋ธ ์ถ์ฒ
์์ ๋ฌด๋ฃ, ๋น์ฉ 0์ด์ผ. ์๋ ์ ํ์ด ์์ง๋ง ๊ฐ์ธ ํ์ต๊ณผ ๊ฐ๋ฒผ์ด ๊ฐ๋ฐ์ ์ถฉ๋ถํด. ์ค๊ตญ์ด ์ดํด๋ ๊ฝค ์ข๊ณ , ์ ๋ฌธ ์ฒซ ์ ํ์ผ๋ก ๊ผญ ์ถ์ฒํด.
๋ชจ๋ธ์ ์์ ์คํ์์ค ๋ฌด๋ฃ์ผ. ํ์ง๋ง ์ง์ GPU ์๋ฒ๊ฐ ํ์ํด. ๊ธฐ์ ํ์ด ์๊ณ ํธ์ถ๋์ด ๋ง์ ํ์ฌ์ ๋ฑ ๋ง์. ์ฅ๊ธฐ์ ์ผ๋ก ๋ดค์ ๋ ๊ฐ์ฅ ์ ๋ ดํด.
๐ฏ 5๊ฐ์ง ์ ์ฝ ๊ธฐ์
1. ์บ์ ํ์ฉํ๊ธฐ (Prompt Caching)
๋์ system prompt๊ฐ ๊ธธ๊ณ ์์ฃผ ์ ๋ฐ๋๋ค๋ฉด ์บ์๋ฅผ ์ผ์ ์ ๋ ฅ ๋น์ฉ์ ๋ํญ ์ค์ฌ. DeepSeek์ ์บ์ ํํธ ๊ฐ๊ฒฉ์ ์๊ฐ์ 1/10์ด์ผ. Anthropic๊ณผ OpenAI๋ prompt caching์ ์ง์ํด.
2. ํ๋กฌํํธ ์์ถ (Prompt Compression)
๋ณต์กํ ํ๋กฌํํธ๋ฅผ ํต์ฌ ์ง๋ น์ผ๋ก ์์ถํด. "๋ค์ ๊ธฐ์ฌ๋ฅผ ์์ด๋ก ๋ฒ์ญํด ์ฃผ์ธ์. ์ ํํ๊ณ ๋ถ๋๋ฝ๊ฒ" โ "์์ด๋ก ๋ฒ์ญ". Token์ด ์ ์ผ๋ ๋น์ฉ๋ ์ ์ด.
3. ๋ชจ๋ธ ๋ผ์ฐํ (Model Routing)
๋ชจ๋ ์์ ์ด ์ต๊ฐ ๋ชจ๋ธ์ ํ์๋ก ํ์ง ์์. ๊ฐ๋จํ ๋ถ๋ฅ๋ GPT-4o-mini ($0.15/M), ๋ณต์กํ ์ถ๋ก ์ Claude Opus ($5/M). ์์ ๋ชจ๋ธ๋ก ๋จผ์ ์์ ๋์ด๋๋ฅผ ํ๋จํ๊ณ ๋๋ชจ๋ธ์ ๋ถ๋ฅด๋ฉด ๋น์ฉ์ 70% ์ด์ ์ค์ผ ์ ์์ด.
4. Batch API (๋ฐฐ์น API)
OpenAI์ Batch API ๊ฐ๊ฒฉ์ ์ค์๊ฐ API์ 50%์ผ. ์ต๋ 24์๊ฐ์ ๊ธฐ๋ค๋ ค์ผ ํ์ง๋ง. ๊ธํ์ง ์์ ๋๋ ์์ ์ ๋ฐฐ์น ์ธํฐํ์ด์ค๋ง ์จ๋ ๋น์ฉ์ ๋ฐ์ผ๋ก ์ค์ฌ.
5. ํผํฌ ์๊ฐ ํผํ๊ธฐ + ์์ฐ ์๋ฆผ
API ๋น์ฉ ์ํ์ ๊ณผ ์๋ฆผ์ ์ค์ ํด์ ์ฝ๋ ๋ฒ๊ทธ๋ก ์ธํ ์์ ๋ฐ์ ํฐ ๊ณ์ฐ์๋ฅผ ํผํด. ๋ง์ ๊ฐ๋ฐ์์ ์ฒซ ํฐ ๊ณ์ฐ์๋ ๋ฌดํ ํธ์ถ ๋ฒ๊ทธ ๋๋ฌธ์ด์ผ...
๐ ์๋๋ฆฌ์ค๋ณ ์ถ์ฒ
ํ์/๊ฐ์ธ ํ์ต
์์ฐ $0-5/์: GLM-4-Flash (๋ฌด๋ฃ) ๋๋ Gemini Flash-Lite ($0.10/M ์ ๋ ฅ). ์ถฉ๋ถํ๊ณ , ์ ๋ ดํด.
์ถ์ฒ: GLM-4-Flash๋ ๋ฆฝ ๊ฐ๋ฐ์
์์ฐ $5-30/์: DeepSeek V3.2 ๋๋ GPT-4o-mini. ๊ฐ์ฑ๋น์ ์์ด์ผ. ๋๋ถ๋ถ ๊ฐ๋ฐ ์๋๋ฆฌ์ค๋ฅผ ์ปค๋ฒํด.
์ถ์ฒ: DeepSeek V3.2์๊ท๋ชจ ํ
์์ฐ $30-200/์: Gemini 2.5 Flash + Claude Sonnet ํผํฉ ์ ๋ต. Flash๋ ์ผ์ ์์ , Sonnet์ ๋ณต์กํ ์์ ์.
์ถ์ฒ: ํผํฉ ์ ๋ต๋๊ท๋ชจ ๊ธฐ์
์์ฐ $200+/์: ์์ ์ ํ์ ๋ฐ๋ผ ๋ชจ๋ธ ๋ผ์ฐํ ์ ๋ต์ ์ ํํ๊ฑฐ๋ Llama ์์ฒด ํธ์คํ ๊ณ ๋ ค. ํธ์ถ๋์ด ๋ง์์๋ก ์์ฒด ํธ์คํ ์ด ๋ ์ ๋ ดํด.
์ถ์ฒ: ๋ชจ๋ธ ๋ผ์ฐํ + ์์ฒด ํธ์คํ