Mis on lokaalne mudel?
Lokaalne mudel (open-weight model) on AI mudel, mille kaalud — see, kuidas mudel sisemiselt toimib — on avalikult saadaval. Selle vastandiks on suletud mudelid (GPT-5, Claude, Gemini), mis töötavad ainult vendori serverites.
Lokaalse mudeli puhul saate selle:
- Käivitada oma serveris või sülearvutil
- Hostida Euroopas (vältides USA jurisdiktsiooni)
- Kohandada (fine-tuning) oma andmetega
- Kasutada piiramatult ühe ostuhinnaga (API kvoot puudub)
2026 peamised lokaalsed mudelid
| Mudel | Tootja | Tugevus | Riistvara nõue |
|---|---|---|---|
| Llama 4 (405B) | Meta | Suurim, parim kvaliteet, multimodaalne | 2× H100 (~$15k riistvara) |
| Llama 4 (70B) | Meta | Tasakaalus, populaarseim | 1× A100 (~$10k) või pilvepõhine |
| Mistral Large 2 | Mistral AI (FFR) | Euroopa, GDPR-sõbralik hosting | 1× A100 |
| Qwen3 235B | Alibaba | Reasoning, multilingvaalne, sh eesti keel | 2× H100 |
| DeepSeek R1 | DeepSeek | Reasoning-mudel, väga odav, väga tugev | 2× H100 või API ($0,55/M tokenit) |
| Llama 4 (8B) | Meta | Sülearvutil jooksev, lihtsamateks ülesanneteks | 16 GB RAM (tasuta) |
Riistvara hindade vähendamiseks saab kasutada kvantiseeritud versioone (4-bit, 8-bit) — kvaliteet langeb veidi, kuid mudel mahub nõrgema riistvara peale.
Millal valida lokaalne mudel?
Hea valik, kui:
- Andmed ei tohi üldse väljuda teie infrastruktuurist (tervishoid, riigisaladused, kaitse)
- Andmed peavad jääma EU jurisdiktsiooni (kindlustus, suuremad riigiasutused)
- Kasutate AI-d nii palju, et API kulud ületavad €1000/kuus (lokaalse hosting'u tasuvuspunkt)
- Vajate mudelit, mis on kohandatud teie spetsiifilistele andmetele (fine-tuning)
- Soovite täielikku kontrolli mudeli versioonide üle (mitte vendori uuendused)
Halb valik, kui:
- Vajate viimast tipptaseme kvaliteeti (Claude Opus 4 / GPT-5 / Gemini 2.5 Pro on lokaalsetest endiselt eespool)
- Pole tehnilist meeskonda, kes saaks deployd ja monitooringut hooldada
- Kasutus on muutlik (lokaalse jaoks vaja püsivat infrastruktuuri)
- Vajate ChatGPT Agent / Computer Use tüüpi võimalusi (ainult vendori platvormides)
Hosting-võimalused Eestis ja Euroopas
- Oma serveris — eraldatud GPU-server kontoris või kolokatsioonis. Investing $10k–50k riistvarasse.
- Hetzner (Saksamaa) — GPU-instantsid alates €100/kuus. EU jurisdiktsioon.
- Scaleway (Prantsusmaa) — eraldatud GPU-instantsid, EU andmekeskused.
- Mistral La Plateforme — Mistrali oma API EU hostingus, sertifitseeritud ISO 27001.
- Ollama (lokaalselt sülearvutil) — proof-of-concept'iks. Llama 8B / Mistral 7B mahuvad MacBook Pro peale.
- vLLM / TGI — populaarsed self-hosted serveerimisraamistikud.
Eesti keele kvaliteet lokaalsetes mudelites
Eesti on väike keel, mis on treeningandmetes alaesindatud. 2026. aasta praktiline pingerida:
- Llama 4 (eriti 405B) — hea, mõnikord eksib käändelõpudes
- Qwen3 235B — hea, mõnikord segab vene keelega
- Mistral Large 2 — keskmine, parem inglise keelele
- Llama 4 (8B) — kohati halb, sobib lihtsamateks ülesanneteks
Kui eesti keele kvaliteet on kriitiline, võib lokaalsele mudelile fine-tuning'u eesti tekstidega oluliselt aidata. Kuid pilvepõhised mudelid (Claude, GPT-5) jäävad praktikas kvaliteedis ette.
Hübriidmudel — parim kahest maailmast
Paljud Eesti ettevõtted lähevad hübriidteed:
- Lokaalne mudel töötleb tundlikke andmeid (kliendiandmed, dokumendid) sisemiselt
- Pilvemudel (Claude, GPT-5) kasutab avatuid ülesandeid (üldine kirjavahetus, sisuloome, mõtlemismudelid)
- Marsruutimine toimub agendis, mis valib mudeli vastavalt andmete tundlikkusele
See annab kõige parima ROI: tundlikud andmed jäävad kohale, lihtsad ülesanded on odavad ja keerulised töötatakse parima mudeliga.