Lokale LLMs & RAG
DSGVO on-premise
Wir entwickeln Sprach- und KI-Agenten, die Ihre sensiblen Daten sicher nutzen. Komplett On-Prem oder in Ihrer Private Cloud – ohne Abstriche bei Performance oder Nutzererlebnis.
DSGVO-konforme Architektur
Technologien
OllamaGPT-OSS 20BRAG
Vorteile
DSGVO-konform
On-Prem oder Private Cloud
Kosteneffizient skalierbar
Maximale Datensicherheit
Anwendungsbereiche
Medizinische Dokumentation
Fragebogen-Auswertung
Wissensmanagement
Sichere Sprachagenten für Ihre Daten
Wir integrieren LLMs in bestehende Prozesse, definieren Guardrails und setzen Governance um, damit Ihre Teams sofort starten können.
Master-Tabelle – Lokale Modelle
Vergleich lokaler LLMs nach Einsatz, Offenheit, Fähigkeiten und VRAM. Bewertungen in 5-Sterne-Skala; nicht zutreffende Felder: N/A. Hier nur ein kleiner Auszug aus verschiedenen Modellen, die lokal genutzt werden können und zum Teil den großen „online“ Modellen in ihrem Fachbereich überlegen sind.
Legende:
★☆☆☆☆ = schlecht / nicht geeignet
★★★★★ = sehr gut
N/A = nicht zutreffend
| Modell | Ziel-Einsatz | Open Weights | Open Source | Trainingsdaten offen | Fine-Tuned / Base | Text | Bild | OCR | Deutsch | Zusammenfassen | Medizin / ICD | Agentic Tool Use | Pro | Contra | VRAM min | VRAM optimal |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| mistral-nemo 12B | General Reasoning | ★★★★★ | ★★★★★ | ★★☆☆☆ | Mistral Base | ★★★★★ | N/A | N/A | ★★★★☆ | ★★★★☆ | ★★★☆☆ | ★★★★☆ | stabil, logisch | kein Vision | 12 GB | 16 GB |
| mistral-small 3.1 | Agenten / Planung | ★★★★★ | ★★★★★ | ★★☆☆☆ | Mistral Small | ★★★★★ | N/A | N/A | ★★★★☆ | ★★★★★ | ★★★☆☆ | ★★★★★ | bestes Agenten-LLM | groß | 16 GB | 24 GB |
| llama 3.1 8B | Allround | ★★★★★ | ★★★★★ | ★★☆☆☆ | Meta LLaMA | ★★★★☆ | N/A | N/A | ★★★★☆ | ★★★★☆ | ★★★☆☆ | ★★★★☆ | robust | engl. Bias | 8 GB | 12 GB |
| llama 3.1 8B custom | Optimiert lokal | ★★★★★ | ★★★★★ | ★★☆☆☆ | LLaMA + FT | ★★★★☆ | N/A | N/A | ★★★★☆ | ★★★★☆ | ★★★☆☆ | ★★★★☆ | gute Prompttreue | FT-abhängig | 8 GB | 12 GB |
| GPT-OSS 20B | Agenten / Planung | ★★★★★ | ★★★★☆ | ★★☆☆☆ | GPT-Style | ★★★★★ | N/A | N/A | ★★★★☆ | ★★★★★ | ★★★☆☆ | ★★★★★ | Top-Agenten-LLM | groß | 14 GB | 20 GB |
| mistral 7B instruct | Leichtes Chat | ★★★★★ | ★★★★★ | ★★☆☆☆ | Mistral 7B | ★★★★☆ | N/A | N/A | ★★★☆☆ | ★★★☆☆ | ★★☆☆☆ | ★★★☆☆ | sehr schnell | weniger Tiefe | 8 GB | 12 GB |
| llama 3.2 vision 11B | Vision Allround | ★★★★★ | ★★★★★ | ★★☆☆☆ | LLaMA Vision | ★★★★☆ | ★★★★☆ | ★★★☆☆ | ★★★☆☆ | ★★★☆☆ | ★★☆☆☆ | ★★★☆☆ | solide Vision | groß | 12 GB | 16 GB |
| llava 13B | Vision QA | ★★★★★ | ★★★★★ | ★★☆☆☆ | LLaVA | ★★★☆☆ | ★★★★☆ | ★★★☆☆ | ★★★☆☆ | ★★★☆☆ | ★☆☆☆☆ | ★★☆☆☆ | bewährt | alt | 16 GB | 20 GB |
| qwen 3 14B | Generalist | ★★★★★ | ★★★★★ | ★★☆☆☆ | Qwen 3 | ★★★★☆ | N/A | N/A | ★★★☆☆ | ★★★★☆ | ★★★☆☆ | ★★★★☆ | starkes Reasoning | Deutsch mittel | 16 GB | 20 GB |
| qwen 2.5 coder 14B | Coding / Tools | ★★★★★ | ★★★★★ | ★★☆☆☆ | Qwen Coder | ★★★★☆ | N/A | N/A | ★★★☆☆ | ★★★☆☆ | ★★☆☆☆ | ★★★★★ | bestes Coding | wenig kreativ | 16 GB | 20 GB |
| qwen 2.5 VL | Vision + OCR | ★★★★★ | ★★★★★ | ★★☆☆☆ | Qwen VL | ★★★☆☆ | ★★★★☆ | ★★★★☆ | ★★★☆☆ | ★★★☆☆ | ★☆☆☆☆ | ★★★☆☆ | sehr gutes OCR | Deutsch mittel | 12 GB | 16 GB |
| deepseek-r1 7B | Reasoning | ★★★★★ | ★★★★★ | ★★☆☆☆ | DeepSeek R1 | ★★★★☆ | N/A | N/A | ★★★☆☆ | ★★★★☆ | ★★★☆☆ | ★★★★☆ | gutes Denken | langsam | 8 GB | 12 GB |
| gemma 3 12B | Präzise Antworten | ★★★★★ | ★★★★★ | ★★☆☆☆ | Gemma 3 | ★★★★☆ | N/A | N/A | ★★★☆☆ | ★★★★☆ | ★★☆☆☆ | ★★★★☆ | sauber | wenig kreativ | 12 GB | 16 GB |
| gemma 2 9B | Leicht | ★★★★★ | ★★★★★ | ★★☆☆☆ | Gemma 2 | ★★★☆☆ | N/A | N/A | ★★★☆☆ | ★★★★☆ | ★★☆☆☆ | ★★★☆☆ | stabil | begrenzt | 8 GB | 12 GB |
| granite 3.2 | Business / RAG | ★★★★★ | ★★★★★ | ★★☆☆☆ | IBM Granite | ★★★★☆ | N/A | N/A | ★★★☆☆ | ★★★★☆ | ★★☆☆☆ | ★★★★☆ | kontrollierbar | wenig kreativ | 8 GB | 12 GB |
| granite 3.2 vision | Business Vision | ★★★★★ | ★★★★★ | ★★☆☆☆ | Granite Vision | ★★★☆☆ | ★★★☆☆ | ★★★☆☆ | ★★★☆☆ | ★★★☆☆ | ★☆☆☆☆ | ★★★☆☆ | stabil | schwache Vision | 8 GB | 12 GB |
| MedGemma 27B | Medizin Spezialist | ★★★★★ | ★★★★★ | ★★☆☆☆ | Med-FT | ★★★★★ | N/A | N/A | ★★★☆☆ | ★★★★★ | ★★★★★ | ★★★☆☆ | medizinisch stark | sehr groß | 16 GB (Q4) | 24–32 GB |
| LLaMA3-Med42-8B | Klinische Assistenz | ★★★★★ | ★★★★★ | ★★☆☆☆ | LLaMA + Med FT | ★★★★☆ | N/A | N/A | ★★★☆☆ | ★★★★☆ | ★★★★☆ | ★★★☆☆ | praxisnah | engl. Bias | 12 GB | 16 GB |
| qwen 3 8B | Leicht | ★★★★★ | ★★★★★ | ★★☆☆☆ | Qwen 3 | ★★★☆☆ | N/A | N/A | ★★☆☆☆ | ★★★☆☆ | ★★☆☆☆ | ★★★☆☆ | effizient | limitiert | 8 GB | 12 GB |
| qwen 3 VL 4B | Vision light | ★★★★★ | ★★★★★ | ★★☆☆☆ | Qwen VL | ★★☆☆☆ | ★★★☆☆ | ★★★☆☆ | ★★☆☆☆ | ★★☆☆☆ | ★☆☆☆☆ | ★★☆☆☆ | klein & schnell | wenig Tiefe | 6 GB | 8 GB |
| deepseek-coder 6.7B | Coding | ★★★★★ | ★★★★★ | ★★☆☆☆ | DeepSeek Coder | ★★★☆☆ | N/A | N/A | ★★☆☆☆ | ★★☆☆☆ | ★☆☆☆☆ | ★★★☆☆ | effizient | Deutsch schwach | 8 GB | 12 GB |
| deepseek-OCR | OCR Spezialist | ★★★★★ | ★★★★☆ | ★★☆☆☆ | Vision + OCR FT | ★★★☆☆ | ★★★★☆ | ★★★★★ | ★★☆☆☆ | ★★★☆☆ | ★☆☆☆☆ | ★★★☆☆ | bestes OCR lokal | kaum Reasoning | 8 GB | 12 GB |
| gemma 2 2B | Edge | ★★★★★ | ★★★★★ | ★★☆☆☆ | Gemma 2 | ★★☆☆☆ | N/A | N/A | ★★☆☆☆ | ★★☆☆☆ | ★☆☆☆☆ | ★★☆☆☆ | extrem klein | sehr limitiert | 4 GB | 6 GB |
| nemotron mini | Edge Agent | ★★★★★ | ★★★★★ | ★★☆☆☆ | NVIDIA | ★★★☆☆ | N/A | N/A | ★★☆☆☆ | ★★☆☆☆ | ★☆☆☆☆ | ★★★☆☆ | sehr schnell | flach | 6 GB | 8 GB |
| phi-3 3.8B | Fast Edge | ★★★★★ | ★★★★★ | ★★☆☆☆ | Microsoft Phi | ★★★☆☆ | N/A | N/A | ★★☆☆☆ | ★★☆☆☆ | ★☆☆☆☆ | ★★☆☆☆ | extrem schnell | kaum Tiefe | 4 GB | 6 GB |
Hinweis: Die Bewertungen sind praxisnahe Einschätzungen und dienen der schnellen Orientierung, nicht als Faktenbehauptung.