Lokale LLMs & RAG

DSGVO on-premise

Wir entwickeln Sprach- und KI-Agenten, die Ihre sensiblen Daten sicher nutzen. Komplett On-Prem oder in Ihrer Private Cloud – ohne Abstriche bei Performance oder Nutzererlebnis.

DSGVO-konforme Architektur

Technologien

OllamaGPT-OSS 20BRAG

Vorteile

DSGVO-konform

On-Prem oder Private Cloud

Kosteneffizient skalierbar

Maximale Datensicherheit

Anwendungsbereiche

Medizinische Dokumentation

Fragebogen-Auswertung

Wissensmanagement

Sichere Sprachagenten für Ihre Daten

Wir integrieren LLMs in bestehende Prozesse, definieren Guardrails und setzen Governance um, damit Ihre Teams sofort starten können.

Termin buchen

Master-Tabelle – Lokale Modelle

Vergleich lokaler LLMs nach Einsatz, Offenheit, Fähigkeiten und VRAM. Bewertungen in 5-Sterne-Skala; nicht zutreffende Felder: N/A. Hier nur ein kleiner Auszug aus verschiedenen Modellen, die lokal genutzt werden können und zum Teil den großen „online“ Modellen in ihrem Fachbereich überlegen sind.

SucheKategorieSortierung

Legende:

★☆☆☆☆ = schlecht / nicht geeignet

★★★★★ = sehr gut

N/A = nicht zutreffend

Modell	Ziel-Einsatz	Open Weights	Open Source	Trainingsdaten offen	Fine-Tuned / Base	Text	Bild	OCR	Deutsch	Zusammenfassen	Medizin / ICD	Agentic Tool Use	Pro	Contra	VRAM min	VRAM optimal
mistral-nemo 12B	General Reasoning	★★★★★	★★★★★	★★☆☆☆	Mistral Base	★★★★★	N/A	N/A	★★★★☆	★★★★☆	★★★☆☆	★★★★☆	stabil, logisch	kein Vision	12 GB	16 GB
mistral-small 3.1	Agenten / Planung	★★★★★	★★★★★	★★☆☆☆	Mistral Small	★★★★★	N/A	N/A	★★★★☆	★★★★★	★★★☆☆	★★★★★	bestes Agenten-LLM	groß	16 GB	24 GB
llama 3.1 8B	Allround	★★★★★	★★★★★	★★☆☆☆	Meta LLaMA	★★★★☆	N/A	N/A	★★★★☆	★★★★☆	★★★☆☆	★★★★☆	robust	engl. Bias	8 GB	12 GB
llama 3.1 8B custom	Optimiert lokal	★★★★★	★★★★★	★★☆☆☆	LLaMA + FT	★★★★☆	N/A	N/A	★★★★☆	★★★★☆	★★★☆☆	★★★★☆	gute Prompttreue	FT-abhängig	8 GB	12 GB
GPT-OSS 20B	Agenten / Planung	★★★★★	★★★★☆	★★☆☆☆	GPT-Style	★★★★★	N/A	N/A	★★★★☆	★★★★★	★★★☆☆	★★★★★	Top-Agenten-LLM	groß	14 GB	20 GB
mistral 7B instruct	Leichtes Chat	★★★★★	★★★★★	★★☆☆☆	Mistral 7B	★★★★☆	N/A	N/A	★★★☆☆	★★★☆☆	★★☆☆☆	★★★☆☆	sehr schnell	weniger Tiefe	8 GB	12 GB
llama 3.2 vision 11B	Vision Allround	★★★★★	★★★★★	★★☆☆☆	LLaMA Vision	★★★★☆	★★★★☆	★★★☆☆	★★★☆☆	★★★☆☆	★★☆☆☆	★★★☆☆	solide Vision	groß	12 GB	16 GB
llava 13B	Vision QA	★★★★★	★★★★★	★★☆☆☆	LLaVA	★★★☆☆	★★★★☆	★★★☆☆	★★★☆☆	★★★☆☆	★☆☆☆☆	★★☆☆☆	bewährt	alt	16 GB	20 GB
qwen 3 14B	Generalist	★★★★★	★★★★★	★★☆☆☆	Qwen 3	★★★★☆	N/A	N/A	★★★☆☆	★★★★☆	★★★☆☆	★★★★☆	starkes Reasoning	Deutsch mittel	16 GB	20 GB
qwen 2.5 coder 14B	Coding / Tools	★★★★★	★★★★★	★★☆☆☆	Qwen Coder	★★★★☆	N/A	N/A	★★★☆☆	★★★☆☆	★★☆☆☆	★★★★★	bestes Coding	wenig kreativ	16 GB	20 GB
qwen 2.5 VL	Vision + OCR	★★★★★	★★★★★	★★☆☆☆	Qwen VL	★★★☆☆	★★★★☆	★★★★☆	★★★☆☆	★★★☆☆	★☆☆☆☆	★★★☆☆	sehr gutes OCR	Deutsch mittel	12 GB	16 GB
deepseek-r1 7B	Reasoning	★★★★★	★★★★★	★★☆☆☆	DeepSeek R1	★★★★☆	N/A	N/A	★★★☆☆	★★★★☆	★★★☆☆	★★★★☆	gutes Denken	langsam	8 GB	12 GB
gemma 3 12B	Präzise Antworten	★★★★★	★★★★★	★★☆☆☆	Gemma 3	★★★★☆	N/A	N/A	★★★☆☆	★★★★☆	★★☆☆☆	★★★★☆	sauber	wenig kreativ	12 GB	16 GB
gemma 2 9B	Leicht	★★★★★	★★★★★	★★☆☆☆	Gemma 2	★★★☆☆	N/A	N/A	★★★☆☆	★★★★☆	★★☆☆☆	★★★☆☆	stabil	begrenzt	8 GB	12 GB
granite 3.2	Business / RAG	★★★★★	★★★★★	★★☆☆☆	IBM Granite	★★★★☆	N/A	N/A	★★★☆☆	★★★★☆	★★☆☆☆	★★★★☆	kontrollierbar	wenig kreativ	8 GB	12 GB
granite 3.2 vision	Business Vision	★★★★★	★★★★★	★★☆☆☆	Granite Vision	★★★☆☆	★★★☆☆	★★★☆☆	★★★☆☆	★★★☆☆	★☆☆☆☆	★★★☆☆	stabil	schwache Vision	8 GB	12 GB
MedGemma 27B	Medizin Spezialist	★★★★★	★★★★★	★★☆☆☆	Med-FT	★★★★★	N/A	N/A	★★★☆☆	★★★★★	★★★★★	★★★☆☆	medizinisch stark	sehr groß	16 GB (Q4)	24–32 GB
LLaMA3-Med42-8B	Klinische Assistenz	★★★★★	★★★★★	★★☆☆☆	LLaMA + Med FT	★★★★☆	N/A	N/A	★★★☆☆	★★★★☆	★★★★☆	★★★☆☆	praxisnah	engl. Bias	12 GB	16 GB
qwen 3 8B	Leicht	★★★★★	★★★★★	★★☆☆☆	Qwen 3	★★★☆☆	N/A	N/A	★★☆☆☆	★★★☆☆	★★☆☆☆	★★★☆☆	effizient	limitiert	8 GB	12 GB
qwen 3 VL 4B	Vision light	★★★★★	★★★★★	★★☆☆☆	Qwen VL	★★☆☆☆	★★★☆☆	★★★☆☆	★★☆☆☆	★★☆☆☆	★☆☆☆☆	★★☆☆☆	klein & schnell	wenig Tiefe	6 GB	8 GB
deepseek-coder 6.7B	Coding	★★★★★	★★★★★	★★☆☆☆	DeepSeek Coder	★★★☆☆	N/A	N/A	★★☆☆☆	★★☆☆☆	★☆☆☆☆	★★★☆☆	effizient	Deutsch schwach	8 GB	12 GB
deepseek-OCR	OCR Spezialist	★★★★★	★★★★☆	★★☆☆☆	Vision + OCR FT	★★★☆☆	★★★★☆	★★★★★	★★☆☆☆	★★★☆☆	★☆☆☆☆	★★★☆☆	bestes OCR lokal	kaum Reasoning	8 GB	12 GB
gemma 2 2B	Edge	★★★★★	★★★★★	★★☆☆☆	Gemma 2	★★☆☆☆	N/A	N/A	★★☆☆☆	★★☆☆☆	★☆☆☆☆	★★☆☆☆	extrem klein	sehr limitiert	4 GB	6 GB
nemotron mini	Edge Agent	★★★★★	★★★★★	★★☆☆☆	NVIDIA	★★★☆☆	N/A	N/A	★★☆☆☆	★★☆☆☆	★☆☆☆☆	★★★☆☆	sehr schnell	flach	6 GB	8 GB
phi-3 3.8B	Fast Edge	★★★★★	★★★★★	★★☆☆☆	Microsoft Phi	★★★☆☆	N/A	N/A	★★☆☆☆	★★☆☆☆	★☆☆☆☆	★★☆☆☆	extrem schnell	kaum Tiefe	4 GB	6 GB

Hinweis: Die Bewertungen sind praxisnahe Einschätzungen und dienen der schnellen Orientierung, nicht als Faktenbehauptung.