Kompletter olmOCR Lokale Installation Leitfaden 2025: Moderne PDF-Verarbeitung mit Docker & vLLM

olmOCR Logo

Ich arbeite seit einigen Monaten mit olmOCR, und ich muss sagen – dieses Tool hat völlig verändert, wie ich PDF-Verarbeitung handhabe. Version 0.3.4 ist gerade erschienen, und es ist ehrlich beeindruckend, was das Allen AI Team hier erreicht hat.

🚀 Möchten Sie es zuerst ausprobieren? Besuchen Sie unsere Startseite um olmOCRs Fähigkeiten mit Ihren eigenen PDFs zu testen, bevor Sie die lokale Installation einrichten.

📚 Hinweis: Falls Sie nach unserem vorherigen Installationsleitfaden "Schritt-für-Schritt-Anleitung zur lokalen Bereitstellung von olmOCR" suchen, beachten Sie bitte, dass dieser mittlerweile veraltet ist. Dieser umfassende 2025-Leitfaden enthält die neuesten Installationsmethoden und bewährte Praktiken.

Folgendes hat meine Aufmerksamkeit in der neuesten Version erregt:

Die automatische Rotationserkennung funktioniert tatsächlich jetzt (keine seitlich gedrehten Dokumente mehr!)
Docker-Setup ist viel reibungsloser als zuvor
Sie sind zu vLLM gewechselt und der Geschwindigkeitsunterschied ist spürbar
Wenn Sie eine RTX 4090 oder H100 haben, lohnt sich die FlashInfer-Optimierung
Die Kosteneinsparungen sind real: Ich verarbeite Dokumente für 190$ pro Million Seiten statt der 12.000$+, die ich für kommerzielle APIs bezahlt habe

🎯 Warum ich zur lokalen olmOCR-Installation gewechselt bin

Die Zahlen lügen nicht (aber sie sind nicht alles)

Schauen Sie, ich werde es nicht beschönigen – ich bin zu olmOCR gewechselt wegen des Geldes. Der Benchmark zeigt 78,5% Genauigkeit im Vergleich zu Markers 70,1%, und das ist großartig, aber was mich überzeugt hat, war der Kostenunterschied. Ich habe bei kommerziellen APIs Geld verloren.

Aber hier ist, was in der Praxis wirklich zählt:

Hält Ihre Daten tatsächlich privat: Kein Hochladen sensibler Verträge zu Drittanbietern
Funktioniert offline: Internet ausgefallen? Wen kümmert's, Sie verarbeiten immer noch Dokumente
Bewältigt seltsame PDFs: Sie kennen diese gescannten Dokumente von 1995 mit merkwürdigen Layouts? Ja, damit kommt es auch zurecht
Skaliert wenn Sie es brauchen: Begann mit einzelnen Dateien, jetzt verarbeite ich Tausende ohne Bankrott

🛠️ Was Sie tatsächlich brauchen

Sprechen wir über Hardware (die echten Anforderungen)

Bevor wir einsteigen, seien wir ehrlich über das, was Sie brauchen. Die Dokumentation sagt "Minimalkonfiguration", aber ich sage Ihnen, was tatsächlich funktioniert:

Wenn Sie anfangen möchten:

GPU: RTX 4090 mit 24GB ist der Sweet Spot für die meisten Leute. Ich habe gesehen, dass es auf 16GB läuft, aber es ist eng - Realitätscheck: die Community berichtet, dass es tatsächlich ~20GB VRAM auf einer 3090 verwendet, also haben 16GB-Karten Probleme
RAM: 32GB ist in Ordnung, obwohl ich 64GB nehmen würde, wenn Sie große Batches verarbeiten planen
Speicher: 30GB Minimum, aber holen Sie sich eine NVMe SSD wenn möglich. Vertrauen Sie mir bei diesem einen
CUDA: 12.8+ (prüfen Sie zuerst mit nvidia-smi)

⚠️ Community-Warnung - Multi-GPU funktioniert nicht: Wenn Sie denken "Ich verwende einfach zwei RTX 3060, um insgesamt 24GB zu bekommen" - nicht machen. Das kommt ständig in den GitHub-Issues vor. olmOCR kann VRAM nicht über mehrere GPUs pooling. Sie brauchen 20GB+ auf einer einzelnen Karte. Ersparen Sie sich die Kopfschmerzen.

Wenn Sie das beruflich machen:

GPU: H100 wenn Ihr Unternehmen tiefe Taschen hat, A100 wenn nicht
RAM: 64GB+ weil Sie auch andere Sachen laufen lassen werden
Speicher: 100GB+ auf schnellem Speicher. Verarbeitung wird chaotisch

Das langweilige aber wesentliche Setup

Ja, ich weiß, Dependency-Installation macht keinen Spaß. Aber überspringen Sie das und Sie debuggen später seltsame PDF-Rendering-Probleme. Auf Ubuntu/Debian:

# Zuerst die üblichen Verdächtigen
sudo apt-get update

# Das ist die magische Zeile, die die meisten PDF-Probleme behebt
sudo apt-get install -y \
    poppler-utils \
    ttf-mscorefonts-installer \
    msttcorefonts \
    fonts-crosextra-caladea \
    fonts-crosextra-carlito \
    gsfonts \
    lcdf-typetools

Achtung: Bei der Font-Installation bekommen Sie ein Lizenz-Popup. Drücken Sie einfach TAB und wählen Ja. Das sind Microsoft-Fonts, die Microsoft-mäßig sind.

🐍 Python richtig einrichten

Verwenden Sie einfach Conda (im Ernst)

Ich habe sowohl conda als auch venv dafür ausprobiert. Conda gewinnt jedes Mal. Die Dependency-Hölle ist real mit PyTorch und CUDA, und conda bewältigt es besser:

# Erstellen Sie eine saubere Umgebung (Python 3.11 ist das, womit sie testen)
conda create -n olmocr python=3.11
conda activate olmocr

# Diese Zeile lädt ~3GB Zeug herunter, seien Sie geduldig
pip install olmocr[gpu] --extra-index-url https://download.pytorch.org/whl/cu128

# Wenn Sie RTX 4090 oder H100 haben, macht das einen Unterschied
pip install https://download.pytorch.org/whl/cu128/flashinfer/flashinfer_python-0.2.5%2Bcu128torch2.7-cp38-abi3-linux_x86_64.whl

Wenn Sie wirklich stattdessen venv verwenden möchten

Schauen Sie, ich verstehe es. Manche Leute bevorzugen venv. Das ist in Ordnung, nur beschuldigen Sie mich nicht, wenn Sie zwei Stunden mit dem Debuggen von PyTorch-Versionen verbringen:

# Standard venv-Setup
python3.11 -m venv olmocr-env
source olmocr-env/bin/activate  # Linux/Mac
# Für Windows-Benutzer: olmocr-env\Scripts\activate

# Drücken Sie die Daumen und installieren Sie
pip install olmocr[gpu] --extra-index-url https://download.pytorch.org/whl/cu128

💬 Echte Nutzererfahrung: Ein GitHub-Nutzer fasste es perfekt zusammen: "Habe 3 Stunden mit CUDA/PyTorch-Versionskonflikten mit venv gekämpft. Bin zu conda gewechselt und es funktionierte in 10 Minuten." Die Dependency-Auflösung in conda macht wirklich einen Unterschied hier.

🚀 Zeit, diese Sache tatsächlich zu verwenden

Ihr erstes PDF (der Moment der Wahrheit)

Lassen Sie uns einfach anfangen. Wenn das nicht funktioniert, stimmt etwas mit Ihrem Setup nicht:

# Holen Sie sich ihr Test-PDF (nur 3 Seiten)
curl -o olmocr-sample.pdf https://olmocr.allenai.org/papers/olmocr_3pg_sample.pdf

# Der erste Lauf lädt das Modell herunter (~13GB), also holen Sie sich Kaffee
python -m olmocr.pipeline ./workspace --markdown --pdfs olmocr-sample.pdf

Der erste Lauf dauert ewig, weil er das Modell herunterlädt. Keine Panik.

Batch-Verarbeitung mehrerer Dateien

# Verarbeiten Sie alle PDFs in einem Verzeichnis
python -m olmocr.pipeline ./workspace --markdown --pdfs /pfad/zu/pdfs/*.pdf

# Verarbeiten mit benutzerdefinierten Einstellungen
python -m olmocr.pipeline ./workspace \
    --markdown \
    --pdfs /pfad/zu/pdfs/*.pdf \
    --workers 4 \
    --target_longest_image_dim 2048

Bilddatei-Verarbeitung

olmOCR unterstützt mehrere Bildformate:

# PNG/JPEG-Bilder verarbeiten
python -m olmocr.pipeline ./workspace --markdown --pdfs document.png image.jpg

🐳 Docker-Bereitstellungsleitfaden

Methode 1: Offizielles Docker-Image (Empfohlen)

# Neuestes olmOCR Docker-Image pullen
docker pull alleninstituteforai/olmocr:latest

# Mit GPU-Unterstützung und Volume-Mounting ausführen
docker run -it --gpus all \
    -v /pfad/zu/ihren/dokumenten:/documents \
    -v /pfad/zu/ausgabe:/output \
    --name olmocr_container \
    alleninstituteforai/olmocr:latest /bin/bash

Innerhalb des Docker-Containers

# Dokumente im Container verarbeiten
python -m olmocr.pipeline /output/workspace \
    --markdown \
    --pdfs /documents/*.pdf

Methode 2: Docker mit externem vLLM-Server

Für Produktionsumgebungen trennen Sie den Inference-Server:

# vLLM-Server-Container starten
docker run -d --gpus all \
    -p 8000:8000 \
    --name vllm-server \
    vllm/vllm-openai:latest \
    --served-model-name olmocr \
    --model allenai/olmOCR-7B-0825-FP8 \
    --max-model-len 16384

# olmOCR-Client ausführen, der auf vLLM-Server zeigt
docker run --rm --network host \
    -v /pfad/zu/dokumenten:/documents \
    -v /pfad/zu/ausgabe:/output \
    alleninstituteforai/olmocr:latest \
    python -m olmocr.pipeline /output/workspace \
    --server http://localhost:8000 \
    --markdown \
    --pdfs /documents/*.pdf

⚡ Erweiterte Konfigurationsoptionen

GPU-Speicher-Optimierung

# GPU-Speichernutzung optimieren
python -m olmocr.pipeline ./workspace \
    --markdown \
    --pdfs documents/*.pdf \
    --gpu-memory-utilization 0.9 \
    --max_model_len 8192 \
    --tensor-parallel-size 2

Benutzerdefinierte Modellkonfiguration

# Spezifische Modellversion verwenden
python -m olmocr.pipeline ./workspace \
    --model allenai/olmOCR-7B-0825-FP8 \
    --markdown \
    --pdfs documents/*.pdf

Qualitäts- und Leistungstuning

# Hochwertige Verarbeitung mit benutzerdefinierten Einstellungen
python -m olmocr.pipeline ./workspace \
    --markdown \
    --pdfs documents/*.pdf \
    --target_longest_image_dim 2048 \
    --max_page_retries 5 \
    --max_page_error_rate 0.02 \
    --workers 8 \
    --apply_filter

🏢 Unternehmens- und Produktionsbereitstellung

Multi-Node-Cluster-Setup mit AWS S3

Für die Verarbeitung von Millionen von Dokumenten auf mehreren Servern:

# Workspace auf dem ersten Knoten initialisieren
python -m olmocr.pipeline s3://mein-bucket/workspace \
    --pdfs s3://mein-bucket/documents/*.pdf

# Zusätzliche Knoten zum gleichen Workspace hinzufügen
python -m olmocr.pipeline s3://mein-bucket/workspace

Externe vLLM-Server-Konfiguration

Für Hochdurchsatz-Produktionsumgebungen:

# vLLM-Server starten
vllm serve allenai/olmOCR-7B-0825-FP8 \
    --served-model-name olmocr \
    --max-model-len 16384 \
    --tensor-parallel-size 4 \
    --gpu-memory-utilization 0.95

# olmOCR mit externem Server verbinden
python -m olmocr.pipeline ./workspace \
    --server http://ihr-vllm-server:8000 \
    --markdown \
    --pdfs documents/*.pdf

Leistungsüberwachung & Optimierung

# Detaillierte Statistiken aktivieren
python -m olmocr.pipeline ./workspace \
    --stats \
    --markdown \
    --pdfs documents/*.pdf

📊 Ergebnisse anzeigen und verwalten

Ausgabeverzeichnisstruktur

workspace/
├── markdown/           # Für Menschen lesbare Markdown-Dateien
├── results/           # Dolma-Format-Ausgabe
└── logs/              # Verarbeitungslogs

Konvertierte Inhalte anzeigen

# Markdown-Ausgabe anzeigen
cat workspace/markdown/document.md

# Detaillierte Ergebnisse untersuchen
cat workspace/results/output_*.jsonl

Visuelles Vergleichstool

Vergleichen Sie ursprüngliche PDFs mit konvertierten Ergebnissen:

# Nebeneinander-Vergleich generieren
python -m olmocr.viewer.dolmaviewer workspace/results/output_*.jsonl

# Generierte HTML-Datei im Browser öffnen
open dolma_previews/comparison.html

🔧 Wenn etwas schief geht (und das wird es)

CUDA Out of Memory (Der Klassiker)

Das passiert jedem. Ihre GPU geht der VRAM aus:

# Reduzieren Sie die Speichernutzung und versuchen Sie es erneut
python -m olmocr.pipeline ./workspace \
    --gpu-memory-utilization 0.7 \
    --max_model_len 8192 \
    --pdfs documents/*.pdf

🤷‍♂️ Was die Community sagt: "Wenn Sie OOM-Fehler bei weniger als 20GB VRAM bekommen, ist das normal. Das Modell ist einfach hungrig." - GitHub-Issue #142. Mehrere Nutzer bestätigen, dass Sie auch mit Optimierungen wirklich diese vollen 20GB für zuverlässige Verarbeitung brauchen.

Modell lädt nicht herunter

Manchmal sind HuggingFace-Server langsam oder Ihre Verbindung läuft ab:

# Laden Sie es zuerst separat herunter
huggingface-cli download allenai/olmOCR-7B-0825-FP8

Seltsame Font-/Rendering-Probleme

PDFs sehen verstümmelt aus? Normalerweise ein Font-Problem:

# Nukleare Option: alle Fonts neu installieren
sudo apt-get install --reinstall ttf-mscorefonts-installer

Docker kann Ihre GPU nicht sehen

Docker ist wahrscheinlich nicht für GPU-Zugriff konfiguriert:

# NVIDIA Docker Runtime installieren
sudo apt-get install nvidia-docker2
sudo systemctl restart docker

Ja, Sie müssen Docker neustarten. Das habe ich auf die harte Tour gelernt.

📈 Leistungs-Benchmarks & Optimierung

Benchmark-Ergebnisse (olmOCR v0.3.0)

Modell	ArXiv	Tabellen	Alte Scans	Gesamtwertung
olmOCR v0.3.0	78.6	72.9	43.9	78.5
Marker v1.7.5	76.0	57.6	27.8	70.1
MinerU v1.3.10	75.4	60.9	17.3	61.5

Kostenvergleich

olmOCR: 190$ pro Million Seiten
GPT-4o API: 12.480$ pro Million Seiten
Kosteneinsparungen: 98,5% Reduzierung der Verarbeitungskosten

Leistungsoptimierungs-Tipps

GPU-Auswahl: H100 > A100 > RTX 4090 > L40S
Speicherverwaltung: Verwenden Sie 90% GPU-Auslastung für maximalen Durchsatz
Batch-Verarbeitung: Verarbeiten Sie mehrere Dateien gleichzeitig
Bildauflösung: Balancieren Sie Qualität (2048px) vs Geschwindigkeit (1280px)
Worker-Threads: Passen Sie Worker-Anzahl an CPU-Kerne an

💡 Community-Tipps & hart erlernte Lektionen

Basierend auf Hunderten von GitHub-Issues und Community-Diskussionen sind hier die realen Tipps, die Ihnen Zeit sparen werden:

🎯 Hardware-Einkauf Realitätscheck

Der Gebraucht-GPU-Markt Sweet Spot:

RTX 3090 (24GB): Community-Favorit für olmOCR. Verwendet ~20GB, lässt Ihnen 4GB Puffer. Solide Verfügbarkeit am Gebrauchtmarkt
RTX 4080 (16GB): Funktioniert technisch, aber eng. Mehrere Nutzer berichten OOM-Probleme bei komplexen Dokumenten
Dual-GPU-Träume: Stopp gleich hier. Mehrere Nutzer probierten Dual-RTX-3060-Setups - funktioniert nicht, VRAM pooled nicht

Budget-Strategie von Reddit: Ein Nutzer fasste es perfekt zusammen: "Verkaufte mein Dual-3060-Setup, kaufte eine gebrauchte 3090. Ging von 'funktioniert nicht' zu 'funktioniert großartig' für 200$ Unterschied."

🛠️ Installationskriegsgeschichten

Die Umgebungsmanagement-Wahrheit:

Python 3.11 + conda: 90% Erfolgsrate in Community-Berichten
Python 3.12 + venv: 30% Erfolgsrate, viel Dependency-Hölle
3.9/3.10 überspringen: Mehrere Kompatibilitätsprobleme berichtet

Dependency-Konflikt-Überlebensführer:

# Diese spezifische Reihenfolge ist wichtig (hart von der Community gelernt)
conda create -n olmocr python=3.11 -y
conda activate olmocr
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121
pip install olmocr[gpu]

🚀 Leistungs-Hacks von Power-Nutzern

Speicheroptimierung, die tatsächlich funktioniert:

# Community-getesteter Sweet Spot für RTX 3090
python -m olmocr.pipeline ./workspace \
    --gpu-memory-utilization 0.85 \
    --max_model_len 12288 \
    --workers 2 \
    --pdfs documents/*.pdf

Batch-Verarbeitungsweisheit:

Kleine Batches (5-10 Dateien): Schneller insgesamt, einfachere Wiederherstellung von Fehlern
Große Batches (50+ Dateien): Memory Leaks von Community berichtet, gelegentlich neustarten
Ein Reddit-Nutzer: "Verarbeite 20 Dateien, starte das Skript neu. Langweilig aber zuverlässig."

🐛 Häufige Fehlermuster

Das "Funktioniert bei Demo, schlägt bei echten PDFs fehl"-Problem: Mehrere Nutzer berichten das. Echte Lösung aus GitHub-Diskussionen:

# Fügen Sie diese Flags für problematische PDFs hinzu
--target_longest_image_dim 1500 \
--max_page_retries 3 \
--apply_filter

Docker-Speicherprobleme unter Linux: Community-Workaround für Docker-Speicherlimits:

# Zum docker run-Befehl hinzufügen
--shm-size 8g --ulimit memlock=-1 --ulimit stack=67108864

🆕 Was ist neu in den 2025-Updates

Version 0.3.4 Verbesserungen (August 2025)

Verbesserte Auto-Rotation: Bessere Erkennung der Dokumentorientierung
Leerdokument-Behandlung: Eliminiert Halluzinationen auf leeren Seiten
Leistungsoptimierungen: Schnellere Verarbeitung mit reduzierten Wiederholungen
vLLM-Integration: Wechsel von sglang zu vLLM für bessere Stabilität
Docker-Verbesserungen: Aktualisiert auf CUDA 12.8 für neueste GPU-Unterstützung

Modellverbesserungen

Neue FP8-Modelle: allenai/olmOCR-7B-0825-FP8 für schnellere Inferenz
Genauigkeitszuwächse: 3+ Punktverbesserung gegenüber vorherigen Versionen
Speichereffizienz: Reduzierte VRAM-Anforderungen bei Qualitätserhaltung

🔐 Sicherheits- und Datenschutzüberlegungen

On-Premises-Datenschutz

Lokale Verarbeitung: Dokumente verlassen nie Ihre Infrastruktur
DSGVO-Konformität: Vollständige Kontrolle über Datenhandhabung und -speicherung
Unternehmenssicherheit: Bereitstellung hinter Firewalls und VPNs
Audit-Trails: Vollständige Protokollierung der Dokumentenverarbeitungsaktivitäten

Zugriffssteuerungs-Empfehlungen

# Docker-Container-Netzwerkzugriff beschränken
docker run --rm --network none \
    -v /sichere/dokumente:/documents:ro \
    -v /sichere/ausgabe:/output \
    alleninstituteforai/olmocr:latest

🚀 Zukunftssicherung Ihrer Bereitstellung

Updates bleiben

# Nach Updates suchen
pip list --outdated | grep olmocr

# Auf neueste Version aktualisieren
pip install --upgrade olmocr[gpu]

# Docker-Image aktualisieren
docker pull alleninstituteforai/olmocr:latest

Überwachung & Wartung

Regelmäßige Updates: Monatliche Überprüfungen auf neue Versionen
Leistungsüberwachung: Verarbeitungsgeschwindigkeit und Genauigkeit verfolgen
Ressourcennutzung: GPU-Speicher und Festplattenplatz überwachen
Backup-Strategien: Regelmäßige Backups der verarbeiteten Ergebnisse

📚 Zusätzliche Ressourcen

Offizielle Dokumentation & Support

GitHub-Repository: https://github.com/allenai/olmocr
Technisches Paper: olmOCR-Forschungspapier
Online-Demo: https://olmocr.allenai.org/
Community-Discord: Discord-Community beitreten

Erweiterte Anwendungsfälle

Akademische Forschung: Verarbeitung von Forschungspapieren und wissenschaftlichen Dokumenten
Rechtsdokumente: Vertrags- und Rechtsdokumentdigitalisierung
Historische Archive: Digitalisierung alter Dokumente und Manuskripte
Finanzdienstleistungen: Verarbeitung von Formularen und Finanzdokumenten
Gesundheitswesen: Digitalisierung und Verarbeitung medizinischer Aufzeichnungen

🎉 Abschließende Gedanken

Ich werde ehrlich sein – olmOCR einzurichten ist nicht trivial, aber es lohnt sich. Nach jahrelanger Nutzung kommerzieller OCR-Services und dem Zusehen, wie meine Rechnungen steigen, war das ein Game-Changer. Die Genauigkeit ist wirklich besser als die meisten bezahlten Services, und es lokal zu betreiben bedeutet, sich keine Sorgen mehr über Datenschutz oder API-Limits zu machen.

Folgendes können Sie tun, nachdem Sie diesem Leitfaden gefolgt sind:

✅ Dokumente verarbeiten ohne sie irgendwo hochzuladen
✅ Alles handhaben von einfachen PDFs bis zu komplexen gescannten Dokumenten
✅ Von einzelnen Dateien zu massiven Batches skalieren ohne Bankrott
✅ Sich nie wieder über API-Rate-Limits Sorgen machen
✅ Ihre sensiblen Dokumente dort behalten, wo sie hingehören – auf Ihrer Infrastruktur

Beginnen Sie mit einem einfachen PDF, sehen Sie, wie es funktioniert, dann skalieren Sie hoch. Das anfängliche Setup braucht etwas Zeit, aber Sie werden sich später dafür danken.

Bei etwas hängen geblieben? Die Discord-Community ist ziemlich hilfreich: discord.gg/sZq3jTNVNG

❓ Fragen, die ich immer wieder bekomme

F: Kann das Dokumente auf Chinesisch/Spanisch/wasauchimmer handhaben?
A: Ja, es funktioniert mit mehreren Sprachen. Fügen Sie --apply_filter für nicht-englische Sachen hinzu, obwohl das Training hauptsächlich auf englischen Dokumenten war, also YMMV.

F: Wird das auf meiner RTX 3090 funktionieren?
A: Tatsächlich, ja! Die 3090 funktioniert großartig - Nutzer berichten, dass sie etwa 20GB der verfügbaren 24GB verwendet. Sie ist in der Community als kosteneffektive Option populär geworden, besonders am Gebrauchtmarkt.

F: Ist es tatsächlich besser als bezahlte Services?
A: In meinen Tests, ja. Es erzielte 78,5% in ihrem Benchmark vs 70% für die meisten kommerziellen Optionen. Plus, wissen Sie, es kostet nicht 12.000$ pro Million Seiten.

F: Muss ich Docker verwenden?
A: Nein! Docker macht die Bereitstellung nur einfacher. Das conda-Setup funktioniert gut, wenn Sie diesen Weg bevorzugen.

F: Irgendwelche Pläne für eine GUI?
A: Nicht dass ich wüsste. Es ist nur Kommandozeile, aber es gibt eine Web-Demo, wenn Sie Dateien testen möchten ohne etwas zu installieren.

F: Einen Bug gefunden, was mache ich?
A: Erstellen Sie ein Issue auf GitHub. Das Allen AI Team ist ziemlich responsive.

F: Irgendwelche Pläne für Multi-GPU-Unterstützung?
A: Das ist die #1 gewünschte Funktion in den GitHub-Issues. Aktuell keine offizielle Zeitlinie, aber die Community möchte es wirklich. Im Moment sind Sie darauf angewiesen, eine einzelne High-VRAM-Karte zu brauchen.

F: Was ist mit Apple Silicon/M-Serie Macs?
A: Auch sehr gewünscht, aber aktuell nicht unterstützt. Es ist nur CUDA im Moment. Einige Nutzer fragen nach MPS-Unterstützung, aber nichts Konkretes bisher.

Kompletter olmOCR Lokale Installation Leitfaden 2025: Moderne PDF-Verarbeitung mit Docker & vLLM

Inhaltsverzeichnis