Ich arbeite seit einigen Monaten mit olmOCR, und ich muss sagen – dieses Tool hat völlig verändert, wie ich PDF-Verarbeitung handhabe. Version 0.3.4 ist gerade erschienen, und es ist ehrlich beeindruckend, was das Allen AI Team hier erreicht hat.
🚀 Möchten Sie es zuerst ausprobieren? Besuchen Sie unsere Startseite um olmOCRs Fähigkeiten mit Ihren eigenen PDFs zu testen, bevor Sie die lokale Installation einrichten.
📚 Hinweis: Falls Sie nach unserem vorherigen Installationsleitfaden "Schritt-für-Schritt-Anleitung zur lokalen Bereitstellung von olmOCR" suchen, beachten Sie bitte, dass dieser mittlerweile veraltet ist. Dieser umfassende 2025-Leitfaden enthält die neuesten Installationsmethoden und bewährte Praktiken.
Folgendes hat meine Aufmerksamkeit in der neuesten Version erregt:
- Die automatische Rotationserkennung funktioniert tatsächlich jetzt (keine seitlich gedrehten Dokumente mehr!)
- Docker-Setup ist viel reibungsloser als zuvor
- Sie sind zu vLLM gewechselt und der Geschwindigkeitsunterschied ist spürbar
- Wenn Sie eine RTX 4090 oder H100 haben, lohnt sich die FlashInfer-Optimierung
- Die Kosteneinsparungen sind real: Ich verarbeite Dokumente für 190$ pro Million Seiten statt der 12.000$+, die ich für kommerzielle APIs bezahlt habe
🎯 Warum ich zur lokalen olmOCR-Installation gewechselt bin
Die Zahlen lügen nicht (aber sie sind nicht alles)
Schauen Sie, ich werde es nicht beschönigen – ich bin zu olmOCR gewechselt wegen des Geldes. Der Benchmark zeigt 78,5% Genauigkeit im Vergleich zu Markers 70,1%, und das ist großartig, aber was mich überzeugt hat, war der Kostenunterschied. Ich habe bei kommerziellen APIs Geld verloren.
Aber hier ist, was in der Praxis wirklich zählt:
- Hält Ihre Daten tatsächlich privat: Kein Hochladen sensibler Verträge zu Drittanbietern
- Funktioniert offline: Internet ausgefallen? Wen kümmert's, Sie verarbeiten immer noch Dokumente
- Bewältigt seltsame PDFs: Sie kennen diese gescannten Dokumente von 1995 mit merkwürdigen Layouts? Ja, damit kommt es auch zurecht
- Skaliert wenn Sie es brauchen: Begann mit einzelnen Dateien, jetzt verarbeite ich Tausende ohne Bankrott
🛠️ Was Sie tatsächlich brauchen
Sprechen wir über Hardware (die echten Anforderungen)
Bevor wir einsteigen, seien wir ehrlich über das, was Sie brauchen. Die Dokumentation sagt "Minimalkonfiguration", aber ich sage Ihnen, was tatsächlich funktioniert:
Wenn Sie anfangen möchten:
- GPU: RTX 4090 mit 24GB ist der Sweet Spot für die meisten Leute. Ich habe gesehen, dass es auf 16GB läuft, aber es ist eng - Realitätscheck: die Community berichtet, dass es tatsächlich ~20GB VRAM auf einer 3090 verwendet, also haben 16GB-Karten Probleme
- RAM: 32GB ist in Ordnung, obwohl ich 64GB nehmen würde, wenn Sie große Batches verarbeiten planen
- Speicher: 30GB Minimum, aber holen Sie sich eine NVMe SSD wenn möglich. Vertrauen Sie mir bei diesem einen
- CUDA: 12.8+ (prüfen Sie zuerst mit
nvidia-smi)
⚠️ Community-Warnung - Multi-GPU funktioniert nicht: Wenn Sie denken "Ich verwende einfach zwei RTX 3060, um insgesamt 24GB zu bekommen" - nicht machen. Das kommt ständig in den GitHub-Issues vor. olmOCR kann VRAM nicht über mehrere GPUs pooling. Sie brauchen 20GB+ auf einer einzelnen Karte. Ersparen Sie sich die Kopfschmerzen.
Wenn Sie das beruflich machen:
- GPU: H100 wenn Ihr Unternehmen tiefe Taschen hat, A100 wenn nicht
- RAM: 64GB+ weil Sie auch andere Sachen laufen lassen werden
- Speicher: 100GB+ auf schnellem Speicher. Verarbeitung wird chaotisch
Das langweilige aber wesentliche Setup
Ja, ich weiß, Dependency-Installation macht keinen Spaß. Aber überspringen Sie das und Sie debuggen später seltsame PDF-Rendering-Probleme. Auf Ubuntu/Debian:
# Zuerst die üblichen Verdächtigen
sudo apt-get update
# Das ist die magische Zeile, die die meisten PDF-Probleme behebt
sudo apt-get install -y \
poppler-utils \
ttf-mscorefonts-installer \
msttcorefonts \
fonts-crosextra-caladea \
fonts-crosextra-carlito \
gsfonts \
lcdf-typetoolsAchtung: Bei der Font-Installation bekommen Sie ein Lizenz-Popup. Drücken Sie einfach TAB und wählen Ja. Das sind Microsoft-Fonts, die Microsoft-mäßig sind.
🐍 Python richtig einrichten
Verwenden Sie einfach Conda (im Ernst)
Ich habe sowohl conda als auch venv dafür ausprobiert. Conda gewinnt jedes Mal. Die Dependency-Hölle ist real mit PyTorch und CUDA, und conda bewältigt es besser:
# Erstellen Sie eine saubere Umgebung (Python 3.11 ist das, womit sie testen)
conda create -n olmocr python=3.11
conda activate olmocr
# Diese Zeile lädt ~3GB Zeug herunter, seien Sie geduldig
pip install olmocr[gpu] --extra-index-url https://download.pytorch.org/whl/cu128
# Wenn Sie RTX 4090 oder H100 haben, macht das einen Unterschied
pip install https://download.pytorch.org/whl/cu128/flashinfer/flashinfer_python-0.2.5%2Bcu128torch2.7-cp38-abi3-linux_x86_64.whlWenn Sie wirklich stattdessen venv verwenden möchten
Schauen Sie, ich verstehe es. Manche Leute bevorzugen venv. Das ist in Ordnung, nur beschuldigen Sie mich nicht, wenn Sie zwei Stunden mit dem Debuggen von PyTorch-Versionen verbringen:
# Standard venv-Setup
python3.11 -m venv olmocr-env
source olmocr-env/bin/activate # Linux/Mac
# Für Windows-Benutzer: olmocr-env\Scripts\activate
# Drücken Sie die Daumen und installieren Sie
pip install olmocr[gpu] --extra-index-url https://download.pytorch.org/whl/cu128💬 Echte Nutzererfahrung: Ein GitHub-Nutzer fasste es perfekt zusammen: "Habe 3 Stunden mit CUDA/PyTorch-Versionskonflikten mit venv gekämpft. Bin zu conda gewechselt und es funktionierte in 10 Minuten." Die Dependency-Auflösung in conda macht wirklich einen Unterschied hier.
🚀 Zeit, diese Sache tatsächlich zu verwenden
Ihr erstes PDF (der Moment der Wahrheit)
Lassen Sie uns einfach anfangen. Wenn das nicht funktioniert, stimmt etwas mit Ihrem Setup nicht:
# Holen Sie sich ihr Test-PDF (nur 3 Seiten)
curl -o olmocr-sample.pdf https://olmocr.allenai.org/papers/olmocr_3pg_sample.pdf
# Der erste Lauf lädt das Modell herunter (~13GB), also holen Sie sich Kaffee
python -m olmocr.pipeline ./workspace --markdown --pdfs olmocr-sample.pdfDer erste Lauf dauert ewig, weil er das Modell herunterlädt. Keine Panik.
Batch-Verarbeitung mehrerer Dateien
# Verarbeiten Sie alle PDFs in einem Verzeichnis
python -m olmocr.pipeline ./workspace --markdown --pdfs /pfad/zu/pdfs/*.pdf
# Verarbeiten mit benutzerdefinierten Einstellungen
python -m olmocr.pipeline ./workspace \
--markdown \
--pdfs /pfad/zu/pdfs/*.pdf \
--workers 4 \
--target_longest_image_dim 2048Bilddatei-Verarbeitung
olmOCR unterstützt mehrere Bildformate:
# PNG/JPEG-Bilder verarbeiten
python -m olmocr.pipeline ./workspace --markdown --pdfs document.png image.jpg🐳 Docker-Bereitstellungsleitfaden
Methode 1: Offizielles Docker-Image (Empfohlen)
# Neuestes olmOCR Docker-Image pullen
docker pull alleninstituteforai/olmocr:latest
# Mit GPU-Unterstützung und Volume-Mounting ausführen
docker run -it --gpus all \
-v /pfad/zu/ihren/dokumenten:/documents \
-v /pfad/zu/ausgabe:/output \
--name olmocr_container \
alleninstituteforai/olmocr:latest /bin/bashInnerhalb des Docker-Containers
# Dokumente im Container verarbeiten
python -m olmocr.pipeline /output/workspace \
--markdown \
--pdfs /documents/*.pdfMethode 2: Docker mit externem vLLM-Server
Für Produktionsumgebungen trennen Sie den Inference-Server:
# vLLM-Server-Container starten
docker run -d --gpus all \
-p 8000:8000 \
--name vllm-server \
vllm/vllm-openai:latest \
--served-model-name olmocr \
--model allenai/olmOCR-7B-0825-FP8 \
--max-model-len 16384
# olmOCR-Client ausführen, der auf vLLM-Server zeigt
docker run --rm --network host \
-v /pfad/zu/dokumenten:/documents \
-v /pfad/zu/ausgabe:/output \
alleninstituteforai/olmocr:latest \
python -m olmocr.pipeline /output/workspace \
--server http://localhost:8000 \
--markdown \
--pdfs /documents/*.pdf⚡ Erweiterte Konfigurationsoptionen
GPU-Speicher-Optimierung
# GPU-Speichernutzung optimieren
python -m olmocr.pipeline ./workspace \
--markdown \
--pdfs documents/*.pdf \
--gpu-memory-utilization 0.9 \
--max_model_len 8192 \
--tensor-parallel-size 2Benutzerdefinierte Modellkonfiguration
# Spezifische Modellversion verwenden
python -m olmocr.pipeline ./workspace \
--model allenai/olmOCR-7B-0825-FP8 \
--markdown \
--pdfs documents/*.pdfQualitäts- und Leistungstuning
# Hochwertige Verarbeitung mit benutzerdefinierten Einstellungen
python -m olmocr.pipeline ./workspace \
--markdown \
--pdfs documents/*.pdf \
--target_longest_image_dim 2048 \
--max_page_retries 5 \
--max_page_error_rate 0.02 \
--workers 8 \
--apply_filter🏢 Unternehmens- und Produktionsbereitstellung
Multi-Node-Cluster-Setup mit AWS S3
Für die Verarbeitung von Millionen von Dokumenten auf mehreren Servern:
# Workspace auf dem ersten Knoten initialisieren
python -m olmocr.pipeline s3://mein-bucket/workspace \
--pdfs s3://mein-bucket/documents/*.pdf
# Zusätzliche Knoten zum gleichen Workspace hinzufügen
python -m olmocr.pipeline s3://mein-bucket/workspaceExterne vLLM-Server-Konfiguration
Für Hochdurchsatz-Produktionsumgebungen:
# vLLM-Server starten
vllm serve allenai/olmOCR-7B-0825-FP8 \
--served-model-name olmocr \
--max-model-len 16384 \
--tensor-parallel-size 4 \
--gpu-memory-utilization 0.95
# olmOCR mit externem Server verbinden
python -m olmocr.pipeline ./workspace \
--server http://ihr-vllm-server:8000 \
--markdown \
--pdfs documents/*.pdfLeistungsüberwachung & Optimierung
# Detaillierte Statistiken aktivieren
python -m olmocr.pipeline ./workspace \
--stats \
--markdown \
--pdfs documents/*.pdf📊 Ergebnisse anzeigen und verwalten
Ausgabeverzeichnisstruktur
workspace/
├── markdown/ # Für Menschen lesbare Markdown-Dateien
├── results/ # Dolma-Format-Ausgabe
└── logs/ # VerarbeitungslogsKonvertierte Inhalte anzeigen
# Markdown-Ausgabe anzeigen
cat workspace/markdown/document.md
# Detaillierte Ergebnisse untersuchen
cat workspace/results/output_*.jsonlVisuelles Vergleichstool
Vergleichen Sie ursprüngliche PDFs mit konvertierten Ergebnissen:
# Nebeneinander-Vergleich generieren
python -m olmocr.viewer.dolmaviewer workspace/results/output_*.jsonl
# Generierte HTML-Datei im Browser öffnen
open dolma_previews/comparison.html🔧 Wenn etwas schief geht (und das wird es)
CUDA Out of Memory (Der Klassiker)
Das passiert jedem. Ihre GPU geht der VRAM aus:
# Reduzieren Sie die Speichernutzung und versuchen Sie es erneut
python -m olmocr.pipeline ./workspace \
--gpu-memory-utilization 0.7 \
--max_model_len 8192 \
--pdfs documents/*.pdf🤷♂️ Was die Community sagt: "Wenn Sie OOM-Fehler bei weniger als 20GB VRAM bekommen, ist das normal. Das Modell ist einfach hungrig." - GitHub-Issue #142. Mehrere Nutzer bestätigen, dass Sie auch mit Optimierungen wirklich diese vollen 20GB für zuverlässige Verarbeitung brauchen.
Modell lädt nicht herunter
Manchmal sind HuggingFace-Server langsam oder Ihre Verbindung läuft ab:
# Laden Sie es zuerst separat herunter
huggingface-cli download allenai/olmOCR-7B-0825-FP8Seltsame Font-/Rendering-Probleme
PDFs sehen verstümmelt aus? Normalerweise ein Font-Problem:
# Nukleare Option: alle Fonts neu installieren
sudo apt-get install --reinstall ttf-mscorefonts-installerDocker kann Ihre GPU nicht sehen
Docker ist wahrscheinlich nicht für GPU-Zugriff konfiguriert:
# NVIDIA Docker Runtime installieren
sudo apt-get install nvidia-docker2
sudo systemctl restart dockerJa, Sie müssen Docker neustarten. Das habe ich auf die harte Tour gelernt.
📈 Leistungs-Benchmarks & Optimierung
Benchmark-Ergebnisse (olmOCR v0.3.0)
| Modell | ArXiv | Tabellen | Alte Scans | Gesamtwertung |
|---|---|---|---|---|
| olmOCR v0.3.0 | 78.6 | 72.9 | 43.9 | 78.5 |
| Marker v1.7.5 | 76.0 | 57.6 | 27.8 | 70.1 |
| MinerU v1.3.10 | 75.4 | 60.9 | 17.3 | 61.5 |
Kostenvergleich
- olmOCR: 190$ pro Million Seiten
- GPT-4o API: 12.480$ pro Million Seiten
- Kosteneinsparungen: 98,5% Reduzierung der Verarbeitungskosten
Leistungsoptimierungs-Tipps
- GPU-Auswahl: H100 > A100 > RTX 4090 > L40S
- Speicherverwaltung: Verwenden Sie 90% GPU-Auslastung für maximalen Durchsatz
- Batch-Verarbeitung: Verarbeiten Sie mehrere Dateien gleichzeitig
- Bildauflösung: Balancieren Sie Qualität (2048px) vs Geschwindigkeit (1280px)
- Worker-Threads: Passen Sie Worker-Anzahl an CPU-Kerne an
💡 Community-Tipps & hart erlernte Lektionen
Basierend auf Hunderten von GitHub-Issues und Community-Diskussionen sind hier die realen Tipps, die Ihnen Zeit sparen werden:
🎯 Hardware-Einkauf Realitätscheck
Der Gebraucht-GPU-Markt Sweet Spot:
- RTX 3090 (24GB): Community-Favorit für olmOCR. Verwendet ~20GB, lässt Ihnen 4GB Puffer. Solide Verfügbarkeit am Gebrauchtmarkt
- RTX 4080 (16GB): Funktioniert technisch, aber eng. Mehrere Nutzer berichten OOM-Probleme bei komplexen Dokumenten
- Dual-GPU-Träume: Stopp gleich hier. Mehrere Nutzer probierten Dual-RTX-3060-Setups - funktioniert nicht, VRAM pooled nicht
Budget-Strategie von Reddit: Ein Nutzer fasste es perfekt zusammen: "Verkaufte mein Dual-3060-Setup, kaufte eine gebrauchte 3090. Ging von 'funktioniert nicht' zu 'funktioniert großartig' für 200$ Unterschied."
🛠️ Installationskriegsgeschichten
Die Umgebungsmanagement-Wahrheit:
- Python 3.11 + conda: 90% Erfolgsrate in Community-Berichten
- Python 3.12 + venv: 30% Erfolgsrate, viel Dependency-Hölle
- 3.9/3.10 überspringen: Mehrere Kompatibilitätsprobleme berichtet
Dependency-Konflikt-Überlebensführer:
# Diese spezifische Reihenfolge ist wichtig (hart von der Community gelernt)
conda create -n olmocr python=3.11 -y
conda activate olmocr
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121
pip install olmocr[gpu]🚀 Leistungs-Hacks von Power-Nutzern
Speicheroptimierung, die tatsächlich funktioniert:
# Community-getesteter Sweet Spot für RTX 3090
python -m olmocr.pipeline ./workspace \
--gpu-memory-utilization 0.85 \
--max_model_len 12288 \
--workers 2 \
--pdfs documents/*.pdfBatch-Verarbeitungsweisheit:
- Kleine Batches (5-10 Dateien): Schneller insgesamt, einfachere Wiederherstellung von Fehlern
- Große Batches (50+ Dateien): Memory Leaks von Community berichtet, gelegentlich neustarten
- Ein Reddit-Nutzer: "Verarbeite 20 Dateien, starte das Skript neu. Langweilig aber zuverlässig."
🐛 Häufige Fehlermuster
Das "Funktioniert bei Demo, schlägt bei echten PDFs fehl"-Problem: Mehrere Nutzer berichten das. Echte Lösung aus GitHub-Diskussionen:
# Fügen Sie diese Flags für problematische PDFs hinzu
--target_longest_image_dim 1500 \
--max_page_retries 3 \
--apply_filterDocker-Speicherprobleme unter Linux: Community-Workaround für Docker-Speicherlimits:
# Zum docker run-Befehl hinzufügen
--shm-size 8g --ulimit memlock=-1 --ulimit stack=67108864🆕 Was ist neu in den 2025-Updates
Version 0.3.4 Verbesserungen (August 2025)
- Verbesserte Auto-Rotation: Bessere Erkennung der Dokumentorientierung
- Leerdokument-Behandlung: Eliminiert Halluzinationen auf leeren Seiten
- Leistungsoptimierungen: Schnellere Verarbeitung mit reduzierten Wiederholungen
- vLLM-Integration: Wechsel von sglang zu vLLM für bessere Stabilität
- Docker-Verbesserungen: Aktualisiert auf CUDA 12.8 für neueste GPU-Unterstützung
Modellverbesserungen
- Neue FP8-Modelle: allenai/olmOCR-7B-0825-FP8 für schnellere Inferenz
- Genauigkeitszuwächse: 3+ Punktverbesserung gegenüber vorherigen Versionen
- Speichereffizienz: Reduzierte VRAM-Anforderungen bei Qualitätserhaltung
🔐 Sicherheits- und Datenschutzüberlegungen
On-Premises-Datenschutz
- Lokale Verarbeitung: Dokumente verlassen nie Ihre Infrastruktur
- DSGVO-Konformität: Vollständige Kontrolle über Datenhandhabung und -speicherung
- Unternehmenssicherheit: Bereitstellung hinter Firewalls und VPNs
- Audit-Trails: Vollständige Protokollierung der Dokumentenverarbeitungsaktivitäten
Zugriffssteuerungs-Empfehlungen
# Docker-Container-Netzwerkzugriff beschränken
docker run --rm --network none \
-v /sichere/dokumente:/documents:ro \
-v /sichere/ausgabe:/output \
alleninstituteforai/olmocr:latest🚀 Zukunftssicherung Ihrer Bereitstellung
Updates bleiben
# Nach Updates suchen
pip list --outdated | grep olmocr
# Auf neueste Version aktualisieren
pip install --upgrade olmocr[gpu]
# Docker-Image aktualisieren
docker pull alleninstituteforai/olmocr:latestÜberwachung & Wartung
- Regelmäßige Updates: Monatliche Überprüfungen auf neue Versionen
- Leistungsüberwachung: Verarbeitungsgeschwindigkeit und Genauigkeit verfolgen
- Ressourcennutzung: GPU-Speicher und Festplattenplatz überwachen
- Backup-Strategien: Regelmäßige Backups der verarbeiteten Ergebnisse
📚 Zusätzliche Ressourcen
Offizielle Dokumentation & Support
- GitHub-Repository: https://github.com/allenai/olmocr
- Technisches Paper: olmOCR-Forschungspapier
- Online-Demo: https://olmocr.allenai.org/
- Community-Discord: Discord-Community beitreten
Erweiterte Anwendungsfälle
- Akademische Forschung: Verarbeitung von Forschungspapieren und wissenschaftlichen Dokumenten
- Rechtsdokumente: Vertrags- und Rechtsdokumentdigitalisierung
- Historische Archive: Digitalisierung alter Dokumente und Manuskripte
- Finanzdienstleistungen: Verarbeitung von Formularen und Finanzdokumenten
- Gesundheitswesen: Digitalisierung und Verarbeitung medizinischer Aufzeichnungen
🎉 Abschließende Gedanken
Ich werde ehrlich sein – olmOCR einzurichten ist nicht trivial, aber es lohnt sich. Nach jahrelanger Nutzung kommerzieller OCR-Services und dem Zusehen, wie meine Rechnungen steigen, war das ein Game-Changer. Die Genauigkeit ist wirklich besser als die meisten bezahlten Services, und es lokal zu betreiben bedeutet, sich keine Sorgen mehr über Datenschutz oder API-Limits zu machen.
Folgendes können Sie tun, nachdem Sie diesem Leitfaden gefolgt sind:
✅ Dokumente verarbeiten ohne sie irgendwo hochzuladen
✅ Alles handhaben von einfachen PDFs bis zu komplexen gescannten Dokumenten
✅ Von einzelnen Dateien zu massiven Batches skalieren ohne Bankrott
✅ Sich nie wieder über API-Rate-Limits Sorgen machen
✅ Ihre sensiblen Dokumente dort behalten, wo sie hingehören – auf Ihrer Infrastruktur
Beginnen Sie mit einem einfachen PDF, sehen Sie, wie es funktioniert, dann skalieren Sie hoch. Das anfängliche Setup braucht etwas Zeit, aber Sie werden sich später dafür danken.
Bei etwas hängen geblieben? Die Discord-Community ist ziemlich hilfreich: discord.gg/sZq3jTNVNG
❓ Fragen, die ich immer wieder bekomme
F: Kann das Dokumente auf Chinesisch/Spanisch/wasauchimmer handhaben?
A: Ja, es funktioniert mit mehreren Sprachen. Fügen Sie --apply_filter für nicht-englische Sachen hinzu, obwohl das Training hauptsächlich auf englischen Dokumenten war, also YMMV.
F: Wird das auf meiner RTX 3090 funktionieren?
A: Tatsächlich, ja! Die 3090 funktioniert großartig - Nutzer berichten, dass sie etwa 20GB der verfügbaren 24GB verwendet. Sie ist in der Community als kosteneffektive Option populär geworden, besonders am Gebrauchtmarkt.
F: Ist es tatsächlich besser als bezahlte Services?
A: In meinen Tests, ja. Es erzielte 78,5% in ihrem Benchmark vs 70% für die meisten kommerziellen Optionen. Plus, wissen Sie, es kostet nicht 12.000$ pro Million Seiten.
F: Muss ich Docker verwenden?
A: Nein! Docker macht die Bereitstellung nur einfacher. Das conda-Setup funktioniert gut, wenn Sie diesen Weg bevorzugen.
F: Irgendwelche Pläne für eine GUI?
A: Nicht dass ich wüsste. Es ist nur Kommandozeile, aber es gibt eine Web-Demo, wenn Sie Dateien testen möchten ohne etwas zu installieren.
F: Einen Bug gefunden, was mache ich?
A: Erstellen Sie ein Issue auf GitHub. Das Allen AI Team ist ziemlich responsive.
F: Irgendwelche Pläne für Multi-GPU-Unterstützung?
A: Das ist die #1 gewünschte Funktion in den GitHub-Issues. Aktuell keine offizielle Zeitlinie, aber die Community möchte es wirklich. Im Moment sind Sie darauf angewiesen, eine einzelne High-VRAM-Karte zu brauchen.
F: Was ist mit Apple Silicon/M-Serie Macs?
A: Auch sehr gewünscht, aber aktuell nicht unterstützt. Es ist nur CUDA im Moment. Einige Nutzer fragen nach MPS-Unterstützung, aber nichts Konkretes bisher.