Kostenloses OLM OCR Online: Konvertieren Sie PDFs in bearbeitbaren Text

Extrahieren Sie Text aus jeder PDF/jedem Bild mit OLMOCR. Angetrieben von OLM und verbessert mit KI, konvertieren Sie gescannte Dokumente in Sekundenschnelle in bearbeitbaren, durchsuchbaren Text.

10K+Benutzer
90K+Verarbeitete Dokumente
PDF Document
PDF Document Preview
Original-PDF-Dokument
Text Document
V - February Flow Data Components: Code: The Stack - V2 CodeText: SE, whatever we ve scraped WebText: HQ, OCLM DATA MIXES ≈ 85% Source Code ≈ 10% Code Text ≈ 5% Webtext ≈ 85% The Stack - V2 ≈ 15% Code Text ≈ 0% Webtext ≈ 100% Source Code [Deepseek Coder] [Arctic]
Extrahierter Text

Kostenloser OCR-Service

Starten Sie kostenlos mit unserem OCR-Tool. Extrahieren Sie Text von Ihren ersten 3 Seiten ohne Gebühr.

KI-gesteigerte Genauigkeit

Unsere OCR-Technologie verwendet fortschrittliche KI, um den Dokumentkontext zu analysieren und so eine hochgenaue Textextraktion auch aus komplexen Layouts zu gewährleisten.

Unterstützung für mehrere Formate

Verarbeiten Sie verschiedene Dokumenttypen, einschließlich gescannter Papiere, Fotos, Screenshots und PDFs, mit gleichbleibend hochwertigen Ergebnissen.

OLMOCR-Beispiele

Entdecken Sie reale Beispiele für OLMOCR in Aktion. Sehen Sie, wie unsere KI-gestützte OCR-Technologie verschiedene Arten von Dokumenten – von handschriftlichen Notizen bis hin zu komplexen PDFs – in genauen, bearbeitbaren Text umwandelt.

Jedes Beispiel demonstriert die Fähigkeit von OLMOCR, verschiedene Dokumenttypen zu verarbeiten, und zeigt sowohl das Originaldokument als auch die extrahierte Textausgabe mit hoher Genauigkeit.

Originaldokument

PDF Document Original

Extrahierter Text

✓ 99% Accuracy
Abstract           We present OLMo 2, the next generation of our fully open language models.           OLMo 2 includes dense autoregressive models with improved architecture and training recipe, pretraining data mixtures, and instruction tuning recipes.           Our modified model architecture and training recipe achieve both better training stability and improved per-token efficiency.           Our updated pretraining data mixture introduces a new, specialized data mix called Dolmino Mix 1124, which significantly improves model capabilities across many downstream task benchmarks when introduced via late-stage curriculum training (i.e. specialized data during the annealing phase of pretraining).           Finally, we incorporate best practices from Tülu 3 to develop OLMo 2-Instruct, focusing on permissive data and extending our final-stage reinforcement learning with verifiable rewards (RLVR).           Our OLMo 2 base models sit at the Pareto frontier of performance to compute, often matching or outperforming open-weight only models like Llama 3.1 and Qwen 2.5 while using fewer FLOPs and with fully transparent training data, code, and recipe.           Our fully open OLMo 2-Instruct models are competitive with or surpassing open-weight only models of comparable size, including Qwen 2.5, Llama 3.1 and Gemma 2.           We release all OLMo 2 artifacts openly—models at 7B and 13B scales, both pretrained and post-trained, including their full training data, training code and recipes, training logs and thousands of intermediate checkpoints. The final instruction model is available on the Ai2 Playground as a free research demo.

Preispläne

Kauf auf Anfrage, keine Abonnementgebühr, lebenslange Gültigkeit

J/hVSQ
$4.9 / 60 Kredit

J/hVSQ

Empfohlen

J/hVSQ
$12.9 / 150 Kredit

J/hVSQ

J/hVSQ
$36.9 / 800 Kredit

J/hVSQ

J/hVSQ
$0.0 / 3 Kredit

J/hVSQ

Häufig gestellte Fragen

Kostenloses OLM OCR Online ist ein webbasiertes Tool, das die Optical Character Recognition (OCR)-Technologie verwendet, unterstützt von OLM und verbessert mit KI, um Bilder (wie gescannte Dokumente, Fotos oder Screenshots) in bearbeitbaren Text umzuwandeln. Die Nutzung ist völlig kostenlos.

Obwohl keine spezifischen Formate aufgeführt sind, unterstützen OCR-Tools im Allgemeinen gängige Bildformate wie JPG, JPEG, PNG, TIFF, GIF und BMP. Es ist am besten, qualitativ hochwertige Bilder für optimale Ergebnisse zu verwenden. Sie sollten die unterstützten Formate möglicherweise explizit auf Ihrer Website auflisten.

Die Genauigkeit ist dank der Kombination von OLM OCR und KI-Verbesserungen sehr hoch. Die KI hilft, Fehler zu korrigieren und die Erkennung zu verbessern, insbesondere bei komplexen Layouts oder weniger perfekter Bildqualität. Wie bei jeder OCR ist jedoch eine perfekte Genauigkeit nicht garantiert, insbesondere bei handschriftlichem Text oder Bildern mit sehr niedriger Auflösung.

Sie sollten die Dateigrößenbeschränkung auf Ihrer Website angeben. Es ist üblich, eine angemessene Beschränkung (z. B. 10 MB, 20 MB) zu haben, um eine reibungslose Verarbeitung zu gewährleisten und Missbrauch zu verhindern. Wenn es keine Beschränkung gibt, geben Sie dies an, aber seien Sie auf potenzielle Leistungsprobleme mit sehr großen Dateien vorbereitet.

Ja, Ihr Dokument wird hochgeladen. Aber keine Sorge, die gesamte Verarbeitung erfolgt serverseitig, und das Dokument wird nach der Verarbeitung gelöscht.

OLM OCR unterstützt wahrscheinlich mehrere Sprachen, ist aber nur für englische Dokumente optimiert, aber Sie können andere Sprachen ausprobieren.

Handschriftliche Texterkennung ist deutlich anspruchsvoller als gedruckter Text. Eine gute Antwort wäre: \"Obwohl unser KI-gestütztes OCR manchmal handschriftlichen Text erkennen kann, ist die Genauigkeit geringer als bei gedrucktem Text. Die Ergebnisse variieren je nach Klarheit und Stil der Handschrift. Wir empfehlen die Verwendung von klaren, gut beleuchteten Bildern von gedrucktem Text für die besten Ergebnisse.\"

Sie können den extrahierten Text nur im TXT-Format herunterladen.

Wenn Sie planen, eine API für Entwickler anzubieten, erwähnen Sie dies hier. Andernfalls geben Sie an: \"Wir bieten derzeit keine öffentliche API an, ziehen dies aber möglicherweise in Zukunft in Betracht.\"

Geben Sie eine kurze Erklärung von OLM OCR. Zum Beispiel: \"OLM OCR ist eine leistungsstarke Technologie zur optischen Zeichenerkennung, die die Grundlage unseres Dienstes bildet. Sie ist bekannt für ihre Genauigkeit und Geschwindigkeit bei der Konvertierung von Bildern in Text.\"

Erklären Sie die Rolle der KI. Zum Beispiel: \"Die KI-Erweiterung trägt dazu bei, die Genauigkeit des OCR-Prozesses zu verbessern, indem sie Fehler identifiziert und korrigiert, komplexe Layouts erkennt und Variationen in Schriftstilen und Bildqualität verarbeitet. Sie lernt aus einem riesigen Datensatz von Bildern und Texten, um die bestmöglichen Ergebnisse zu liefern.\"

Geben Sie Kontaktinformationen an. Zum Beispiel: \"Wenn Sie weitere Fragen haben oder auf Probleme stoßen, kontaktieren Sie uns bitte unter cc@freeolmocm.com.\"