Δωρεάν OLM OCR Online: Μετατροπή PDF σε επεξεργάσιμο κείμενο

Εξαγάγετε κείμενο από οποιοδήποτε PDF/Εικόνα με το OLMOCR. Με την υποστήριξη του OLM και ενισχυμένο με AI, μετατρέψτε σαρωμένα έγγραφα σε επεξεργάσιμο, αναζητήσιμο κείμενο σε δευτερόλεπτα.

10K+Χρήστες
90K+Έγγραφα που υποβλήθηκαν σε επεξεργασία
PDF Document
PDF Document Preview
Αρχικό έγγραφο PDF
Text Document
V - February Flow Data Components: Code: The Stack - V2 CodeText: SE, whatever we ve scraped WebText: HQ, OCLM DATA MIXES ≈ 85% Source Code ≈ 10% Code Text ≈ 5% Webtext ≈ 85% The Stack - V2 ≈ 15% Code Text ≈ 0% Webtext ≈ 100% Source Code [Deepseek Coder] [Arctic]
Εξαγόμενο κείμενο

Δωρεάν υπηρεσία OCR

Ξεκινήστε δωρεάν με το εργαλείο OCR. Εξαγάγετε κείμενο από τις πρώτες 3 σελίδες σας χωρίς χρέωση.

Ακρίβεια ενισχυμένη με AI

Η τεχνολογία OCR χρησιμοποιεί προηγμένη AI για την ανάλυση του περιεχομένου του εγγράφου, εξασφαλίζοντας εξαιρετικά ακριβή εξαγωγή κειμένου ακόμη και από πολύπλοκες διατάξεις.

Υποστήριξη πολλαπλών μορφών

Επεξεργαστείτε διάφορους τύπους εγγράφων, συμπεριλαμβανομένων σαρωμένων χαρτιών, φωτογραφιών, στιγμιότυπων οθόνης και PDF με σταθερά αποτελέσματα υψηλής ποιότητας.

Παραδείγματα OLMOCR

Εξερευνήστε πραγματικά παραδείγματα του OLMOCR σε δράση. Δείτε πώς η τεχνολογία OCR που υποστηρίζεται από AI μετατρέπει διάφορους τύπους εγγράφων - από χειρόγραφες σημειώσεις έως πολύπλοκα PDF - σε ακριβές, επεξεργάσιμο κείμενο.

Κάθε παράδειγμα δείχνει την ικανότητα του OLMOCR να χειρίζεται διαφορετικούς τύπους εγγράφων, παρουσιάζοντας τόσο το αρχικό έγγραφο όσο και το εξαγόμενο κείμενο με μεγάλη ακρίβεια.

Αρχικό Έγγραφο

PDF Document Original

Εξαγόμενο κείμενο

✓ 99% Accuracy
Abstract           We present OLMo 2, the next generation of our fully open language models.           OLMo 2 includes dense autoregressive models with improved architecture and training recipe, pretraining data mixtures, and instruction tuning recipes.           Our modified model architecture and training recipe achieve both better training stability and improved per-token efficiency.           Our updated pretraining data mixture introduces a new, specialized data mix called Dolmino Mix 1124, which significantly improves model capabilities across many downstream task benchmarks when introduced via late-stage curriculum training (i.e. specialized data during the annealing phase of pretraining).           Finally, we incorporate best practices from Tülu 3 to develop OLMo 2-Instruct, focusing on permissive data and extending our final-stage reinforcement learning with verifiable rewards (RLVR).           Our OLMo 2 base models sit at the Pareto frontier of performance to compute, often matching or outperforming open-weight only models like Llama 3.1 and Qwen 2.5 while using fewer FLOPs and with fully transparent training data, code, and recipe.           Our fully open OLMo 2-Instruct models are competitive with or surpassing open-weight only models of comparable size, including Qwen 2.5, Llama 3.1 and Gemma 2.           We release all OLMo 2 artifacts openly—models at 7B and 13B scales, both pretrained and post-trained, including their full training data, training code and recipes, training logs and thousands of intermediate checkpoints. The final instruction model is available on the Ai2 Playground as a free research demo.

Προγράμματα Τιμολόγησης

Αγορά κατόπιν ζήτησης, χωρίς συνδρομή, διάρκεια ζωής

J/hVSQ
$4.9 / 60 crédits

J/hVSQ

Προτεινόμενο

J/hVSQ
$12.9 / 150 crédits

J/hVSQ

J/hVSQ
$36.9 / 800 crédits

J/hVSQ

J/hVSQ
$0.0 / 3 crédits

J/hVSQ

Questionsfréquentes

Το Free OLM OCR Online είναι ένα διαδικτυακό εργαλείο που χρησιμοποιεί την τεχνολογία Optical Character Recognition (OCR), με την υποστήριξη του OLM και ενισχυμένο με AI, για τη μετατροπή εικόνων (όπως σαρωμένα έγγραφα, φωτογραφίες ή στιγμιότυπα οθόνης) σε επεξεργάσιμο κείμενο. Είναι εντελώς δωρεάν στη χρήση.

Ενώ δεν αναφέρονται συγκεκριμένες μορφές, τα εργαλεία OCR υποστηρίζουν γενικά κοινές μορφές εικόνας όπως JPG, JPEG, PNG, TIFF, GIF και BMP. Είναι καλύτερο να χρησιμοποιείτε εικόνες υψηλής ποιότητας για βέλτιστα αποτελέσματα. Ίσως θελήσετε να αναφέρετε ρητά τις υποστηριζόμενες μορφές στον ιστότοπό σας.

Η ακρίβεια είναι πολύ υψηλή χάρη στον συνδυασμό OLM OCR και βελτιώσεων AI. Η AI βοηθά στη διόρθωση σφαλμάτων και στη βελτίωση της αναγνώρισης, ειδικά για πολύπλοκες διατάξεις ή εικόνες χαμηλής ποιότητας. Ωστόσο, όπως και με όλα τα OCR, η τέλεια ακρίβεια δεν είναι εγγυημένη, ειδικά με χειρόγραφο κείμενο ή εικόνες πολύ χαμηλής ανάλυσης.

Θα πρέπει να καθορίσετε το όριο μεγέθους αρχείου στον ιστότοπό σας. Μια κοινή πρακτική είναι να έχετε ένα λογικό όριο (π.χ., 10MB, 20MB) για να διασφαλίσετε την ομαλή επεξεργασία και να αποτρέψετε την κατάχρηση. Εάν δεν υπάρχει όριο, δηλώστε το, αλλά να είστε προετοιμασμένοι για πιθανά προβλήματα απόδοσης με πολύ μεγάλα αρχεία.

Ναι, το έγγραφό σας θα ανέβει. Αλλά μην ανησυχείτε, όλη η επεξεργασία γίνεται στην πλευρά του διακομιστή και το έγγραφο διαγράφεται μετά την επεξεργασία.

Το OLM OCR πιθανότατα υποστηρίζει πολλές γλώσσες, αν και είναι βελτιστοποιημένο μόνο για αγγλικά έγγραφα, αλλά μπορείτε να δοκιμάσετε και άλλες γλώσσες.

Η αναγνώριση χειρόγραφου κειμένου είναι σημαντικά πιο δύσκολη από το τυπωμένο κείμενο. Μια καλή απάντηση θα ήταν: "Ενώ το OCR που υποστηρίζεται από AI μπορεί μερικές φορές να αναγνωρίσει χειρόγραφο κείμενο, η ακρίβεια θα είναι χαμηλότερη από ό,τι με το τυπωμένο κείμενο. Τα αποτελέσματα θα ποικίλλουν ανάλογα με τη σαφήνεια και το στυλ του γραψίματος. Συνιστούμε τη χρήση καθαρών, καλά φωτισμένων εικόνων τυπωμένου κειμένου για τα καλύτερα αποτελέσματα."

Μπορείτε να κατεβάσετε το εξαγόμενο κείμενο μόνο σε μορφή TXT.

Εάν σκοπεύετε να προσφέρετε ένα API για προγραμματιστές, αναφέρετέ το εδώ. Εάν όχι, δηλώστε: "Δεν προσφέρουμε επί του παρόντος δημόσιο API, αλλά ενδέχεται να το εξετάσουμε στο μέλλον."

Δώστε μια σύντομη εξήγηση του OLM OCR. Για παράδειγμα: "Το OLM OCR είναι μια ισχυρή τεχνολογία οπτικής αναγνώρισης χαρακτήρων που αποτελεί τη βάση της υπηρεσίας μας. Είναι γνωστή για την ακρίβεια και την ταχύτητά της στη μετατροπή εικόνων σε κείμενο."

Εξηγήστε τον ρόλο της AI. Για παράδειγμα: "Η βελτίωση της AI βοηθά στη βελτίωση της ακρίβειας της διαδικασίας OCR, εντοπίζοντας και διορθώνοντας σφάλματα, αναγνωρίζοντας πολύπλοκες διατάξεις και χειριζόμενη παραλλαγές σε στυλ γραμματοσειρών και ποιότητα εικόνας. Μαθαίνει από ένα τεράστιο σύνολο δεδομένων εικόνων και κειμένου για να παρέχει τα καλύτερα δυνατά αποτελέσματα."

Δώστε στοιχεία επικοινωνίας. Για παράδειγμα: "Εάν έχετε άλλες ερωτήσεις ή αντιμετωπίζετε προβλήματα, επικοινωνήστε μαζί μας στο cc@freeolmocm.com."