Mulakan secara percuma dengan alat OCR kami. Ekstrak teks daripada 3 halaman pertama anda tanpa sebarang bayaran.
Teknologi OCR kami menggunakan AI termaju untuk menganalisis konteks dokumen, memastikan pengekstrak teks yang sangat tepat walaupun daripada susun atur yang kompleks.
Proses pelbagai jenis dokumen termasuk kertas yang diimbas, foto, tangkapan skrin, dan PDF dengan hasil berkualiti tinggi yang konsisten.
Terokai contoh dunia sebenar OLMOCR beraksi. Lihat bagaimana teknologi OCR berkuasa AI kami mengubah pelbagai jenis dokumen - daripada nota tulisan tangan kepada PDF yang kompleks - menjadi teks yang tepat dan boleh diedit.
Setiap contoh menunjukkan keupayaan OLMOCR untuk mengendalikan pelbagai jenis dokumen, menunjukkan kedua-dua dokumen asal dan output teks yang diekstrak dengan ketepatan yang tinggi.
Abstract We present OLMo 2, the next generation of our fully open language models. OLMo 2 includes dense autoregressive models with improved architecture and training recipe, pretraining data mixtures, and instruction tuning recipes. Our modified model architecture and training recipe achieve both better training stability and improved per-token efficiency. Our updated pretraining data mixture introduces a new, specialized data mix called Dolmino Mix 1124, which significantly improves model capabilities across many downstream task benchmarks when introduced via late-stage curriculum training (i.e. specialized data during the annealing phase of pretraining). Finally, we incorporate best practices from Tülu 3 to develop OLMo 2-Instruct, focusing on permissive data and extending our final-stage reinforcement learning with verifiable rewards (RLVR). Our OLMo 2 base models sit at the Pareto frontier of performance to compute, often matching or outperforming open-weight only models like Llama 3.1 and Qwen 2.5 while using fewer FLOPs and with fully transparent training data, code, and recipe. Our fully open OLMo 2-Instruct models are competitive with or surpassing open-weight only models of comparable size, including Qwen 2.5, Llama 3.1 and Gemma 2. We release all OLMo 2 artifacts openly—models at 7B and 13B scales, both pretrained and post-trained, including their full training data, training code and recipes, training logs and thousands of intermediate checkpoints. The final instruction model is available on the Ai2 Playground as a free research demo.
Beli atas permintaan, tiada yuran langganan, sah seumur hidup
J/hVSQ
Disyorkan
J/hVSQ
J/hVSQ
J/hVSQ
OCR OLM Dalam Talian Percuma ialah alat berasaskan web yang menggunakan teknologi Pengecaman Aksara Optik (OCR), dikuasakan oleh OLM dan dipertingkatkan dengan AI, untuk menukar imej (seperti dokumen yang diimbas, foto, atau tangkapan skrin) kepada teks yang boleh diedit. Ia adalah percuma sepenuhnya untuk digunakan.
Walaupun format tertentu tidak disenaraikan, alat OCR secara amnya menyokong format imej biasa seperti JPG, JPEG, PNG, TIFF, GIF, dan BMP. Adalah lebih baik untuk menggunakan imej berkualiti tinggi untuk hasil yang optimum. Anda mungkin ingin menyenaraikan secara eksplisit format yang disokong di laman web anda.
Ketepatan adalah sangat tinggi terima kasih kepada gabungan OLM OCR dan peningkatan AI. AI membantu membetulkan ralat dan meningkatkan pengecaman, terutamanya untuk susun atur yang kompleks atau kualiti imej yang kurang sempurna. Walau bagaimanapun, seperti semua OCR, ketepatan yang sempurna tidak dijamin, terutamanya dengan teks tulisan tangan atau imej resolusi yang sangat rendah.
Anda harus menentukan had saiz fail di laman web anda. Amalan biasa adalah mempunyai had yang munasabah (cth., 10MB, 20MB) untuk memastikan pemprosesan yang lancar dan mengelakkan penyalahgunaan. Jika tiada had, nyatakan itu, tetapi bersedia untuk potensi isu prestasi dengan fail yang sangat besar.
Ya, dokumen anda akan dimuat naik. Tetapi jangan risau, semua pemprosesan dilakukan di sisi pelayan, dan dokumen dipadamkan selepas pemprosesan.
OLM OCR berkemungkinan menyokong berbilang bahasa walaupun hanya dioptimumkan untuk dokumen bahasa Inggeris, tetapi anda boleh mencuba bahasa lain.
Pengecaman teks tulisan tangan adalah jauh lebih mencabar daripada teks bercetak. Jawapan yang baik ialah: "Walaupun OCR berkuasa AI kami kadangkala boleh mengenali teks tulisan tangan, ketepatannya akan lebih rendah daripada teks bercetak. Hasilnya akan berbeza-beza bergantung pada kejelasan dan gaya tulisan tangan. Kami mengesyorkan menggunakan imej teks bercetak yang jelas dan terang untuk hasil yang terbaik."
Anda hanya boleh memuat turun teks yang diekstrak dalam format TXT.
Jika anda bercadang untuk menawarkan API untuk pembangun, sebutkan di sini. Jika tidak, nyatakan: "Kami pada masa ini tidak menawarkan API awam, tetapi kami mungkin mempertimbangkannya pada masa hadapan."
Berikan penjelasan ringkas tentang OLM OCR. Contoh: "OLM OCR ialah teknologi pengecaman aksara optik yang berkuasa yang membentuk asas perkhidmatan kami. Ia terkenal dengan ketepatan dan kelajuannya dalam menukar imej kepada teks."
Terangkan peranan AI. Contoh: "Peningkatan AI membantu meningkatkan ketepatan proses OCR dengan mengenal pasti dan membetulkan ralat, mengenali susun atur yang kompleks, dan mengendalikan variasi dalam gaya fon dan kualiti imej. Ia belajar daripada set data imej dan teks yang luas untuk memberikan hasil yang terbaik."
Berikan maklumat hubungan. Contoh: "Jika anda mempunyai sebarang soalan lain atau menghadapi sebarang isu, sila hubungi kami di cc@freeolmocm.com."
Terokai artikel terkini kami tentang teknologi OCR, petua dan amalan terbaik untuk pengekstrakan teks daripada imej.
Temui bagaimana olmOCR mengubah pemprosesan PDF dengan pengekstrakan teks berpandukan AI, kecekapan kos, dan inovasi sumber terbuka.
Tutorial langkah-demi-langkah untuk memasang olmOCR secara lokal, menjadikan pemprosesan PDF sangat mudah!