Mulai gratis dengan alat OCR kami. Ekstrak teks dari 3 halaman pertama Anda tanpa biaya.
Teknologi OCR kami menggunakan AI canggih untuk menganalisis konteks dokumen, memastikan ekstraksi teks yang sangat akurat bahkan dari tata letak yang kompleks.
Proses berbagai jenis dokumen termasuk kertas yang dipindai, foto, tangkapan layar, dan PDF dengan hasil berkualitas tinggi yang konsisten.
Jelajahi contoh dunia nyata dari OLMOCR yang beraksi. Lihat bagaimana teknologi OCR bertenaga AI kami mengubah berbagai jenis dokumen - dari catatan tulisan tangan hingga PDF kompleks - menjadi teks yang akurat dan dapat diedit.
Setiap contoh menunjukkan kemampuan OLMOCR untuk menangani berbagai jenis dokumen, yang menampilkan dokumen asli dan keluaran teks yang diekstraksi dengan akurasi tinggi.
Abstract We present OLMo 2, the next generation of our fully open language models. OLMo 2 includes dense autoregressive models with improved architecture and training recipe, pretraining data mixtures, and instruction tuning recipes. Our modified model architecture and training recipe achieve both better training stability and improved per-token efficiency. Our updated pretraining data mixture introduces a new, specialized data mix called Dolmino Mix 1124, which significantly improves model capabilities across many downstream task benchmarks when introduced via late-stage curriculum training (i.e. specialized data during the annealing phase of pretraining). Finally, we incorporate best practices from Tülu 3 to develop OLMo 2-Instruct, focusing on permissive data and extending our final-stage reinforcement learning with verifiable rewards (RLVR). Our OLMo 2 base models sit at the Pareto frontier of performance to compute, often matching or outperforming open-weight only models like Llama 3.1 and Qwen 2.5 while using fewer FLOPs and with fully transparent training data, code, and recipe. Our fully open OLMo 2-Instruct models are competitive with or surpassing open-weight only models of comparable size, including Qwen 2.5, Llama 3.1 and Gemma 2. We release all OLMo 2 artifacts openly—models at 7B and 13B scales, both pretrained and post-trained, including their full training data, training code and recipes, training logs and thousands of intermediate checkpoints. The final instruction model is available on the Ai2 Playground as a free research demo.
Beli sesuai permintaan, tanpa biaya langganan, berlaku seumur hidup
J/hVSQ
Direkomendasikan
J/hVSQ
J/hVSQ
J/hVSQ
OLM OCR Online Gratis adalah alat berbasis web yang menggunakan teknologi Pengenalan Karakter Optik (OCR), didukung oleh OLM dan ditingkatkan dengan AI, untuk mengonversi gambar (seperti dokumen yang dipindai, foto, atau tangkapan layar) menjadi teks yang dapat diedit. Penggunaannya sepenuhnya gratis.
Meskipun format spesifik tidak tercantum, alat OCR umumnya mendukung format gambar umum seperti JPG, JPEG, PNG, TIFF, GIF, dan BMP. Sebaiknya gunakan gambar berkualitas tinggi untuk hasil yang optimal. Anda mungkin ingin secara eksplisit mencantumkan format yang didukung di situs web Anda.
Akurasi sangat tinggi berkat kombinasi OLM OCR dan peningkatan AI. AI membantu memperbaiki kesalahan dan meningkatkan pengenalan, terutama untuk tata letak yang kompleks atau kualitas gambar yang kurang sempurna. Namun, seperti semua OCR, akurasi sempurna tidak dijamin, terutama dengan teks tulisan tangan atau gambar beresolusi sangat rendah.
Anda harus menentukan batas ukuran file di situs web Anda. Praktik umum adalah memiliki batas yang wajar (misalnya, 10MB, 20MB) untuk memastikan pemrosesan yang lancar dan mencegah penyalahgunaan. Jika tidak ada batasan, nyatakan itu, tetapi bersiaplah untuk potensi masalah kinerja dengan file yang sangat besar.
Ya, dokumen Anda akan diunggah. Tapi jangan khawatir, semua pemrosesan dilakukan di sisi server, dan dokumen dihapus setelah diproses.
OLM OCR kemungkinan mendukung berbagai bahasa meskipun hanya dioptimalkan untuk dokumen berbahasa Inggris, tetapi Anda dapat mencoba bahasa lain.
Pengenalan teks tulisan tangan secara signifikan lebih menantang daripada teks cetak. Jawaban yang baik adalah: "Meskipun OCR bertenaga AI kami terkadang dapat mengenali teks tulisan tangan, akurasinya akan lebih rendah daripada dengan teks cetak. Hasilnya akan bervariasi tergantung pada kejelasan dan gaya tulisan tangan. Kami merekomendasikan penggunaan gambar teks cetak yang jelas dan terang untuk hasil terbaik."
Anda hanya dapat mengunduh teks yang diekstraksi dalam format TXT.
Jika Anda berencana menawarkan API untuk pengembang, sebutkan di sini. Jika tidak, nyatakan: "Saat ini kami tidak menawarkan API publik, tetapi kami dapat mempertimbangkannya di masa mendatang."
Berikan penjelasan singkat tentang OLM OCR. Contoh: "OLM OCR adalah teknologi pengenalan karakter optik yang kuat yang menjadi dasar layanan kami. Ia dikenal karena akurasi dan kecepatannya dalam mengonversi gambar menjadi teks."
Jelaskan peran AI. Contoh: "Peningkatan AI membantu meningkatkan akurasi proses OCR dengan mengidentifikasi dan memperbaiki kesalahan, mengenali tata letak yang kompleks, dan menangani variasi gaya font dan kualitas gambar. Ia belajar dari kumpulan data gambar dan teks yang sangat besar untuk memberikan hasil terbaik."
Berikan informasi kontak. Contoh: "Jika Anda memiliki pertanyaan lain atau mengalami masalah, silakan hubungi kami di cc@freeolmocm.com."
Jelajahi artikel terbaru kami tentang teknologi OCR, tips, dan praktik terbaik untuk ekstraksi teks dari gambar.
Temukan bagaimana olmOCR mengubah pemrosesan PDF dengan ekstraksi teks berbasis AI, efisiensi biaya, dan inovasi sumber terbuka.
Panduan langkah demi langkah untuk instalasi lokal olmOCR, menjadikan pemrosesan PDF sangat mudah!