OLM OCR Trực tuyến Miễn phí: Chuyển đổi PDF thành Văn bản có thể Chỉnh sửa

Trích xuất văn bản từ bất kỳ PDF/Hình ảnh nào bằng OLMOCR. Được hỗ trợ bởi OLM và tăng cường với AI, chuyển đổi tài liệu đã quét thành văn bản có thể chỉnh sửa, tìm kiếm được trong vài giây.

10K+Người Dùng
90K+Tài liệu đã xử lý
PDF Document
PDF Document Preview
Tài liệu PDF gốc
Text Document
V - February Flow Data Components: Code: The Stack - V2 CodeText: SE, whatever we ve scraped WebText: HQ, OCLM DATA MIXES ≈ 85% Source Code ≈ 10% Code Text ≈ 5% Webtext ≈ 85% The Stack - V2 ≈ 15% Code Text ≈ 0% Webtext ≈ 100% Source Code [Deepseek Coder] [Arctic]
Văn bản đã trích xuất

Dịch vụ OCR Miễn phí

Bắt đầu miễn phí với công cụ OCR của chúng tôi. Trích xuất văn bản từ 3 trang đầu tiên của bạn mà không mất phí.

Độ chính xác được tăng cường bởi AI

Công nghệ OCR của chúng tôi sử dụng AI tiên tiến để phân tích ngữ cảnh tài liệu, đảm bảo trích xuất văn bản có độ chính xác cao ngay cả từ các bố cục phức tạp.

Hỗ trợ nhiều định dạng

Xử lý nhiều loại tài liệu bao gồm giấy tờ đã quét, ảnh, ảnh chụp màn hình và PDF với kết quả chất lượng cao nhất quán.

Ví dụ OLMOCR

Khám phá các ví dụ thực tế về OLMOCR đang hoạt động. Xem công nghệ OCR do AI cung cấp của chúng tôi chuyển đổi các loại tài liệu khác nhau - từ ghi chú viết tay đến tệp PDF phức tạp - thành văn bản chính xác, có thể chỉnh sửa.

Mỗi ví dụ minh họa khả năng của OLMOCR trong việc xử lý các loại tài liệu khác nhau, hiển thị cả tài liệu gốc và kết quả văn bản được trích xuất với độ chính xác cao.

Tài liệu gốc

PDF Document Original

Văn bản đã trích xuất

✓ 99% Accuracy
Abstract           We present OLMo 2, the next generation of our fully open language models.           OLMo 2 includes dense autoregressive models with improved architecture and training recipe, pretraining data mixtures, and instruction tuning recipes.           Our modified model architecture and training recipe achieve both better training stability and improved per-token efficiency.           Our updated pretraining data mixture introduces a new, specialized data mix called Dolmino Mix 1124, which significantly improves model capabilities across many downstream task benchmarks when introduced via late-stage curriculum training (i.e. specialized data during the annealing phase of pretraining).           Finally, we incorporate best practices from Tülu 3 to develop OLMo 2-Instruct, focusing on permissive data and extending our final-stage reinforcement learning with verifiable rewards (RLVR).           Our OLMo 2 base models sit at the Pareto frontier of performance to compute, often matching or outperforming open-weight only models like Llama 3.1 and Qwen 2.5 while using fewer FLOPs and with fully transparent training data, code, and recipe.           Our fully open OLMo 2-Instruct models are competitive with or surpassing open-weight only models of comparable size, including Qwen 2.5, Llama 3.1 and Gemma 2.           We release all OLMo 2 artifacts openly—models at 7B and 13B scales, both pretrained and post-trained, including their full training data, training code and recipes, training logs and thousands of intermediate checkpoints. The final instruction model is available on the Ai2 Playground as a free research demo.

Gói Giá

Mua theo yêu cầu, không phí đăng ký, hiệu lực suốt đời

J/hVSQ
$4.9 / 60 Credit

J/hVSQ

Được Khuyến nghị

J/hVSQ
$12.9 / 150 Credit

J/hVSQ

J/hVSQ
$36.9 / 800 Credit

J/hVSQ

J/hVSQ
$0.0 / 3 Credit

J/hVSQ

Câu hỏi Thường gặp

OLM OCR Trực tuyến Miễn phí là một công cụ dựa trên web sử dụng công nghệ Nhận dạng Ký tự Quang học (OCR), được hỗ trợ bởi OLM và tăng cường với AI, để chuyển đổi hình ảnh (như tài liệu đã quét, ảnh hoặc ảnh chụp màn hình) thành văn bản có thể chỉnh sửa. Nó hoàn toàn miễn phí để sử dụng.

Mặc dù các định dạng cụ thể không được liệt kê, các công cụ OCR thường hỗ trợ các định dạng hình ảnh phổ biến như JPG, JPEG, PNG, TIFF, GIF và BMP. Tốt nhất là sử dụng hình ảnh chất lượng cao để có kết quả tối ưu. Bạn có thể muốn liệt kê rõ ràng các định dạng được hỗ trợ trên trang web của mình.

Độ chính xác rất cao nhờ sự kết hợp của OLM OCR và các cải tiến AI. AI giúp sửa lỗi và cải thiện khả năng nhận dạng, đặc biệt đối với các bố cục phức tạp hoặc chất lượng hình ảnh không hoàn hảo. Tuy nhiên, giống như tất cả các OCR, độ chính xác hoàn hảo không được đảm bảo, đặc biệt là với văn bản viết tay hoặc hình ảnh có độ phân giải rất thấp.

Bạn nên chỉ định giới hạn kích thước tệp trên trang web của mình. Một thông lệ phổ biến là có một giới hạn hợp lý (ví dụ: 10MB, 20MB) để đảm bảo xử lý trơn tru và ngăn chặn việc lạm dụng. Nếu không có giới hạn, hãy nêu rõ điều đó, nhưng hãy chuẩn bị cho các vấn đề về hiệu suất tiềm ẩn với các tệp rất lớn.

Có, tài liệu của bạn sẽ được tải lên. Nhưng đừng lo lắng, tất cả quá trình xử lý đều được thực hiện ở phía máy chủ và tài liệu sẽ bị xóa sau khi xử lý.

OLM OCR có thể hỗ trợ nhiều ngôn ngữ mặc dù chỉ được tối ưu hóa cho tài liệu tiếng Anh, nhưng bạn có thể thử các ngôn ngữ khác.

Việc nhận dạng văn bản viết tay khó hơn đáng kể so với văn bản in. Một câu trả lời hay sẽ là: "Mặc dù OCR hỗ trợ AI của chúng tôi đôi khi có thể nhận dạng văn bản viết tay, nhưng độ chính xác sẽ thấp hơn so với văn bản in. Kết quả sẽ khác nhau tùy thuộc vào độ rõ ràng và kiểu chữ viết tay. Chúng tôi khuyên bạn nên sử dụng hình ảnh rõ ràng, đủ ánh sáng của văn bản in để có kết quả tốt nhất."

Bạn chỉ có thể tải xuống văn bản đã trích xuất ở định dạng TXT.

Nếu bạn dự định cung cấp API cho nhà phát triển, hãy đề cập đến nó ở đây. Nếu không, hãy nêu rõ: "Hiện tại chúng tôi không cung cấp API công khai, nhưng chúng tôi có thể xem xét nó trong tương lai."

Cung cấp một lời giải thích ngắn gọn về OLM OCR. Ví dụ: "OLM OCR là một công nghệ nhận dạng ký tự quang học mạnh mẽ, tạo thành nền tảng cho dịch vụ của chúng tôi. Nó được biết đến với độ chính xác và tốc độ trong việc chuyển đổi hình ảnh thành văn bản."

Giải thích vai trò của AI. Ví dụ: "Sự cải tiến của AI giúp cải thiện độ chính xác của quá trình OCR bằng cách xác định và sửa lỗi, nhận dạng bố cục phức tạp và xử lý các biến thể về kiểu phông chữ và chất lượng hình ảnh. Nó học hỏi từ một tập dữ liệu lớn gồm hình ảnh và văn bản để cung cấp kết quả tốt nhất có thể."

Cung cấp thông tin liên hệ. Ví dụ: "Nếu bạn có bất kỳ câu hỏi nào khác hoặc gặp bất kỳ vấn đề nào, vui lòng liên hệ với chúng tôi tại cc@freeolmocm.com."