無料OLM OCRオンライン:PDFを編集可能なテキストに変換

OLMOCRを使用して、あらゆるPDF/画像からテキストを抽出します。OLMを搭載し、AIで強化されたこのツールは、スキャンしたドキュメントを編集可能で検索可能なテキストに数秒で変換します。

10K+ユーザー
90K+処理済みドキュメント
PDF Document
PDF Document Preview
元のPDFドキュメント
Text Document
V - February Flow Data Components: Code: The Stack - V2 CodeText: SE, whatever we ve scraped WebText: HQ, OCLM DATA MIXES ≈ 85% Source Code ≈ 10% Code Text ≈ 5% Webtext ≈ 85% The Stack - V2 ≈ 15% Code Text ≈ 0% Webtext ≈ 100% Source Code [Deepseek Coder] [Arctic]
抽出されたテキスト

無料OCRサービス

OCRツールを無料で始めましょう。最初の3ページからテキストを無料で抽出できます。

AIによる精度向上

当社のOCR技術は、高度なAIを使用してドキュメントのコンテキストを分析し、複雑なレイアウトからも高精度なテキスト抽出を保証します。

複数フォーマット対応

スキャンした書類、写真、スクリーンショット、PDFなど、さまざまな種類のドキュメントを処理し、一貫して高品質な結果を得られます。

OLMOCRの例

OLMOCRの実際の使用例をご覧ください。当社のAI搭載OCR技術が、手書きのメモから複雑なPDFまで、さまざまな種類のドキュメントを正確で編集可能なテキストに変換する方法をご覧ください。

各例は、OLMOCRがさまざまな種類のドキュメントを処理できることを示しており、元のドキュメントと、高精度で抽出されたテキスト出力を両方示しています。

元のドキュメント

PDF Document Original

抽出されたテキスト

✓ 99% Accuracy
Abstract           We present OLMo 2, the next generation of our fully open language models.           OLMo 2 includes dense autoregressive models with improved architecture and training recipe, pretraining data mixtures, and instruction tuning recipes.           Our modified model architecture and training recipe achieve both better training stability and improved per-token efficiency.           Our updated pretraining data mixture introduces a new, specialized data mix called Dolmino Mix 1124, which significantly improves model capabilities across many downstream task benchmarks when introduced via late-stage curriculum training (i.e. specialized data during the annealing phase of pretraining).           Finally, we incorporate best practices from Tülu 3 to develop OLMo 2-Instruct, focusing on permissive data and extending our final-stage reinforcement learning with verifiable rewards (RLVR).           Our OLMo 2 base models sit at the Pareto frontier of performance to compute, often matching or outperforming open-weight only models like Llama 3.1 and Qwen 2.5 while using fewer FLOPs and with fully transparent training data, code, and recipe.           Our fully open OLMo 2-Instruct models are competitive with or surpassing open-weight only models of comparable size, including Qwen 2.5, Llama 3.1 and Gemma 2.           We release all OLMo 2 artifacts openly—models at 7B and 13B scales, both pretrained and post-trained, including their full training data, training code and recipes, training logs and thousands of intermediate checkpoints. The final instruction model is available on the Ai2 Playground as a free research demo.

価格プラン

オンデマンドで購入、サブスクリプション料金なし、有効期限は無期限

J/hVSQ
$4.9 / 60 クレジット

J/hVSQ

おすすめ

J/hVSQ
$12.9 / 150 クレジット

J/hVSQ

J/hVSQ
$36.9 / 800 クレジット

J/hVSQ

J/hVSQ
$0.0 / 3 クレジット

J/hVSQ

よくある質問

無料OLM OCRオンラインは、光学文字認識(OCR)技術を使用したウェブベースのツールです。OLMを搭載し、AIで強化されており、画像(スキャンしたドキュメント、写真、スクリーンショットなど)を編集可能なテキストに変換します。完全に無料で利用できます。

具体的な形式は記載されていませんが、OCRツールは一般的にJPG、JPEG、PNG、TIFF、GIF、BMPなどの一般的な画像形式をサポートしています。最適な結果を得るには、高品質の画像を使用することをお勧めします。Webサイトでサポートされている形式を明示的にリストアップすることをお勧めします。

OLM OCRとAIによる強化の組み合わせにより、非常に高い精度を実現しています。AIは、特に複雑なレイアウトや画質の低い画像に対して、エラーを修正し、認識を向上させるのに役立ちます。ただし、すべてのOCRと同様に、手書きのテキストや非常に低解像度の画像では、完璧な精度は保証されません。

Webサイトでファイルサイズの制限を指定する必要があります。スムーズな処理を確保し、不正使用を防ぐために、妥当な制限(例:10MB、20MB)を設けるのが一般的です。制限がない場合は、その旨を記載してください。ただし、非常に大きなファイルでは、パフォーマンスの問題が発生する可能性があることに注意してください。

はい、ドキュメントはアップロードされます。ご安心ください。すべての処理はサーバー側で行われ、処理後にドキュメントは削除されます。

OLM OCRは複数の言語をサポートしている可能性がありますが、英語のドキュメントに最適化されています。他の言語もお試しいただけます。

手書き文字の認識は、印刷されたテキストよりもはるかに困難です。適切な回答は次のようになります:"当社のAI搭載OCRは、手書き文字を認識できる場合がありますが、精度は印刷されたテキストよりも低くなります。結果は、手書きの明瞭さとスタイルによって異なります。最良の結果を得るには、印刷されたテキストの鮮明で明るい画像を使用することをお勧めします。"

抽出したテキストはTXT形式でのみダウンロードできます。

開発者向けのAPIを提供する予定がある場合は、ここに記載してください。そうでない場合は、次のように記載してください:"現在、パブリックAPIは提供していませんが、将来的に検討する可能性があります。"

OLM OCRの簡単な説明を提供します。例:"OLM OCRは、当社のサービスの基盤となる強力な光学文字認識技術です。画像からテキストへの変換における精度と速度で知られています。"

AIの役割を説明します。例:"AIによる機能強化は、OCR処理の精度向上に役立ちます。エラーの特定と修正、複雑なレイアウトの認識、フォントスタイルや画質の変動への対応などです。膨大な画像とテキストのデータセットから学習し、可能な限り最良の結果を提供します。"

連絡先情報を提供します。例:"ご質問や問題がございましたら、cc@freeolmocm.comまでご連絡ください。"