Aloita ilmaiseksi OCR-työkalullamme. Poimi tekstiä kolmelta ensimmäiseltä sivulta maksutta.
OCR-teknologiamme käyttää edistynyttä tekoälyä asiakirjan kontekstin analysointiin, mikä varmistaa erittäin tarkan tekstin poiminnan jopa monimutkaisista asetteluista.
Käsittele erilaisia asiakirjatyyppejä, mukaan lukien skannatut paperit, valokuvat, kuvakaappaukset ja PDF-tiedostot, johdonmukaisesti korkealaatuisilla tuloksilla.
Tutustu OLMOCR:n käytännön esimerkkeihin. Katso, kuinka tekoälypohjainen OCR-tekniikkamme muuntaa erilaisia asiakirjoja – käsinkirjoitetuista muistiinpanoista monimutkaisiin PDF-tiedostoihin – tarkaksi, muokattavaksi tekstiksi.
Jokainen esimerkki osoittaa OLMOCR:n kykyä käsitellä erilaisia asiakirjatyyppejä, ja se näyttää sekä alkuperäisen asiakirjan että poimitun tekstin tulosteen suurella tarkkuudella.
Abstract We present OLMo 2, the next generation of our fully open language models. OLMo 2 includes dense autoregressive models with improved architecture and training recipe, pretraining data mixtures, and instruction tuning recipes. Our modified model architecture and training recipe achieve both better training stability and improved per-token efficiency. Our updated pretraining data mixture introduces a new, specialized data mix called Dolmino Mix 1124, which significantly improves model capabilities across many downstream task benchmarks when introduced via late-stage curriculum training (i.e. specialized data during the annealing phase of pretraining). Finally, we incorporate best practices from Tülu 3 to develop OLMo 2-Instruct, focusing on permissive data and extending our final-stage reinforcement learning with verifiable rewards (RLVR). Our OLMo 2 base models sit at the Pareto frontier of performance to compute, often matching or outperforming open-weight only models like Llama 3.1 and Qwen 2.5 while using fewer FLOPs and with fully transparent training data, code, and recipe. Our fully open OLMo 2-Instruct models are competitive with or surpassing open-weight only models of comparable size, including Qwen 2.5, Llama 3.1 and Gemma 2. We release all OLMo 2 artifacts openly—models at 7B and 13B scales, both pretrained and post-trained, including their full training data, training code and recipes, training logs and thousands of intermediate checkpoints. The final instruction model is available on the Ai2 Playground as a free research demo.
Osta tarpeen mukaan, ei tilausmaksua, elinikäinen voimassaolo
J/hVSQ
Suositeltava
J/hVSQ
J/hVSQ
J/hVSQ
Ilmainen OLM OCR Online on verkkopohjainen työkalu, joka käyttää optista merkkien tunnistustekniikkaa (OCR), jonka teho perustuu OLM:ään ja jota on parannettu tekoälyllä. Se muuntaa kuvat (kuten skannatut asiakirjat, valokuvat tai kuvakaappaukset) muokattavaksi tekstiksi. Sen käyttö on täysin ilmaista.
Vaikka tiettyjä muotoja ei ole lueteltu, OCR-työkalut tukevat yleensä yleisiä kuvatiedostomuotoja, kuten JPG, JPEG, PNG, TIFF, GIF ja BMP. Parhaiden tulosten saavuttamiseksi on parasta käyttää korkealaatuisia kuvia. Haluat ehkä luetella tuetut muodot verkkosivustollasi.
Tarkkuus on erittäin korkea OLM OCR:n ja tekoälyparannusten ansiosta. Tekoäly auttaa korjaamaan virheitä ja parantamaan tunnistusta erityisesti monimutkaisissa asetteluissa tai heikommassa kuvanlaadussa. Kuitenkin, kuten kaikessa OCR:ssä, täydellistä tarkkuutta ei voida taata, erityisesti käsinkirjoitetulla tekstillä tai erittäin matalan resoluution kuvilla.
Sinun pitäisi määritellä tiedostokoon raja verkkosivustollasi. Yleinen käytäntö on asettaa kohtuullinen raja (esim. 10MB, 20MB) sujuvan käsittelyn varmistamiseksi ja väärinkäytön estämiseksi. Jos rajaa ei ole, ilmoita se, mutta varaudu mahdollisiin suorituskykyongelmiin erittäin suurten tiedostojen kanssa.
Kyllä, dokumenttisi ladataan. Mutta älä huoli, kaikki käsittely tapahtuu palvelinpuolella, ja dokumentti poistetaan käsittelyn jälkeen.
OLM OCR tukee todennäköisesti useita kieliä, vaikka se on optimoitu vain englanninkielisille asiakirjoille, mutta voit kokeilla muita kieliä.
Käsinkirjoitetun tekstin tunnistaminen on huomattavasti haastavampaa kuin painetun tekstin. Hyvä vastaus olisi: "Vaikka tekoälypohjainen OCR:mme voi joskus tunnistaa käsinkirjoitettua tekstiä, tarkkuus on alhaisempi kuin painetulla tekstillä. Tulokset vaihtelevat käsialan selkeyden ja tyylin mukaan. Suosittelemme käyttämään selkeitä, hyvin valaistuja kuvia painetusta tekstistä parhaiden tulosten saavuttamiseksi."
Voit ladata poimitun tekstin vain TXT-muodossa.
Jos aiot tarjota API:n kehittäjille, mainitse se tässä. Jos et, ilmoita: "Emme tällä hetkellä tarjoa julkista API:a, mutta saatamme harkita sitä tulevaisuudessa."
Anna lyhyt selitys OLM OCR:stä. Esimerkiksi: "OLM OCR on tehokas optinen merkkien tunnistustekniikka, joka muodostaa palvelumme perustan. Se tunnetaan tarkkuudestaan ja nopeudestaan kuvien muuntamisessa tekstiksi."
Selitä tekoälyn rooli. Esimerkiksi: "Tekoäly parantaa OCR-prosessin tarkkuutta tunnistamalla ja korjaamalla virheitä, tunnistamalla monimutkaisia asetteluja ja käsittelemällä fonttityylien ja kuvanlaadun vaihteluita. Se oppii valtavasta kuvien ja tekstin tietokannasta tarjotakseen parhaat mahdolliset tulokset."
Anna yhteystiedot. Esimerkiksi: "Jos sinulla on muita kysymyksiä tai kohtaat ongelmia, ota meihin yhteyttä osoitteessa cc@freeolmocm.com."
Tutustu uusimpiin artikkeleihimme OCR-tekniikasta, vinkkejä ja parhaita käytäntöjä tekstin poimimiseen kuvista.
Tutustu siihen, miten olmOCR muuttaa PDF-käsittelyn tekoälypohjaisella tekstinpoiminnalla, kustannustehokkuudella ja avoimen lähdekoodin innovaatioilla.
Asenna olmOCR paikallisesti vaihe vaiheelta: Tee PDF-käsittelystä superhelppoa!