Co to jest optyczne rozpoznawanie znaków (OCR)?

Spisu treści:

Co to jest optyczne rozpoznawanie znaków (OCR)?
Co to jest optyczne rozpoznawanie znaków (OCR)?
Anonim

Optyczne rozpoznawanie znaków (OCR) odnosi się do oprogramowania, które tworzy cyfrową wersję drukowanego, maszynowego lub odręcznego dokumentu, który komputery mogą odczytać bez konieczności ręcznego wpisywania lub wprowadzania tekstu. OCR jest zwykle używany na zeskanowanych dokumentach w formacie PDF, ale może również tworzyć czytelną dla komputera wersję tekstu w pliku obrazu.

Co to jest OCR

OCR, określane również jako rozpoznawanie tekstu, to technologia oprogramowania, która przekształca znaki, takie jak cyfry, litery i znaki interpunkcyjne (zwane również glifami) z dokumentów drukowanych lub pisanych, na formę elektroniczną łatwiej rozpoznawaną i czytaną przez komputery i inne programy. Niektóre programy OCR robią to, gdy dokument jest skanowany lub fotografowany aparatem cyfrowym, a inne mogą zastosować ten proces do dokumentów, które zostały wcześniej zeskanowane lub sfotografowane bez OCR. OCR umożliwia użytkownikom wyszukiwanie w dokumentach PDF, edycję tekstu i ponowne formatowanie dokumentów.

Image
Image
Skanowanie historycznej gazety za pomocą oprogramowania OCR.

Getty Images

Do czego służy OCR?

W przypadku szybkiego, codziennego skanowania funkcja OCR może nie być wielkim problemem. Jeśli wykonujesz dużą ilość skanowania, możliwość wyszukiwania w plikach PDF w celu znalezienia dokładnie tego, którego potrzebujesz, może zaoszczędzić sporo czasu i sprawi, że funkcja OCR w programie skanera będzie ważniejsza. Oto kilka innych rzeczy, w których pomaga OCR:

  • Automatyczne przetwarzanie danych i wprowadzanie danych (Przykład: Systemy śledzenia kandydatów do pracy dla życiorysów).
  • Umożliwienie przeszukiwania zeskanowanych książek.
  • Konwertowanie odręcznych skanów na tekst czytelny dla komputera.
  • Uczynienie dokumentów bardziej użytecznymi przez programy do czytania, które pomagają użytkownikom niedowidzącym.
  • Zachowywanie historycznych dokumentów i gazet, a także umożliwianie ich przeszukiwania.
  • Ekstrakcja danych i transfer do programów księgowych (przykład: paragony i faktury).
  • Indeksowanie dokumentów do użytku przez wyszukiwarki.
  • Rozpoznawanie tablic rejestracyjnych kierowcy przez oprogramowanie fotoradaru i kamery na czerwonym świetle.
  • Syntezatory mowy dla osób, które nie potrafią mówić – fizyk teoretyczny, Stephen Hawking, jest prawdopodobnie najbardziej znanym użytkownikiem programu do syntezy mowy.

Dolna linia

Dlaczego po prostu nie zrobić zdjęcia, prawda? Ponieważ nie mógłbyś niczego edytować ani przeszukiwać tekstu, ponieważ byłby to tylko obraz. Skanowanie dokumentu i uruchomienie oprogramowania OCR może zmienić ten plik w coś, co można edytować i przeszukiwać.

Historia OCR

Podczas gdy najwcześniejsze użycie rozpoznawania tekstu datuje się na rok 1914, powszechny rozwój i stosowanie technologii związanych z OCR rozpoczęło się na dobre w latach 50. XX wieku, w szczególności od stworzenia bardzo uproszczonych czcionek, które łatwiej było przekonwertować na cyfrowo- czytelny tekst. Pierwsza z tych uproszczonych czcionek została stworzona przez Davida Sheparda i powszechnie znana jako OCR-7B. OCR-7B jest nadal używany w branży finansowej jako standardowa czcionka używana na kartach kredytowych i debetowych. W latach 60. usługi pocztowe w kilku krajach, w tym w Stanach Zjednoczonych, Wielkiej Brytanii, Kanadzie i Niemczech, zaczęły wykorzystywać technologię OCR do znacznego przyspieszenia sortowania poczty. OCR jest nadal podstawową technologią używaną do sortowania poczty dla usług pocztowych na całym świecie. W 2000 r. kluczowa wiedza na temat ograniczeń i możliwości technologii OCR została wykorzystana do opracowania programów CAPTCHA służących do zatrzymywania botów i spamerów.

Przez dziesięciolecia OCR stało się dokładniejsze i bardziej wyrafinowane dzięki postępom w powiązanych obszarach technologicznych, takich jak sztuczna inteligencja, uczenie maszynowe i wizja komputerowa. Obecnie oprogramowanie OCR wykorzystuje rozpoznawanie wzorców, wykrywanie funkcji i eksplorację tekstu, aby przekształcać dokumenty szybciej i dokładniej niż kiedykolwiek wcześniej.

FAQ

    Jak skanować dokumenty za pomocą telefonu lub tabletu?

    W systemie iOS otwórz aplikację Notatki i utwórz nową notatkę. Otwórz aparat, a następnie dotknij Skanuj dokumenty. W systemie Android otwórz Dysk Google i wybierz Plus (+), a następnie dotknij Scan, aby zeskanować dokument za pomocą telefonu.

    Jak używać OCR w programie Adobe Acrobat?

    Otwórz plik PDF zawierający zeskanowany obraz, a następnie wybierz Narzędzia > Edytuj PDF. Program Acrobat automatycznie zastosuje OCR, aby umożliwić edycję tekstu. Po prostu wybierz miejsce, w którym chcesz wprowadzić zmiany i zacznij pisać.

    Jaka jest różnica między OCR a OMR?

    Optical Mark Recognition (OMR) to oprogramowanie, które wykrywa znaki na papierze, zwykle arkuszu bąbelkowym. OMR służy do przetwarzania wyników egzaminów, ankiet, ankiet, a nawet wyborów. W przeciwieństwie do OCR, OMR nie może odszyfrować znaków na stronie, a jedynie sprawdzić, czy znaki tam są.

Zalecana: