Główna » Fajne strony internetowe » 5 darmowych usług OCR online przetestowanych i zweryfikowanych

    5 darmowych usług OCR online przetestowanych i zweryfikowanych

    Czy masz dokument PDF lub obraz, który chcesz przekonwertować na tekst? Niedawno ktoś wysłał mi dokument w mailu, który musiałem edytować i odesłać z poprawkami. Osoba nie mogła znaleźć kopii cyfrowej, więc otrzymałem zadanie pobrania całego tekstu w formacie cyfrowym.

    Nie miałam zamiaru spędzać godzin na wpisywaniu wszystkiego z powrotem, więc skończyło się na zrobieniu ładnego, wysokiej jakości zdjęcia dokumentu, a potem spaliłam się przez kilka internetowych usług OCR, aby zobaczyć, który z nich da mi najlepsze wyniki.

    W tym artykule przejdę przez kilka moich ulubionych witryn OCR, które są bezpłatne. Warto zauważyć, że większość z tych witryn zapewnia podstawową bezpłatną usługę, a następnie oferuje płatne opcje, jeśli chcesz uzyskać dodatkowe funkcje, takie jak większe obrazy, wielostronicowe dokumenty PDF, różne języki wprowadzania itp..

    Dobrze jest również wiedzieć wcześniej, że większość z tych usług nie będzie w stanie dopasować formatowania oryginalnego dokumentu. Są to głównie do wyodrębniania tekstu i tyle. Jeśli potrzebujesz wszystkiego, aby być w określonym układzie lub formacie, musisz to zrobić ręcznie, gdy otrzymasz cały tekst z OCR.

    Ponadto najlepsze rezultaty w uzyskaniu tekstu będą miały dokumenty o rozdzielczości od 200 do 400 DPI. Jeśli masz obraz o niskiej rozdzielczości DPI, wyniki nie będą tak dobre.

    Na koniec testowałem wiele stron, które po prostu nie działały. Jeśli korzystasz z bezpłatnego OCR Google, zobaczysz kilka witryn, ale kilka witryn z 10 najlepszych wyników nawet nie ukończyło konwersji. Niektórzy straciliby czas, inni popełniliby błędy, a niektórzy utknęli na stronie „konwertującej”, więc nawet nie zawracałem sobie głowy wspominaniem tych stron.

    Dla każdej witryny testowałem dwa dokumenty, aby zobaczyć, jak dobrze będzie wyglądał wynik. Do testów po prostu użyłem iPhone'a 5S do zrobienia zdjęcia obu dokumentów, a następnie przesłałem je bezpośrednio na strony internetowe w celu konwersji.

    W przypadku, gdy chcesz zobaczyć, jak wyglądały obrazy, których użyłem do mojego testu, załączyłem je tutaj: Test1 i Test2. Pamiętaj, że nie są to wersje pełnej rozdzielczości zdjęć zrobionych z telefonu. Podczas przesyłania do witryn użyłem obrazu o pełnej rozdzielczości.

    OnlineOCR

    OnlineOCR.net to czysta i prosta strona, która przyniosła bardzo dobre wyniki w moim teście. Główną rzeczą, która mi się podoba, jest to, że nie ma wielu reklam na całym świecie, co zwykle ma miejsce w przypadku takich serwisów niszowych.

    Aby rozpocząć, wybierz plik i poczekaj na zakończenie przesyłania. Maksymalny rozmiar przesyłania dla tej witryny wynosi 100 MB. Jeśli zarejestrujesz się na bezpłatne konto, otrzymasz kilka dodatkowych funkcji, takich jak większy rozmiar przesyłanych plików, wielostronicowe pliki PDF, różne języki wprowadzania, więcej konwersji na godzinę itp..

    Następnie wybierz język wprowadzania, a następnie wybierz format wyjściowy. Możesz wybrać z Worda, Excela lub zwykłego tekstu. Kliknij Konwertować przycisk, a zobaczysz tekst wyświetlany na dole w polu wraz z łączem do pobrania.

    Jeśli chcesz tylko tekst, po prostu skopiuj go i wklej z pola. Proponuję jednak pobrać dokument Worda, ponieważ zachowuje on zadziwiająco dobrą pracę z zachowaniem układu oryginalnego dokumentu.

    Na przykład, kiedy otworzyłem dokument Worda dla mojego drugiego testu, byłem zaskoczony, że dokument zawierał tabelę z trzema kolumnami, tak jak na obrazku.

    Spośród wszystkich stron ta była zdecydowanie najlepsza. Warto się zarejestrować, jeśli chcesz wykonać wiele konwersji.

    Dla kompletności zamierzam również linkować do plików wyjściowych tworzonych przez każdą usługę, abyś mógł zobaczyć wyniki dla siebie. Oto wyniki z OnlineOCR: Doc1 Doc i Test2 Doc.

    Pamiętaj, że otwierając te dokumenty Worda na komputerze, otrzymasz komunikat w programie Word, że jest on z Internetu, a edycja została wyłączona. Jest to całkowicie w porządku, ponieważ Word nie ufa dokumentom z Internetu i naprawdę nie musisz włączać edycji, jeśli chcesz tylko obejrzeć dokument.

    i2OCR

    Inną stroną, która dała całkiem dobre wyniki, była i2OCR. Proces jest bardzo podobny: wybierz język, plik, a następnie naciśnij Wyodrębnij tekst.

    Będziesz musiał poczekać minutę lub dwie, ponieważ ta strona trwa trochę dłużej. Ponadto w kroku 2 upewnij się, że obraz wyświetla się w podglądzie po prawej stronie, w przeciwnym razie otrzymasz kilka bełkotów jako wyjście. Z jakiegoś powodu obrazy z mojego iPhone'a były wyświetlane w trybie portretowym na moim komputerze, ale krajobraz podczas przesyłania na tę stronę.

    Musiałem ręcznie otworzyć obraz w aplikacji do edycji zdjęć, obrócić go o 90 stopni, a następnie obrócić z powrotem do portretu, a następnie zapisać go ponownie. Po zakończeniu przewiń w dół, aby wyświetlić podgląd tekstu wraz z przyciskiem pobierania.

    Ta strona radziła sobie całkiem dobrze z wynikami pierwszego testu, ale nie radziła sobie z drugim testem, który miał układ kolumn. Oto wyniki z i2OCR: Test1 Doc i Test2 Doc.

    FreeOCR

    Free-OCR.com zrobi zdjęcia i skonwertuje je na zwykły tekst. Nie ma możliwości eksportowania do formatu Word. Wybierz plik, wybierz język, a następnie kliknij Początek.

    Witryna jest szybka, a dane wyjściowe otrzymasz dość szybko. Kliknij link, aby pobrać plik tekstowy na swój komputer.

    Tak jak w przypadku wspomnianego poniżej NewOCR, ta strona zawiera wszystkie litery T w dokumencie. Nie mam pojęcia, dlaczego to zrobiłoby, ale z jakiegoś dziwnego powodu ta strona i NewOCR to zrobiły. Nie jest to wielka zmiana, ale to żmudny proces, którego naprawdę nie musisz robić.

    Oto wyniki z FreeOCR: Doc1 Doc i Test2 Doc.

    ABBYY FineReader Online

    Aby korzystać z FineReader Online, musisz zarejestrować się na konto, dzięki któremu otrzymasz 15-dniową bezpłatną wersję próbną do OCR do 10 stron za darmo. Jeśli potrzebujesz tylko jednorazowego OCR na kilka stron, możesz skorzystać z tej usługi. Upewnij się, że klikniesz link weryfikacyjny w e-mailu potwierdzającym po rejestracji.

    Kliknij Rozpoznać na górze, a następnie kliknij Przekazać plik aby wybrać plik. Wybierz swój język, format wyjściowy, a następnie kliknij Rozpoznać na dnie. Ta strona ma czysty interfejs i nie zawiera reklam.

    W moich testach ta strona była w stanie pobrać tekst z pierwszego dokumentu testowego, ale był on ogromnie ogromny, kiedy otworzyłem dokument Worda, więc skończyło się to ponownie i wybrałem Zwykły tekst jako format wyjściowy.

    W drugim teście z kolumnami dokument Worda był pusty i nie mogłem nawet znaleźć tekstu. Nie jestem pewien, co tam się wydarzyło, ale wydaje się, że nie jest w stanie poradzić sobie z niczym innym niż prostymi akapitami. Oto wyniki z FineReader: Test1 Doc i Test2 Doc.

    NewOCR

    Następna strona, NewOCR.com, była w porządku, ale nie tak dobra jak pierwsza strona. Po pierwsze, ma reklamy, ale na szczęście nie ma tony. Najpierw wybierz plik, a następnie kliknij Zapowiedź przycisk.

    Następnie możesz obrócić obraz i dostosować obszar, w którym chcesz skanować tekst. Jest to dość podobne do tego, jak proces skanowania działa na komputerze z dołączonym skanerem.

    Jeśli dokument ma wiele kolumn, możesz sprawdzić Analiza układu strony i spróbuje podzielić tekst na kolumny. Kliknij przycisk OCR, poczekaj kilka sekund na jego zakończenie, a następnie przewiń w dół, gdy strona się odświeży.

    W pierwszym teście dostał cały tekst poprawnie, ale z jakiegoś powodu skapitalizował każdy T w dokumencie! Nie mam pojęcia, dlaczego to zrobiłoby, ale tak się stało. W drugim teście z włączoną analizą strony uzyskała większość tekstu, ale układ był całkowicie wyłączony.

    Oto wyniki z NewOCR: Test1 Doc i Test2 Doc.

    Wniosek

    Jak widać, niestety, niestety, niestety, niestety, nie daje to bardzo dobrych wyników. Pierwsza wspomniana witryna jest zdecydowanie najlepsza, ponieważ nie tylko wykonała świetną robotę rozpoznając cały tekst, ale także zachowała format oryginalnego dokumentu.

    Jeśli jednak potrzebujesz tekstu, większość powyższych stron internetowych powinna być w stanie to zrobić za Ciebie. Jeśli masz jakieś pytania, skomentuj. Cieszyć się!