scan to text

Czym jest MiceText scan to text?

MiceText jest precyzyjną, zaawansowaną technologicznie, przyjazną i prostą aplikacją OCR oraz silnikiem OCR.

Celem działania aplikacji jest skopiowanie (rozpoznanie) treści zeskanowanego papierowego dokumentu do edytowalnego dokumentu tekstowego. (...) MiceText jest aplikacją OCR, która kopiuje dokumenty – nie „ulepsza” ich i nie poprawia.

Idea i cel rozpoznawania dokumentów

Archiwizacja dokumentów jest codziennością. Dziesiątki faktur, pism i różnego rodzaju dokumentów spływających codziennie do firmy faksem i tradycyjną pocztą oraz te podpisywane bezpośrednio z klientami muszą być archiwizowane. Ogromne i szybko rosnące stosy dokumentów stają się problemem każdej, nawet najmniejszej firmy. Rozsądnym oraz optymalnym rozwiązaniem jest skanowanie dokumentów. Proces ten jest realizowany w wielu podmiotach za pomocą podstawowego oprogramowania dostarczonego przez producenta skanera. Wspiera ono tylko szybkie skanowanie kolejnych stron do postaci obrazu. W ten sposób zapisany dokument nie umożliwia edytowania i modyfikowania treści. Analiza dokumentów papierowych jest mało wydajna, w związku z czym jest bardzo kosztowna. Formaty dokumentów elektronicznych bardzo często będące obrazami zeskanowanego dokumentu (pomimo zapisu w pliku o rozszerzeniu pdf czy doc) nie umożliwiają wyszukiwania krótkich fragmentów tekstów czy też całych fraz. Uniemożliwia to efektywną pracę z dokumentami tego typu. Stają się one tylko zbiorem bezładnie porozrzucanych elektronicznych kartek, lecz nie dynamicznie rozwijającym się usystematyzowanym źródłem wiedzy (bazą wiedzy) o umowach, zadaniach, przetargach, zakupach czy jakiejkolwiek działalności Twojej firmy. Model rozwoju usystematyzowanego źródła wiedzy wspierać będzie tylko oprogramowanie OCR, które przetworzy skan obrazu dokumentu papierowego w postać edytowalną.

Tym rozwiązaniem jest MiceText

Możliwości

Scan to text oparte jest o najefektywniejsze algorytmy rozpoznawania znaków, dzięki czemu kluczowe i bardzo skomplikowane operacje realizowane są nadzwyczaj szybko i dokładnie. (...)

Nasz OCR rozpozna wiele języków i czcionek, (...) co skutkuje możliwością rozpoznawania tekstów w wielu językach, (...) w niewielkim stopniu wpływając na szybkość, wydajność i efektywność. (...)

MiceText kopiuje nie tylko te obrazy, które są poprawnie pionowo zapisane ale również te, których treść jest w niewielkim stopniu obrócona, a w przypadku znacznego obrócenia umożliwi przeprowadzenie korekty. (...) Dodatkiem wspierającym proces korekty obrazu jest moduł graficznych filtrów. (...) Możliwe też jest kopiowanie dokumentów zawierających poprzesuwane w pionie względem siebie znaki, które zostaną inteligentnie zestawione za pomocą funkcji H-Liner. (...)

Zastosowanie wielu zaawansowanych algorytmów wpływa w znacznym stopniu na automatyzację opisywanych wcześniej procesów. Program nie będzie bezmyślnie poprawiać nietypowo zapisanych wyrazów, tak jak czyni to większość dostępnych aplikacji. Programy posługujące się takimi mechanizmami potrafią zmienić kontekst lub sens całych zdań w znaczny sposób ukrywając niedoskonałość rozpoznawania. MiceText jest programem OCR wykonującym kopię dokumentu. Proces rozpoznawania tekstu NIE JEST oparty o technikę rozpoznawania słownikowego. (...)

Nauka i douczanie

Budowa MiceText jest na tyle intuicyjna, że gdy zajdzie potrzeba to z procesem nauczania i douczania poradzi sobie każdy użytkownik komputera.

Proces nauczania zbioru nowych nietypowych czcionek wymaga zaledwie kilku godzin. Dzięki temu MiceText nie zatrzyma w Twojej firmie procesu archiwizacji danych. (...)

W przypadku innych aplikacji scan to text, które nie oferują omawianego mechanizmu będziesz musiał zgłosić problem producentowi, który zaktualizuje bazę czcionek w kilkanaście godzin, a może i dni, prawdopodobnie wystawiając Ci rachunek. Douczanie MiceText nowych znaków już istniejących czcionek zajmie tylko parę minut w zamian za pewność, iż rozpoznawane niskiej jakości dokumenty uzyskają dokładną kopię. Jednakże jest to tylko opcja, która zwiększy komfort pracy z OCR.

Wymagania, wydajność i bezpieczeństwo

MiceText jest aplikacją przeznaczoną dla każdego użytkownika. Do uruchomienia jej wystarczy komputer z systemem Microsoft Windows®. (...)

Jego prosta obsługa jest ukłonem w stronę każdego użytkownika, niezależnie od jego stopnia obycia z technologiami informatycznymi. Niemniej jednak, cały cykl tworzenia MiceText poczynając od samej koncepcji nastawiony był na zastosowania profesjonalne i produkcyjne. (...) Mając na uwadze różne potrzeby użytkowników został on zróżnicowany pod względem dostępnych funkcji. Dla użytkowników domowych i małych biur (...) przygotowaliśmy wersję MiceText Home Edition, (...) natomiast dla dużych firm i korporacji, (...) w których archiwizacja dokumentów jest procesem równoległym z bieżącą pracą lub też jest jej stałym elementem, przygotowaliśmy wersję Professional. (...)

Zdajemy sobie sprawę, że rozmiar firmy ma duży wpływ na złożoność realizowanych procesów i wymagań stawianych aplikacjom pod względem uniwersalności (stopnia dostosowania) i automatyzacji. Niewątpliwie zautomatyzowanie procesu przetwarzania wpływa na zwiększenie wydajności procesu archiwizacji dokumentów. Przestaje on być wąskim gardłem mogącym mieć wpływ na inne procesy. W związku z powyższym, OCR został zaprojektowany i wykonany w sposób umożliwiający jego bezproblemowe dostosowanie do otoczenia, w którym będzie uruchomiony. (...)

Szybkie działanie Naszego OCR-a zapewnia wykorzystanie m. in. mechanizmów technologii MT (...)

oraz wysoce wydajnego języka programowania. (...)

Dołożyliśmy wszelkich starań aby MiceText był aplikacją godną zaufania i bezpieczną. (...)