Mətnin tanınması. Pulsuz proqram - analog FineReader

Tez-tez, tez-tez ofis proqramları ilə işləyənlərin hamısı tipik bir məsələdir - bir kitab, jurnal, qəzet, sadəcə leafletlərdən mətni tarayın və sonra bu şəkilləri mətn formatına, məsələn, Word sənədinə tərcümə edin.

Bunu etmək üçün bir skaner və mətn tanınması üçün xüsusi bir proqram lazımdır. Bu yazıda FineReader'ın pulsuz analogu -Çivi şəkli (FineReader'da tanınma haqqında - bu yazıya baxın).

Başlayaq ...

Məzmun

  • 1. CuneiForm proqramının xüsusiyyətləri, xüsusiyyətləri
  • 2. Mətn tanıma nümunəsi
  • 3. Batch mətn tanınması
  • 4. Nəticələr

1. CuneiForm proqramının xüsusiyyətləri, xüsusiyyətləri

Çivi şəkli

Geliştirici saytından yükləyə bilərsiniz: //cognitiveforms.com/

Açıq mənbəli mətn tanınması proqramı. Bundan əlavə, Windows'un bütün versiyalarında çalışır: XP, Vista, 7, 8, xoşlayır. Plus, proqramın tam rus dilinə tərcüməsini əlavə edin!

Pros:

- dünyanın ən məşhur 20 dildə mətn tanınması (ingilis və rus dillərində bu rəqəm daxildir);

- müxtəlif çap yazılarına böyük dəstək;

- lüğət tanınmış mətni yoxlayın;

- işin nəticələrini bir neçə yolla saxlamaq qabiliyyəti;

- sənədin strukturunun saxlanılması;

- Əla dəstək və tanınma masaları.

Eksiler:

- çox böyük sənədlər və faylları dəstəkləmir (400 dpi-dən çox);

- birbaşa skanerlərin bir növünü dəstəkləmir (yaxşı ki, qorxudan deyil, brauzer sürücüləri ilə xüsusi skaner daxil edilir);

- dizayn parlaq deyil (proqramın problemi tam həll edərsə, ehtiyacı olan).

2. Mətn tanıma nümunəsi

Hesab edirəm ki, əvvəlcədən tanış olmaq üçün zəruri şəkilləri qəbul etdiniz (orada skan edilmiş və ya kitabın İnternetdə pdf / djvu formatında yüklənmiş və lazımi şəkilləri əldə etmişsinizdir. Bunu necə görürsünüz - bu məqaləyə baxın).

1) CuineForm proqramında lazımi şəkili açın (fayl / açıq və ya "Cntrl + O").

2) tanınmaya başlamaq üçün - ilk növbədə müxtəlif sahələri seçməlisiniz: mətn, şəkillər, masalar və s. Cuneiform proqramında bu yalnız əl ilə deyil, həm də avtomatik olaraq!! Bunu etmək üçün, pəncərənin yuxarı hissəsindəki "düzəliş" düyməsini basın.

3) 10-15 saniyə sonra. Proqram avtomatik olaraq müxtəlif rəngli bütün sahələri qeyd edəcəkdir. Məsələn, bir mətn sahəsi mavi ilə vurğulanır. Yeri gəlmişkən, o, bütün sahələri düzgün və tez bir zamanda vurğuladı. Dürüstəm ki, onun belə tez və düzgün cavabını gözləmirdim ...

4) Avtomatik formatlaşdırmağına etibar etməyənlər üçün dərslikdən istifadə edə bilərsiniz. Bunun üçün alətlər çubuğu var (şəkil aşağıda bax), sayəsində seçə bilərsiniz: mətn, masa, şəkil. Move, ilk şəkil artırmaq / azaltmaq, kənarları trim. Ümumiyyətlə yaxşı bir dəstə.

5) Bütün sahələr qeyd olunduqdan sonra davam edə bilərsiniz tanınması. Bunu etmək üçün, aşağıdakı şəkildəki kimi, eyni adın düyməsini basın.

6) Tam olaraq 10-20 saniyədə. Microsoft Word-də tanınmış mətn ilə bir sənəd görəcəksiniz. Maraqlıdır ki, bu nümunənin mətnində əlbəttə ki, səhvlər var idi, amma çox azı var! Xüsusilə, orijinal materialın necə düz olduğunu nəzərə alaraq - şəkil.

Sürət və keyfiyyət FineReader ilə olduqca müqayisə edilə bilər!

3. Batch mətn tanınması

Proqramın bu funksiyası bir şəkil deyil, bir dəfəyə bir dəfə tanış olmağınız üçün faydalı ola bilər. Partiya tanınmasını başlamaq üçün qısayol adətən başlanğıc menyusunda gizlənir.

1) Proqramı açdıqdan sonra, yeni bir paket yaratmaq və ya əvvəllər saxladığınız bir qutu açmaq lazımdır. Bizim nümunəmizdə yeni bir şey yaradın.

2) Növbəti addımda biz onu altı aydan sonra saxladığımızı xatırlayacağıq ki, bunu bir ad veririk.

3) Sənəd dilini seçin (rusca-ingiliscə), skan edilmiş materialınızdakı şəkillər və masalar olub-olmadığını göstərin.

4) İndi tanıma üçün faylların yerləşdiyi qovluğu göstərməlisiniz. Yeri gəlmişkən, maraqlıdır ki, proqramın özü tanımaq və layihəyə əlavə etmək üçün bütün şəkillər və digər qrafik faylları tapacaqdır. Bundan əlavə əlavə çıxarmaq lazımdır.

5) Növbəti addım vacib deyil - tanındıqdan sonra mənbə faylları ilə nə etmək lazımdır. Mən "heç nə etmə" qutusunu seçməyi məsləhət görürəm.

6) Yalnız tanınmış sənədin saxlanılacağı formatı seçmək qalır. Bir neçə variant var:

- rtf - Word sənədindən faylın bütün populyar ofislər tərəfindən açılması (pulsuz olanlar, proqramlara keçid);

- txt - mətn formatında yalnız mətnləri, şəkillərini və cədvəllərini saxlaya bilərsiniz;

- htm - Hiper mətn səhifəsi, sayt üçün faylları tara və tanıdığınız zaman rahatdır. Onun nümunəsi ilə seç.

7) "Bitir" düyməsini basdıqdan sonra, layihənin işlənməsi başlayacaq.

8) Proqram olduqca tez işləyir. Tanınmadan sonra htm faylları olan bir sekməni görəcəksiniz. Belə bir faylı tıkladığınız təqdirdə, nəticəni görə biləcəyiniz bir brauzer başlayır. Yeri gəlmişkən, paket daha da işləməlidir.

9) Gördüyünüz kimi nəticələr iş çox təsir edici. Proqram asanlıqla şəkil tanınıb və onun altında olan mətni asanlıqla tanıyır. Proqram pulsuz olsa da, ümumiyyətlə, super!

4. Nəticələr

Çox vaxt sənədləri yoxlayır və tanış deyilsinizsə, FineReader satın alma ehtimalla məntiqli deyil. CuneiForm asanlıqla ən çox vəzifələri idarə edir.

Digər tərəfdən, o da mənfi cəhətləri var.

Birincisi, nəticə çıxaran nəticəni yoxlamaq və yoxlamaq üçün çox az vasitə var. İkincisi, bir çox şəkilləri tanımaq lazım olduğunda FineReader'da dərhal sağdakı sütunda layihəyə əlavə olunan hər şeyi dərhal görmək üçün daha rahatdır: lazımsız çıxarmaq, düzəlişlər etmək və s. Və üçüncüsü, tamamilə pis keyfiyyət sənədlərində, CuneiForm tanınmayır: sənədləri ağıllara gətirməlisiniz - səhvləri düzəltməlisiz, noktalama nişanlarını, quotes və s.

Bütün bunlar. Hər hansı digər yaxşı pulsuz mətn tanınması proqramı bilirsinizmi?