Bu məqalə əvvəlki birinə əlavə olacaq (və daha ətraflı şəkildə düz mətn tanınmasının mahiyyətini ortaya qoyacaqdır).
Bir çox istifadəçi tam başa düşməyən mahiyyətlə başlayaq.
Bir kitab, qəzet, jurnal, və s. Tarandıktan sonra xüsusi bir proqramda (ABBYY FineReader üçün ən yaxşısından biri) tanınması lazım olan bir sıra şəkillər (yəni, qrafik fayllar, mətn deyil) alırsınız. Tanınma - bu, qrafikdən mətn əldə etmək prosesidir və bu proses daha ətraflı şəkildə yazılacaq.
Mənim nümunəmdə, bu saytın ekran görüntüsünü edəcəyəm və ondan mətn almağa çalışacağam.
1) Fayl açılması
Tanıdığımız şəkilləri açın.
Yeri gəlmişkən, burada qeyd etmək lazımdır ki, yalnız şəkil formatlarını deyil, həm də DJVU və PDF faylları aça bilərsiniz. Bu, tez-tez şəbəkənin üzərində, bu formatlarda yayılmış olan bütün kitabı tez-tez tanıyacaq.
2) redaktə
Avtomatik tanınma ilə dərhal razılaşmaq çox mənalı deyil. Əlbəttə ki, yalnız mətn, şəkillər və tabletlər, üstəlik əla keyfiyyətdə skan edilmiş bir kitabınız varsa, onda edə bilərsiniz. Digər hallarda, bütün sahələri əl ilə qurmaq daha yaxşıdır.
Adətən, əvvəlcə səhifədən lazımsız sahələri silmək lazımdır. Bunu etmək üçün paneldəki redaktə düyməsini basın.
Sonra daha uzun işləmək istədiyiniz ərazini tərk etməlisiniz. Bunun üçün lazımsız sərhədləri düzəltmək üçün bir vasitə var. Sağ sütunda rejimi seçin. kəsmək.
Sonra, tərk etmək istədiyiniz ərazini seçin. Aşağıdakı şəkildəki qırmızı ilə vurğulanır.
Yeri gəlmişkən, əgər bir neçə şəkil açsanız, bir anda bütün şəkilləri əkin tətbiq edə bilərsiniz! Ayrı-ayrılıqları kəsməmək üçün əlverişli deyil. Xahiş edirik, bu panelin altındakı başqa böyük bir vasitə var -silgi. Bununla lazımsız boşanmalarını, səhifə nömrələrini, ləkələri, lazımsız xüsusi simvolları və fərdi bölmələrdən silmək olar.
Kenarları kəsmək üçün vurduqdan sonra orijinal şəkiliniz dəyişilməlidir: yalnız iş sahəsi qalacaq.
Sonra şəkil redaktoru çıxmaq olar.
3) sahələrin seçilməsi
Paneldəki açıq şəkilin yuxarısında, tarama sahəsini təyin edən kiçik düzbucaqlılar var. Onlardan bir neçəsi var, qismətləri ən ümumi olanları nəzərdən keçirək.
Image - proqram bu sahəni tanımır, sadəcə göstərilən dikdörtgəni kopyalayıb və onu tanınmış sənədə yapışdırır.
Mətn, proqramın diqqət mərkəzində olacağı və imicdən mətn almağa çalışacağı əsas sahədir. Biz bu sahədə nümunə olaraq qeyd edəcəyik.
Seçildikdən sonra ərazi açıq yeşil rəngdə boyanır. Sonra növbəti addımı keçə bilərsiniz.
4) mətn tanınması
Bütün sahələr təyin edildikdən sonra tanımaq üçün menyu əmrini basın. Xoşbəxtlikdən, bu addımda daha çox şey lazım deyil.
Tanınma vaxtı sənədinizdə olan səhifələrin sayından və kompüterin gücündən asılıdır.
Orta səviyyədə keyfiyyətli bir skan edilmiş bir tam səhifə 10-20 saniyə çəkir. ortalama PC qüvvəsi (bugünkü standartlara görə).
5) Hata yoxlama
Şəkillərin orijinal keyfiyyəti nə olursa olsun, adətən tanınmadan sonra həmişə səhvlər var. Eyni zamanda, heç bir proqram bir insanın işini tamamilə aradan qaldıra bilməz.
Ödəmə seçimini tıqlayın və ABBYY FineReader sizə çıxış verə bilər, öz növbəsində, o, stumbled yerləşir sənəddə yerləri. Taskınız, orijinal görüntüyle müqayisədə (yəqin ki, bu yeri genişləndirilmiş bir versiyada sizə təqdim edəcək) tanınma variantına malikdir - müsbət cavab vermək və ya düzəltmək və təsdiqləmək. Proqram bütün sənədin yoxlanılana qədər növbəti çətin yerə və s.
Ümumiyyətlə, bu proses uzun və darıxdırıcı ola bilər ...
6) Qorunma
ABBYY FineReader işinizi qənaət etmək üçün bir neçə variant təklif edir. Ən çox istifadə edilən "dəqiq surət". Yəni bütün sənəd, onun mətnində mənbədə olduğu kimi eyni şəkildə formatlaşdırılacaq. Rahat bir seçim onu Word-ə ötürməkdir. Beləliklə, biz bu nümunədə iştirak etdik.
Bundan sonra tanış mətni tanış Word sənədində görəcəksiniz. Hesab edirəm ki, onunla nə edəcəyini daha da izah etmək üçün heç bir nöqtə yoxdur ...
Beləliklə, biz bir şəkil düz mətn çevirmək üçün konkret bir nümunə ilə təhlil etdik. Bu proses həmişə sadə və sürətli deyil.
Hər halda, hər şey orijinal görüntü keyfiyyətinə, təcrübə və kompyuterinizin sürətindən asılı olacaq.
Yaxşı bir iş edin!