Blogun bütün oxucularına salam!
Hesab edirəm ki, tez-tez kompüterdə işləyənlər (oynayan deyil, işləyir) mətn tanınması ilə məşğul olmalıdırlar. Bəli, məsələn, kitabdan bir parça oxudu və indi bu hissəni sənədinizə yapışdırmalısınız. Ancaq taranan sənəd bir şəkil və mətnə ehtiyacımız var - bunun üçün şəkillərdən mətn tanınması üçün xüsusi proqramlar və onlayn xidmətləri lazımdır.
Tanınma proqramları haqqında əvvəlki yazılarda yazdım:
- FineReader-da mətn və tanınma (pullu proqram);
- Analoq FineReader-CuneiForm-da (pulsuz proqram) işləyin.
Eyni məqalədə mətn tanınması üçün onlayn xidmətlərə yönəlmək istərdim. Bütün bunlardan sonra 1-2 şəkil ilə mətni tez bir şəkildə almaq lazımdırsa, müxtəlif proqramları yükləməyinizdən asılı olmayaraq ...
Bu vacibdir! Tanınma keyfiyyəti (səhvlərin sayı, oxunaqlılıq və s.) Orijinal görüntü keyfiyyətinə çox asılıdır. Buna görə tarama zamanı (fotoşəkil və s.) Mümkün olduğunca yüksək keyfiyyəti seçin. Çox hallarda, 300-400 dpi keyfiyyəti kifayət edər (dpi şəkil keyfiyyətini xarakterizə edən parametrdir). Bütün skanerlərin parametrlərində bu parametr adətən göstərilir.
Onlayn xidmətlər
Xidmətlərin işini göstərmək üçün məqalələrimdən birinin ekranını çəkdim. Bu ekran görünüşü aşağıda təqdim olunan bütün xidmətlərə yüklənəcək.
1) //www.ocrconvert.com/
Sadəcə olaraq, bu xidmətin sadəliyindən xoşum gəlir. Site İngilis olsa da, Rus dili ilə yaxşı işləyir. Qeydiyyata ehtiyac yoxdur. Tanıma başlamaq üçün 3 addımın atılması lazımdır:
- şəkilinizi yükləyin;
- şəkildəki mətnin dilini seçin;
- başlanğıc tanınma düyməsini basın.
Format dəstəyi: PDF, GIF, BMP, JPEG.
Nəticədə şəkil aşağıda göstərilir. Deyirəm ki, mətn yaxşı tanınır. Bundan əlavə, çox tez-tez mən 5-10 saniyə gözlədim.
2) //www.i2ocr.com/
Bu xidmət yuxarıdakı kimi işləyir. Burada da faylı yükləyin, tanınma dilini seçin və çıxarış mətn düyməsini basın. Xidmət çox tez işləyir: 5-6 saniyə. bir səhifə.
Desteklenen formatlar: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.
Bu onlayn xidmətin nəticəsi daha rahatdır: dərhal iki pəncərə görürsünüz - birincisi tanınma nəticəsində, ikinci - orijinal şəkil. Buna görə redaktə edərkən düzəlişlər etmək kifayətdir. Xidmətdə qeydiyyatdan keçmək lazımdır, bu da lazım deyil.
3) //www.newocr.com/
Bu xidmət bir neçə yolla unikaldır. Birincisi, "yeni moda" formatında DJVU formatını dəstəkləyir (bu arada formatların tam siyahısı: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). İkincisi, şəkildəki mətn sahələrinin seçilməsini dəstəkləyir. Bu yalnız mətn sahələrində deyil, həm də qrafika olanları tanımaq lazım deyil olduğunuzda çox faydalıdır.
Tanınma keyfiyyəti orta hesabla yuxarıdır, qeydiyyata ehtiyac yoxdur.
4) //www.free-ocr.com/
Tanınma üçün çox sadə bir xidmət: bir şəkil yükləyin, dili müəyyənləşdirin, captcha (bu arada, bunu etmək lazım olan bu məqalədə yeganə xidmətə) daxil edin və mətni mətnə çevirmək üçün düyməni basın. Əslində hər şey!
Desteklenen formatlar: PDF, JPG, GIF, TIFF, BMP.
Tanınma nəticəsi orta səviyyədədir. Səhvlər var, amma çox deyil. Lakin, orijinal ekranın keyfiyyətinin daha yüksək olacağı təqdirdə, daha az səhv olan bir sifariş olardı.
PS
Bu günün hamısıdır. Mətn tanınması üçün daha maraqlı xidmətlərin olduğunu bilsəniz - şərhlərdə paylaşıma minnətdaram. Bir şərt: qeydiyyatdan keçməyə ehtiyac yoxdur və xidmət pulsuz idi.
Xoş gəldiniz!