Konvensiyalı surətdə istifadə edərək bir PDF faylından mətn çıxarmaq həmişə mümkün deyil. Tez-tez bu sənədlərin səhifələri kağız versiyalarının skan edilmiş məzmunudur. Bu faylları tamamilə düzəldilə bilən mətn məlumatlarına çevirmək üçün Optik Karakter Tanıma (OCR) funksiyası olan xüsusi proqramlar istifadə olunur.
Belə həllərin həyata keçirilməsi çox çətindir və buna görə də çox pula xərclənir. PDF ilə mətni müntəzəm olaraq tanış etmək istəyirsinizsə, müvafiq proqramı satın almaq məsləhətdir. Nadir hallarda, mövcud xidmətlərdən birini oxşar funksiyaları ilə istifadə etmək daha mantiqlı olardı.
PDF-dən mətnin onlayn tanınması
Əlbəttə ki, OCR onlayn xidmətləri xüsusiyyətləri tam masa üstü həllər ilə müqayisədə daha məhduddur. Amma bu vəsaitlərlə pulsuz və ya nominal haqqı ilə işləyə bilərsiniz. Əsas odur ki, müvafiq web applications onların əsas vəzifəsi, yəni mətn tanınması ilə məşğul olur.
Metod 1: ABBYY FineReader Online
Xidmət inkişafı şirkəti optik sənədlərin tanınması sahəsində liderdir. Windows və Mac üçün ABBYY FineReader mətni mətnə çevirmək və onunla işləmək üçün güclü bir həlldir.
Əlbəttə ki, proqramın veb-tərəfi funksionallıqdan daha azdır. Buna baxmayaraq, xidmət 190-dan çox dildə tərcümə və şəkillərdən mətni tanıyır. PDF fayllarının Word, Excel, və s. Sənədlərə çevrilməsini dəstəkləyir.
ABBYY FineReader Online onlayn xidmət
- Vasitə ilə işə başlamadan əvvəl, saytda bir hesab yaratmaq və ya Facebook, Google və ya Microsoft hesabınızı istifadə edərək daxil olun.
Giriş pəncərəsinə getmək üçün düyməni basın. "Giriş" üst menyu çubuğunda. - Daxil etdikdən sonra düyməni istifadə edərək istədiyiniz PDF sənədini FineReader-ə idxal edin "Fayl yüklə".
Sonra basın "Seçin səhifə nömrələri" və mətn tanınması üçün istədiyiniz span daxil edin. - Sonra, sənəddə olan dilləri, nəticələnən fayl formatını seçin və düyməni basın "Tanıyın".
- Əməliyyatdan sonra, müddəti tamamilə sənədin ölçüsündən asılıdır, bitmiş faylın adını tıklayaraq mətn məlumatları ilə yükləyə bilərsiniz.
Və ya mövcud bulud xidmətlərindən birinə ixrac et.
Xidmət, yəqin ki, şəkillərdə və PDF fayllarında ən dəqiq mətn tanınması alqoritmləri ilə fərqlənir. Lakin, təəssüf ki, onun pulsuz istifadəsi ayda 5 səhifədən ibarətdir. Daha həcmli sənədlərlə işləmək üçün bir illik abunə almaq lazımdır.
Lakin OCR funksiyası çox nadir hallarda tələb olunarsa, ABBYY FineReader Online kiçik PDF fayllarından mətn çıxarmaq üçün böyük bir seçimdir.
Metod 2: Pulsuz Online OCR
Mətnin rəqəmləşdirilməsi üçün sadə və rahat xidmət. Qeydiyyata ehtiyac olmadan, resurs saatda 15 tam PDF-səhifəni tanıyır. Pulsuz Online OCR tam 46 dildə sənədlərlə işləyir və avtorizasiya olmadan üç mətn ixrac formatlarını dəstəkləyir - DOCX, XLSX və TXT.
Qeydiyyatdan keçirərkən istifadəçi çox səhifəli sənədləri işə sala bilər, lakin bu səhifələrin sayını 50 ədəd məhdudlaşdırır.
Pulsuz Online OCR onlayn xidməti
- PDF-dən mətni "qonaq" kimi tanıyaq, resursda icazə almadan saytın əsas səhifəsində müvafiq formanı istifadə edin.
Düyməni istifadə edərək istədiyiniz sənədləri seçin "Fayl", əsas mətn dilini, çıxış formatını müəyyən edin, sonra faylın yüklənməsini və klikləməsini gözləyin "Convert". - Dijitalləşmə prosesinin sonunda, klikləyin "Çıxış faylını endirmək" bitmiş sənədləri kompüterin mətninə saxlamaq üçün.
Səlahiyyətli istifadəçilər üçün hərəkətlərin ardıcıllığı bir az fərqlidir.
- Düyməni istifadə edin "Qeydiyyat" və ya "Giriş" yuxarı menyu barında sırasıyla Pulsuz Online OCR hesabı yaradın və ya daxil olun.
- Tanıma panelində yetkilendikten sonra, düyməni basıb saxlayın "CTRL", təqdim olunan siyahıdan qaynaq sənədinin iki dilinə qədər seçin.
- PDF-dən mətn çıxarmaq üçün əlavə variantları göstərin və düyməni basın. "Fayl seç" Sənədin xidmətə yüklənməsi.
Sonra tanıma başlamaq üçün basın "Convert". - Sənədi işlədikdən sonra, müvafiq sütundakı çıxış faylının adı ilə əlaqədar linki vurun.
Tanınma nəticəsi dərhal kompüterinizin yaddaşında saxlanacaq.
Kiçik bir PDF sənədindən mətn çıxarmaq lazımdırsa, yuxarıda təsvir edilən aləti istifadə etmək üçün təhlükəsiz müraciət edə bilərsiniz. Böyük fayllarla işləmək üçün, Pulsuz Online OCR-da əlavə simvollar almaq və ya başqa bir həllinə müraciət etmək lazımdır.
Metod 3: NewOCR
DjVu və PDF kimi faktiki olaraq hər hansı bir qrafik və elektron sənəddən mətn çıxarmaq imkanı verən tamamilə pulsuz OCR xidməti. Bu resurs tanınan faylların ölçüsünə və sayına məhdudiyyət qoymur, qeydiyyatdan keçməyi tələb etmir və geniş funksiyaları təklif edir.
NewOCR 106 dilləri dəstəkləyir və hətta aşağı keyfiyyətli sənəd taramalarını düzgün idarə edə bilir. Faylın səhifəsində mətn tanınması üçün ərazini əl ilə seçmək mümkündür.
Online xidmət NewOCR
- Beləliklə, lazımsız tədbirlər görmədən, dərhal resursla işə başlaya bilərsiniz.
Birbaşa ana səhifədə sənədin saytın idxal forması var. NewOCR faylını yükləmək üçün düyməni istifadə edin "Fayl seç" bölmədə "Faylınızı seçin". Sonra sahədə "Tanınma dili (lər)" qaynaq sənədinin bir və ya bir neçə dildən birini seçin və sonra basın "Upload + OCR". - Tercih etdiyiniz tanınma ayarlarınızı seçin, mətn çıxarmaq üçün istədiyiniz səhifəni seçin və düyməni basın. "OCR".
- Bir az aşağıya fırladın və düyməni tapın. Yüklə.
Bunun üzərinə basın və açılır siyahıdan yükləmək üçün lazım olan sənəd formatını seçin. Bundan sonra, çıxarılmış mətnlə bitmiş fayl kompüterinizə endiriləcəkdir.
Alət rahatdır və kifayət qədər yüksək keyfiyyətli bütün simvolları tanıyır. Lakin, idxal olunan PDF sənədinin hər bir səhifəsinin işlənməsi müstəqil şəkildə başlanmalı və ayrı bir faylda nümayiş etdirilməlidir. Əlbəttə dərhal tanınma nəticələrini panoya kopyalayıb başqaları ilə birləşdirə bilərsiniz.
Buna baxmayaraq, yuxarıdakı nüansları nəzərə alaraq, NewOCR istifadə edərək, böyük miqdarda mətn çıxarmaq çox çətindir. Eyni kiçik fayllarla xidmət "cop ilə" işləyir.
Metod 4: OCR.Space
Mətnin rəqəmləşdirilməsi üçün sadə və anlaşılmaz bir qayda PDF sənədlərini tanıyır və nəticəni bir TXT faylı ilə təmin edir. Səhifələrin sayına heç bir məhdudiyyət yoxdur. Yalnızca məhdudiyyət, giriş sənədinin ölçüsünün 5 meqabayt keçməməsidir.
OCR.Space online xidməti
- Alətlə işləmək üçün qeydiyyatdan keçmək lazım deyil.
Yalnız yuxarıdakı linki vurun və düyməsini istifadə edərək, PDF sənədinizi kompüterinizdən veb səhifəyə yükləyin "Fayl seç" və ya şəbəkədən - arayışla. - Açılır siyahıda "OCR dili seçin" idxal olunan sənədin dilini seçin.
Sonra düyməni basaraq mətn tanınma prosesini başlayın. "OCR başlayın!". - Faylın işlənməsinin sonunda, nəticəyə baxın "OCR nəticələri" və basın Yükləbitmiş TXT sənədini yükləmək üçün.
Yalnız PDF-dən mətn çıxarmaq lazımdır və son formatlaşdırma heç də vacib deyil, OCR.Space yaxşı seçimdir. Xidmətdə eyni anda iki və ya daha çox dildə tanınmanın təmin olunmadığı üçün yeganə sənəd "birtərəfli" olmalıdır.
Həmçinin baxın: Pulsuz analogları FineReader
Məqalədə təqdim olunan onlayn vasitələrin qiymətləndirilməsində, ABBYY-dən FineReader Online OCR funksiyasını ən dəqiq və düzgün şəkildə yerinə yetirdiyini qeyd etmək lazımdır. Mətn tanıma üçün maksimum dəqiqlik sizin üçün vacibdirsə, bu seçimi xüsusilə nəzərə almaq yaxşıdır. Bunun üçün ödəmək üçün, ehtimal ki, də var.
Kiçik sənədləri rəqəmləşdirməlisiniz və xidmətinizdə səhvləri düzəltməyə hazırsınızsa, NewOCR, OCR.Space və ya Pulsuz Online OCR istifadə etmək məsləhətdir.