Hızlı Erişim
Beyaz Bilgisayar Danışmanlık Hizmetleri Ltd. Şti.

OCR İşlemleri

Optik Karakter Tanıma (Optical Character Recognition), bilgisayar ortamında bulumayan yazılı dokümanların özel tarayıcılar arayıcılığıyla veya normal olarak taranmış resimlerinin özel programlar yardımıyla bilgisayar ortamına düzenlenebilecek sayısal halde ("Word", "txt") aktarılmasıdır.

OCR uygulanacak bir projede sağlıklı sonuç alınabilmesi için.
Fiziki ortamda bulunan bilgilerin (yazı karakterlerinin) yıpranmamış ve kaliteli olması gerekmektedir. Öncelikle tarayacağınız yazının bulunduğu kağıdın buruşmamış, kirlenmemiş ve temiz olması gerekmektedir.  Uygun ortamda bulunan bilgilerin OCR dan geçirilmesi hem çok kısa sürecektir  hemde taranan karakterlerin tanınma olasılığını maxsimum seviyede tutacaktır. Elde edilen sonuc, belgenin orjinali eşleştirilip bire bir sonuç almak için yapılan düzeltme işlemini minimuma indirecektir.

OCR işlemini sadece kitap karakterleri ile yapabilirsiniz, OCR programlarının el yazısını tanıma özelliği olmadığından elyazmaları veya belge üzerindeki el yazıları ve düşülmüş notlar OCR işlemine tabi tutulamaz.  

Tarayıcının kaliteli olması için önerilen scaner tipi Drum Scanner : Bunlar özel olarak profesyonel amaçlar için tasarlanmış tarayıcılardır. Taranacak medya, gerek dia olsun gerek kağıt (opak), boyutuna göre özel bir silindirin üzerine yapıştırılıp (ki drum tabiri buradan geliyor), döndürülmek suretiyle, lazer göz vasıtasıyla okunur. Bu tip tarayıcılar çok gelişmiş olup masaüstü yayıncılık sistemlerinde ve modern baskı sistemlerinde kullanılır. Genelde gazetelerin, dergilerin, broşürlerin resimlerinin hazırlanmasında yaygın biçimde kullanılır. Dergimizde gördüğünüz resimlerin çoğu bu tip bir tarayıcı ile taranıp hazırlanır. Hassas, hatasız, kaliteli sonuçlar alabilmek ve bir de en önemlisi resmi orijinal boyutundan çok daha fazla büyütebilmek için kullanılır. Şöyle diyebilirim masaüstü yayıncılık yaptığım yıllarda, bu aletlerin harikalar yaratarak resmin orijinalinden bile daha güzel sonuçlar alınabildiğini bizzat gözlerimle görmüşümdür.

    Tarama çözünürlüğü en az 200dpi olmalıdır, 300dpi tavsiye ederim net sonuçlar elde edebilme şansınız artar.

    OCR programı ile entegre çalışacak arşivsel veya yönetimsel yazılımın uygulanabilirliği ve yönetilebilirliğinin flexible olması gerekmektedir. Birçok işlemi arşiv yazılımı otomatik yapması gerekmektedir.

    OCR programına veya yazılıma eklenecek add in add on lar sayesinde tarama OCR işlemleri otomatikleştirilebilir.  Gerekirse taramayı yaptıktan sonra bir resim editör programıyla imageların kontrast ve ışık ayarları üzerinde oynamak OCR programının tahmin şansını arttırmış olacaktır.


Kısaca tarama işlemini anlatmak gerekirse. Bunu yapmanın iki yöntemi var.
 
Birincisi, OCR programını açıp, tarayıcıyı tanıtmak ve SCAN AND READ komutuyla taramayı OCR programının içinden yapıp hemen arkasından okuma (ya da tanıma) işlemini gerçekleştirme.
 
İkincisi, önce resmi tarayıp bir yere kaydetmek, resim işleme programıyla resim üzerinde birtakım düzeltmeler yapmak ve OCR programını bunlardan sonra çalıştırıp OPEN AND READ komutuyla sayfaları okutmaktır. 
 
Sonuç Olarak:

 
Yukarıda anlattığım işlemlerin ve ortamların iyi olması maliyeti çok düşürecektir. Tarama işleminden sonra taranan karakterler düzgün çıkar ise şuanda yapıtığınız tarama işlemine ekstra %50 maliyet konulabilir. Ama taranacak belgelerin üzerinde şablon resim, kir, çizik, yıpranmışlık varsa taradıktan sonra belge üzerinde eşleştirme yapmak bazen o belgeyi elle yazmak kadar uzun sürebilmektedir. Bu durumda net maliyet analizi çıkarmak fiziki ortam görülüp örnekleme yapılması şarttır. Fakat ne kötüsü olsa bile bir personel günde 200 sayfa tarama yapabilir kanısındayım.

 


Beyaz Bilgisayar Danışmanlık Hizmetleri Ltd. Şti.
Burhaniye Mah. Doğu Karadeniz Cad. Selvili Evler No:26 / E (Villa 5)
Beylerbeyi / Üsküdar / İSTANBUL
T : (0216) 557 72 72    F : (0216) 422 22 90    beyaz@beyaz.net
Her hakkı saklıdır. Site içinde kullanılan tüm yazılar materyaller Beyaz Bilgisayar Ltd. Şti. aittir. İzinsiz kaynak gösterilmeden hiçbir doküman ve resim kullanılamaz. Yayınlanan yazıların izin alınmadan kopyalanması ve kullanılması 5846 sayılı Fikir ve Sanat Eserleri Yasasına göre suçtur.