OCR – Abbyy Fine Reader 10 Kullanımı – 2


Programın bir çok yeteneği olduğundan bahsetmiştik. Diğer taraftan bizim sadece “ihtiyacımız olanı alıp çıktığımızı” biliyorsunuz. Biz programı sadece “yazma yükünden kurtulmak” üzere inceliyoruz. O zaman da işimiz kısaca ‘Aç / Kopyala / Yapıştır’dan ibaret olacak. Yoksa sayfanın biçimini, sütunları, hatta resimlerini, alt yazı / üst yazıyı koruması türünden ayrıntılara girmeyeceğiz. Eğitim işlerinde bundan fazlasına ihtiyaç olacağını düşünmüyorum. Bunlara gerçekten ihtiyacınız varsa programın Türkçe yardım sayfaları fazlasıyla işinizi görecektir.

Programın kendi içinden bir şeyleri kaydetmediğiniz sürece (göreceğimiz üzere buna ihtiyaç da yok aslında) deneme sürümünün “50 kez kayıt sınırı” size dokunmayacak demektir. Bu durumda 15 gün süresince gönlünüzce kullanmak mümkün olacaktır. (Deneme sürümlerini sevme nedenimizi şu yazıda görebilirsiniz)

Açarken ‘Çalıştır’a basıyoruz.

.

.

İlk kullanımda, gereksiz kafa karıştırıcı şu “tercihler penceresiyle” karşılaşıyoruz. Alttaki ‘Başlangıçta göster’ kutusunu boşaltarak bir dahaki açılışlarda çıkmamasını sağlıyoruz.

.

.

Arayüz (menüler) tamamen Türkçe ve her şeyi açıklıyor.

.

.

Bir tarayıcı (scanner) ile taranmış veya fotoğraf makinesi ile fotoğrafı çekilip bilgisayar aktarılmış, aslında birer “resim” dosyaları olan metinleri veya PDF belgeleri ‘’ butonuna basarak programa çağırıyorsunuz. (Üst resim)  En soldaki sütunda bunları thumbnail (tırnak resim) olarak görebilirsiniz. (Alt resim) Belgeleri fare ile tutup bu alana sürükleyerek de çağırabilirsiniz. Veya  görüntü dosyasını sağ tıklatın ve ardından kısayol menüsünde ‘ABBYY FineReader ile aç‘ı seçin. Resimleri çağırırken bir taraftan analiz ettiği için gelmeleri kısa da olsa zaman alabilir. Birden fazla resmi aynı anda açabilirsiniz.

Fine Reader 10’u yüklerken birden çok dil seçmiş iseniz ‘Belge Dili’nin Türkçe’de duruyor olmasına dikkat etmelisiniz.

.

.

Ben eski Chip dergilerinden gelişigüzel bir sayfa taradım ve açtım. Soldaki pencerede resmin analiz edilmiş halini, sağda ise okutulmuş ve metne çevrilmiş halini görüyoruz. Pencerelerin altındaki (+) işaretli düğmeleri kullanarak o penceredeki görüntüyü büyütebilirsiniz.

.

Büyütmek için tıklayınız

.

Üst menüdeki ‘Tam kopya’ yazan açılır menüdeki dört ayrı seçeneği sırasıyla tercih edin ve metin olarak alacağınız çıktının nasıl değişik versiyonları olabileceğini görün. Bizim için aralarında büyük fark bulunmasa da kopyala / yapıştır yapmak için ‘Düz metin’ daha iyi.

.

.

Bu aşamada benim programla işim bitiyor. Belgenin “okunmuş” halini (sağ penceredeki metni) fare ile tarayıp seçtikten sonra klavyeden ‘Ctrl+C’ ile ( Yani Ctrl ve C tuşlarına aynı anda basarak)  kopyalıyor ve açtığım boş bir Word belgesine bu kez ‘Ctrl + V’ ile yapıştırıyorum. Belki bir iki biçim ayarı yaptıktan sonra burada (yani programın dışında) kaydediyorum.

Programın kendi içinden de çıktıyı otomatikman bir Word belgesine göndermek, işlemek ve kaydetmek mümkün ama o zaman 50 kayıt sınırından harcıyor ve belki fark etmeden 15 günden önce deneme sürümünü kilitlemek zorunda kalabiliyoruz.

.

.

Bu çalışmada tek bir yanlışlık bile bulamadım. Yegane sorun, orijinal metinde, satır sonlarındaki kelimelerin kesme işareti ile ikiye ayrılmış olabilmeleriydi. Program, doğal olarak, aynı şekilde, ortasında bir kesme işareti ile okumak zorunda kalmıştı. Bir tek bunları düzeltmem gerekecekti.

İşte yazıya çevrilmiş metindeki başarıyı görüyorsunuz.

.

.

Püf Noktaları.

Görsel belgelerin dijitale çevrilmesi sırasında en önemli konu resmin kalitesinin ve çözünürlüğünün uygun olmasıdır. Aşağıda verilen değerlerin dışına çıkılması halinde -OCR programının yeteneği paralelinde- hata oranı artabilecektir.

Aslında çaresiz değiliz. Bir resimdeki olası tüm hataların program içinden tek tek düzeltilmesi mümkün. Abbyy Fine Reader hepsi için etkili birer tamir aracı oluşturmuş fakat bunların çoğuna girmeyeceğiz. Bazı noktalara dikkat edersek zaten gerek de kalmayacaktır. Şöyle ki;

.

Resimlerde

Taranmış belgeler için çözünürlüğün 200-600 dpi arasında olması isteniyor. Tarama ayarları arasında mutlaka “çözünürlük” de bulunacaktır. Buradan en ideal değer olan 300 dpi çözünürlüğünü seçmelisiniz.

Arka planda karmaşık renkli fonlar yoksa siyah-beyaz tarama yapmak daha iyidir.

Tarayıcı yüzeyi temiz olsun.

Arka yüzeyinde de yazılar olan ince bir gazete sayfası tarayacaksanız sayfanın arkasına boş bir beyaz kağıt yerleştirerek tarayın.

Bir de belgeyi eğri taramayın.

.

Fotoğraflarda

Belgenin fotoğrafını çekip bilgisayara aktaracaksanız çekimde en az 2, en uygun 5 megapixel veya üzerinde değerleri kullanın.

90 derece açıyla çekim yaparak belgenin düz çıkmasına ve parlaklığın her yerinde yakın değerde olmasına özen gösterin.

Abbyy FineReader söz konusu olduğunda cep telefonunuzun fotoğraf çekme işlevini bile kullanabileceğinizi düşünüyorum. Yazılımın kalite farkı da buralardan belli oluyor.

.

PDF Belgelerinde

PDF dosyasını siz hazırlamamış olduğunuz için zaten eldeki ile yetineceksiniz.

ABBYY FineReader‘da ‘ı tıklatın veya ‘Dosya / PDF Dosyasını / Görüntüsünü Aç‘ öğesini seçin.

.

Bazı Sorunları Giderme

Bir kitabın yan yana sayfalarını taradığınızda, her iki sayfa da aynı görüntüde çıkar. OCR kalitesini artırmak için yan yana sayfaları iki ayrı görüntüye bölmeniz gerekir. Bunun için yardım metni şöyle diyor:

Görüntüyü Düzenle iletişim kutusunu açın (Sayfa>Sayfa Görüntüsünü Düzenle…); Görüntünüzü bölmek için Böl menüsünde bulunan seçenekleri ve düğmeleri kullanın.

Çok kalın kitapları tararken, (fotoğrafını çekerken de) cilde yakın kısımlardaki eğrilme nedeniyle metin bozulabilir. Bu sorun için de şu öneriliyor:

Görüntü eğriliğini düzeltmek için aşağıdakileri yapın:
Sayfa>Sayfa Görüntüsünü Düzenle… öğesini seçin.
Eğriliği Gider ve Düzelt öğesini ve ardından Metin Çizgilerini Düzelt öğesini tıklatın. (Metin çizgilerinin düzeltilmesi biraz zaman alabilir.)

.

FineReader ile Capture

Başlat / Tüm Programlar / Abby Fine Reader 10’ yolunu izlerseniz programın beraberinde bir de görüntü yakalama (capture) işlevi getirdiğini göreceksiniz. “Kopyala / yapıştır” izni vermeyen metinler veya sitelerden görüntüyü capture’layarak da yazılabilir metinlere ulaşmak mümkün. Programcığın adı ABBY Screenshot Reader. Kullanımı çok basit. (Capture konusu hakkında daha fazla bilgi için şu yazıya bakınız)

.

.

.

ABYY Fine Reader 10 gerçekten işinin ehli bir program fakat kişisel kullanım için her zaman çok pahalı olmuştur. Türk dağıtıcısının sitesinde tüm ürünlerde fiyat için “firmayı arayınız” ibaresi var. Kendi sitesinden indirmek yoluyla satın almak istediğinizde Profesyonel Edition 199, Corporate Edition 399 USD görünüyor. Mac versiyonu (Express) ise 99 USD

.

Sonraki Yazıda…

Serinin son yazısında Windows ile birlikte gelen ama çoğumuzun varlığından haberi olmadığı OCR alternatifi ile diğer ücretsiz yazılımlardan ve herhangi bir yazılım kurmayı gerektirmeden, bu hizmeti internet üzerinden online vermekte olan sitelerden kısaca bahsedeceğiz.

Wall Street Institute

20 Comments

  1. kayik.net diyor ki:

    Sitenizdeki yazıları okudum, çok beğendim. Merakla okumaya devam edeceğim

  2. EREN diyor ki:

    Slm. Ben programı yükledm açıldı ama dilini Türkçe’ye çeviremiyorum. Tarif ettiğiniz gbi yükledm ama dil İngilizce’den başka gelmiyor. Nasıl Türkçe’ye çavirebilirim?

  3. admin diyor ki:

    Eren Bey Merhaba. Yazılımın kurulumunu bir önceki makalede anlattığımız şekilde yaptınız mı ? Buradaki yazı: http://www.egiticininegitimi.net/2010/08/24/ocr-resimlerdeki-metinlerden-islenebilir-yazilara-hizli-donusum/ Olmazsa kaldırıp buradaki adımlara uyarak tekrar kurun. Bir de siz hangi sürümü kurduğunuzu söyleyebilir misiniz ? Belki yeni sürümü çıkmıştır ve farklıdır. Öyle ise ben kontrol eder yardımcı olurum.

  4. EREN diyor ki:

    Abbyy Fine Reader 10 u yükledm ama ing. oluyor dili

  5. EREN diyor ki:

    Ayrıca gönderdiğiniz linkteki adımlara göre yükledm zaten

  6. admin diyor ki:

    Yazdıklarınız elimi kolumu bağlıyor. Böyle zamanlarda genellikle çok basit bir hata söz konusudur ama onun nerede olduğunu buradan bilemiyorum doğrusu. Programı ilk açtığınızda yukarıdaki dil seçeneği menüsünde Türkçe hiç görünmüyor mu ? Görünüyorsu, işleme başlamadan önce bunu seçmiş olun.

  7. EREN diyor ki:

    Hayır hiç görünmüyor ve sadece Türkçe değil İngilizce dışında hiç bir dil yok.

  8. admin diyor ki:

    Sanırım yüklemeyle ilgili yazımızdaki üstten altıncı resmin altındaki açıklamada işaret edilen aşamayı yerine getirmemişsiniz. Hani “Şimdi Türkçe‘yi (Belki bir de İngilizce’yi ve istediğiniz başka diller varsa onarlı da) yeniden aktifleştireceğiz…” diye başlayan bölüm. Tekrar kurmalı ve buna dikkat etmelisiniz. Veya bu kurulumda dil ayarlarıyla hiç oynamayın ve bütün diller kurulmuş olsun. Bu kez programın içinden dil seçerken daha kalabalık bir liste içinde Türkçeyi bulmaktan başka sıkıntımız olmaz. Varsın o kadar olsun. Ha bir de bilgisayarınızda biraz daha fazla yer kaplayacaktır.

  9. masallar diyor ki:

    Elimde birsürü masal kitabı ve hikaye kitabı var. Onları yazmaya üsenıyordum umarım bu program sayesınde yazma ısınden kurtulacagım. Emegınıze sağlık, tesekkur ederim…

  10. admin diyor ki:

    Çok işinize yarayacak. İlginiz için biz teşekkür ederiz.

  11. ali diyor ki:

    ben abbyy fine reader 10 kullanıyorum bir türkçe el yazısı içeren pdf dosyasını açtığım zaman ‘ görüntü ‘ alanında herşey normal ama ‘ metin ‘ alanında el yazılarının olduğu bölümde garip şekil ve yazılara yer veriyor bunu otomatik düzeltebilirmiyim yada pdf dosyasını olduğu gibi dönüştürebilirmiyim lüften yardım.

    ŞİMDİDEN TEŞEKKÜRLER…

  12. admin diyor ki:

    Ali Bey, dönüştürülecek dil olarak Türkçe’ye ayarlı değil mi? El yazısı olması dolayısıyla da sorun çıkması çok mümkün.
    Hepsini birden okutmaya gelince… Ben hala 7 sürümünü kullanıyorum ama 10’da da değişiklik olacağını sanmıyorum. Soldan ilk düğme “Aç ve Oku” (Open and Read) düğmesine basarak çağıracağınız resim veya PDF gibi bir dokümanın tümü birden dönüştürülüyor.

  13. baran diyor ki:

    ben abbyy fine reader 10 full sürüm yükledim ama çince belgeyi yazıya çeviremiyor. Resim çözünürlüğünü artırın gibi bir şey diyor.Nasıl yapılacağını bilmiyorum.yardım edermisiniz.şimdiden teşekkürler.

  14. admin diyor ki:

    OCR programları küçük ve bulanık yazıları okuyabilmekte doğal olarak zorlanırlar. Bu nedenle hemen hepsinde ortak bir özellik olarak en az 300 dpi çözünürlük isterler. (Çoğu kez 200 dpi’larda da çalışmayı kabul edebilirler) Bu terim resmin yeterince büyük ve hatlarının yeterince keskin olmasıyla ilgilidir. Bulabiliyorsanız kullandığınız resmin orijinalini veya büyüğünü bulun. Eğer siz tarayıcı ile taradıysanız, yeniden tarayın ve ayarını 300 dpi’a getirin. (Menüde mutlaka bu ayar vardır) Son ihtimal Photoshop’ta açın, başlığına sağ tıkladıktan sonra “çözünürlük ayarlarına” gidin ve dpi değerini 300’e getirdikten sonra kaydedip çıkın ve bu halini deneyin ama bu yöntemde suni bir büyütme söz konusu olacağı için bir garanti yoktur.

  15. şule diyor ki:

    42 sayfa bir çıktım var. Bunu scan edip bilgisayara attığımda word dosyası yapabilirmiyim nasıl yapabilirim ?şimdiden teşekkürler…

  16. admin diyor ki:

    Şule Hanım, elbette Word dokümanı haline getirebiliyorsunuz. Ayrıntılar bu yazı serimizde anlattığımız gibi ve çok kolay aslında. Eğer yazılarda anlaşılmadık bir ayrıntı olursa sorarsanız yardımcı olmaya çalışırız.

  17. yusuf diyor ki:

    Merhaba,

    arannis sayfalari aranabilir ebook ABBYY le yapabilirmiyim ?

    Beni bilgilendirirseniz memnun olurum !

  18. admin diyor ki:

    Yusuf Bey, Merhaba. Abby Fine Reader ile resim halindeki metinleri bilgisayarda işlenebilir metinler haline getirebiliriz. Bu metni daha sonra istediğimiz formatta (Word, PDF gibi) kullanmak bizim elimizde ama doğrudan bir e-book hazırlama yazılımı değildir. Bu konuda şu bağlantıdaki diğer yazılarımıza göz atabilirsiniz.
    http://www.egiticininegitimi.net/?s=flipping
    Eğer MAC kullanıcısıysanız, şu yazıdaki iBooks Author yazılımını incelemenizi de öneririz:
    http://www.egiticininegitimi.net/2012/02/25/egitim-bilisim-ataklari-ve-turkiye-apple-ornegi/

  19. Abdullah Can diyor ki:

    Merhaba, benim bir adet pdf dosyam var ve bu pdf bir resim ve metinden olusuyor. Resimli ve imzalı bir pdf oldugundan sadece tek bir harf hatasını değiştirip yeniden farklı kaydetmek istiyorum. Yan tarafta dediginiz gibi metini okuyor ancak ben metni değiştirdigimde -yanlıs olan kısmı- düzeltilmiş haliyle pdfyi kaydedemiyorum.

    Yardımcı olursanız çok sevinirim, ne yapmalıyım?

    KOlay gelsin.

  20. admin diyor ki:

    Abdullah Bey, öncelikle Adobe Reader’ın son sürümünü kullandığınızdan emin olun çünkü yazılım artık PDF metinlerin içeriğini ulaşılmaz tutmaktan vazgeçmiş durumda. Yani metni yazıya çevirmek için OCR yazılımlarında işlemeniz gerekmiyor. Bence metni Adobe Reader’da seçerek kopyalayın, bir Word sayfasına yapıştırın (resmi de öyle) sonra bunu Word’ün “farklı kaydet” seçenekleri arasındaki PDF türünü kullanarak yeniden oluşturun. PDF’ler konusunda çok tecrübeli olduğumuz söylenemez belki daha pratik yolu da vardır.

Yorum, Katkı ve Sorularınız