Memindai dan Mengubah Gambar menjadi Teks dengan OCR, Pengenalan Karakter Optik

2016-09-02 11:42:19
Utama·Perangkat lunak·Memindai dan Mengubah Gambar menjadi Teks dengan OCR, Pengenalan Karakter Optik

Bukan tidak pernah terjadi bahwa Anda mungkin menerima dokumen melalui email yang telah dikirim kepada Anda dalam bentuk gambar atau mungkin sebagai file PDF dan Anda harus dapat mengedit atau memiliki teks dalam bentuk yang dapat diedit. Kadang-kadang Anda mungkin harus memindai beberapa dokumen melalui pemindai dan harus dapat mengeditnya dari pengolah kata Anda.

Mengedit gambar atau memindai secara langsung dalam file tidak dimungkinkan dengan sendirinya, dan kecuali Anda punya waktu luang, Anda tidak akan ingin mengetikkan semuanya. Yang Anda butuhkan adalah sesuatu yang sudah ada sejak lama bernama Optical character recognition (OCR) yang menerjemahkan teks dalam gambar menjadi teks yang dapat Anda edit. Beberapa paket perangkat lunak OCR terbaik adalah Omnipage dan FineReader tetapi harganya sangat mahal. Berikut ini sebagian besar cara gratis untuk mengubah teks Anda menjadi bentuk yang dapat diedit. 1. FreeOCR

FreeOCR adalah program OCR berbasis pada mesin Tesseract open source yang dikelola oleh Google dan dianggap sangat akurat. Itu dapat menerima input langsung dari pemindai, file PDF dan beberapa jenis format gambar termasuk file TIFF multi halaman sambil mendukung konversi menggunakan 11 bahasa yang berbeda. Anda juga dapat memilih bagian spesifik dari dokumen input untuk konversi yang berguna untuk beberapa blok atau kolom teks dan hasilnya dapat diekspor langsung ke Word atau sebagai format teks kaya.

Perhatikan saat instalasi karena program menggunakan Install Manager untuk menawarkan Anda beberapa bit adware. FreeOCR bekerja pada Windows XP ke Windows 8, instal .NET Framework v2 diperlukan untuk pengguna XP. FreeOCR juga diizinkan untuk digunakan untuk penggunaan komersial maupun pribadi.

Unduh FreeOCR


2. SimpleOCR

Perangkat lunak SimpleOCR gratis untuk penggunaan pribadi, pendidikan dan komersial dan menerima input dari pemindai, JPG, BMP, dan beberapa gambar TIFF halaman. Teks yang dihasilkan dapat disimpan sebagai file teks standar atau dokumen Word. Setelah menginstal, ketika Anda menjalankan SimpleOCR untuk pertama kalinya pastikan untuk memilih opsi "Mesin Cetak" atas yang gratis, opsi bawah adalah demo 14 hari dari perangkat lunak yang lebih maju. Kemudian pilih 1 dari 4 bahasa untuk profil Anda dan klik Pilih.

Beberapa halaman dapat ditambahkan dengan mengklik tombol Tambah Halaman dan dikonversi menggunakan Konversi ke teks. Setelah pengenalan karakter selesai, teks yang dihasilkan akan ditampilkan di jendela bawah dengan kata-kata berwarna untuk memberi tahu Anda tentang kemungkinan masalah dengan ejaan. Biru adalah kata-kata yang dicurigai, merah adalah kata-kata yang tidak ditemukan dalam kamus program dll, dan masing-masing kata ini dapat diperiksa dengan daftar pilihan alternatif yang ditawarkan.

Unduh SimpleOCR


3. i2OCR

i2OCR adalah layanan konversi OCR online gratis dan tidak terbatas dari Sciweavers.org yang menerima input dari gambar format TIF, JPG, PNG, BMP, GIF, PBM, PGM, dan PPM. Ada dukungan untuk 33 bahasa besar dan meskipun ukuran file maksimum terbatas hingga 10MB, itu harus cukup untuk sebagian besar penggunaan umum.

Penggunaannya cukup sederhana, cukup pilih tombol untuk menelusuri file di komputer Anda, atau opsi URL dapat mengambil file langsung dari lokasi online seperti Dropbox dll. Pilih bahasa Anda dari drop down dan klik tombol besar untuk mengonversi file, waktu konversi hanya hitungan detik saat diuji. Akurasi konversi tampaknya sangat baik meskipun hanya teks biasa, dan akan muncul berdampingan dengan gambar asli lebih rendah di jendela yang kemudian Anda dapat mengklik untuk menyorot dan menyalin ke dokumen atau menyimpan langsung sebagai file Word .DOC . Sciweavers juga memiliki beberapa alat konversi format bermanfaat lainnya termasuk mengonversi file ke PDF.

Kunjungi i2OCR


4. OCR online

OCR Online Gratis memiliki layanan gratis dan berbayar, yang gratis memungkinkan Anda untuk mengonversi hingga 15 halaman per jam. Ini termasuk mengunggah dokumen JPG, BMP, TIF, PNG, PCX, GIF, dan multi-halaman PDF untuk diproses menjadi 1 dari 32 bahasa yang diakui dengan ukuran masing-masing hingga 4MB. Outputnya bisa berupa dokumen Word (DOC), Excel spreadsheet (XLS) atau file teks biasa (TXT).

Pilih file lokal Anda untuk diunggah, klik tombol Unggah, masukkan captcha bernomor dan atur bahasa yang Anda butuhkan dan format keluaran. Kemudian klik Kenali dan tunggu beberapa detik saat konversi. Teks yang dihasilkan akan muncul di bawahnya bersama dengan tombol untuk mengunduhnya sebagai format file yang dipilih.

Kunjungi OCR Online


5. OCR Online Gratis

Layanan online ini memiliki dukungan untuk mengunggah format gambar JPG, GIF, BMP, PNG, TIFF yang paling populer dan juga dukungan untuk konversi OCR dokumen PDF. Setelah konversi, teks yang dihasilkan juga dapat di-output ke beberapa format Word DOC, Richtext RTF, TXT polos, dan juga dokumen PDF berlapis. Program ini juga melakukan yang terbaik untuk menjaga tata letak dan pemformatan teks sedekat mungkin dengan salinan aslinya.

Untuk menggunakan layanan ini cukup pilih file Anda untuk diunggah dan pilih format apa yang Anda inginkan untuk disimpan, lalu klik tombol. Anda mendapatkan meteran kemajuan yang bagus untuk dilihat selama konversi dan tombol unduhan akan muncul setelah selesai. OCR Daring Gratis tampaknya berfungsi cukup baik dan mempertahankan ukuran dan pemformatan font di sebagian besar kasus. Layanan ini gratis untuk digunakan tetapi tidak disebutkan ukuran file atau batas penggunaan yang sedikit membingungkan karena kami tidak tahu apakah itu benar-benar tidak terbatas atau mereka hanya belum menyebutkan batasannya ...

Kunjungi OCR Online Gratis


6. NewOCR

Layanan OCR online gratis ini tentunya memiliki banyak dukungan format input. Ada 9 format gambar umum, dukungan untuk gambar di dalam arsip Zip, banyak dokumen halaman seperti PDF, TIFF dan DjVu, dan juga file DOCX dan ODT. Daftar output lebih kecil tetapi masih berguna dengan TXT, DOC dan penyimpanan file PDF tersedia. Pengakuan ditangani oleh mesin Tesseract dan Cuneiform dan dapat mengenali total 58 bahasa serta teks multi-kolom dan juga gambar berkualitas lebih rendah.

Untuk menggunakan NewOCR cukup pilih file lokal Anda atau satu langsung dari URL, pilih bahasa pengenalan dan kemudian tekan tombol Preview. Ini akan memuat halaman pratinjau dan di bawahnya, teks yang dikonversi OCR ditampilkan. Jika Anda tidak dapat melihat teksnya, tekan tombol biru OCR. Teks dapat diekspor dalam berbagai cara termasuk unduhan standar ke salah satu dari 3 format file, menyalin ke clipboard, meletakkannya melalui penerjemah Google atau Bing, menempelkan secara online ke Pastebin atau Pastie dan bahkan mengirim langsung ke Google Documents. NewOCR memiliki unggahan tanpa batas dan tidak memerlukan pendaftaran apa pun.

Kunjungi NewOCR


7. Pencitraan Dokumen Microsoft Office

Seperti yang kita ketahui, Microsoft Office bukan produk gratis tetapi sejumlah besar pengguna cenderung memasang semacam versi. Alat Pencitraan Dokumen Office dapat melakukan OCR pada dokumen dan hasilnya sangat bagus, tetapi sayangnya itu tidak tersedia di semua versi Office. Office 2003 seharusnya memasukkannya dalam instalasi Anda secara default, pengguna Office 2007 harus menambahkannya secara manual dari opsi add components, dan itu bahkan tidak ada di Office 2010 secara default. Petunjuk tentang cara menambahkan MODI ke Office 2010 dapat ditemukan di Microsoft.com.

Opsi Pencitraan Dokumen Microsoft Office dapat ditemukan di Start Menu Anda -> Program -> Microsoft Office -> Microsoft Office Tools. Ini hanya mengenali gambar TIFF sebagai sumber input sehingga Anda mungkin perlu mengonversi dokumen Anda sebelumnya. Buka file dan klik ikon mata di bilah alat yang disebut "Kenali Teks Menggunakan OCR". Kemudian klik tombol di sebelah kanannya untuk mengirim teks langsung ke Word.

Catatan Editor: OCROnline adalah layanan gratis lain yang diuji tetapi Anda hanya memiliki 5 konversi 1 halaman gratis seminggu yang agak terlalu ketat, dan Anda juga harus membuat akun. Kualitas konversi sangat baik meskipun jika Anda hanya perlu halaman aneh sekarang dan lagi.

Google Documents juga memiliki opsi untuk mengonversi file PDF dan gambar ke dokumen melalui OCR. Buka Google Drive Anda dan klik Opsi -> Pengaturan Unggah -> Konversi teks dari file PDF dan gambar yang diunggah, dan juga pilih opsi konfirmasi. Ini kemudian akan menanyakan apakah Anda ingin OCR gambar atau PDF saat Anda mengunggah file ke Google Drive.

Pilihan Editor