Распознавание текста, иначе именуемое оптическим распознаванием символов (OCR от англ. Optic Character Recognition) уже давно применяется для конвертации книг и документов в электронный вид. Существуют сегодня самые разные методы OCR, используемые в настольных приложениях или же в веб-сервисах.
Алгоритмы для распознавания текста очень сложны, их разработка требует от специалистов немалого количества сил и времени. Поэтому в основной своей массе решения для OCR, в том числе и онлайн-решения, являются платными. Как правило, такие решения имеют внушительный функционал и высокую точность распознавания, поэтому многие пользователи готовы платить, чтобы получать наилучшие результаты.
Если для вас распознавание текста не является рутинной задачей, а требуется лишь время от времени, вы можете сэкономить, выбрав пусть не слишком функциональные, но зато бесплатные онлайн-сервисы для OCR. Тем более, что точностью распознавания они могут похвастаться не хуже, чем у платных аналогов. Предлагаем рассмотреть парочку популярных сервисов для бесплатного распознавания текста онлайн.
i2OCR (i2ocr.com)
Разработчики этого бесплатного сервиса i2OCR с англоязычным интерфейсом обещают пользователям немало интересного. Например, сервис поддерживает работу с более чем 60 языками, включая русский, а также работу с достаточно большим количеством популярных форматов изображений (JPG, PNG, BMP, TIF, PBM, PGM, PPM) и несколькими вариантами готовых текстов (TXT, DOC, DOCX, PDF).
Интересной особенностью i2OCR является возможность распознавания текстов в несколько колонок. А еще сервис поддерживает несколько вариантов загрузки на выбор (по URL, с локального диска), последующее редактирование распознанного текста в режиме онлайн в Google Docs и онлайн-перевод текста с помощью Bing.
Для использования сервиса достаточно выбрать желаемый язык, загрузить с компьютера распознаваемое изображение или указать URL-адрес, ввести CAPCHA и нажать кнопку Extract Text. Спустя несколько минут вы уже можете видеть распознанный текст. Что интересно, и готовый текст, и оригинальный файл располагаются в окне сервиса рядом — чтобы пользователи могли сравнить оба варианта.
Free Online OCR (newocr.com)
Данный бесплатный сервис распознавания текстов онлайн не требует регистрации. Он поддерживает работу с 75 языками и шрифтами, предлагает неограниченную загрузку и при необходимости может повернуть исходное изображение на 90° или на 180°. Весомыми преимуществами данного сервиса выступают функция мультиязычного распознавания и функция распознавания математических уравнений. Кроме того, сервис может похвастаться поддержкой изображений даже с самым низким разрешением, включая и плохо отсканированные документы.
В качестве входных форматов в сервисе Free Online OCR поддерживаются файлы изображений, такие как JPEG, JFIF, PNG, GIF, BMP, PBM, PGM, PPM, PCX, сжатые файлы (Unix compress, bzip2, bzip, gzip), многостраничные документы вроде TIFF, PDF и DjVu, а также файлы документов в форматах DOCX и ODT с изображениями. Кроме прочего, поддерживается еще и работа с ZIP-архивами, содержащими сразу несколько изображений.
После распознавания при помощи Free Online OCR вы можете сохранить готовый текст в обычном текстовом документе формата TXT, в документе Microsoft Word (DOC) или же в файле Adobe Acrobat (PDF). Также вы можете сразу же перейти к редактированию документа в Google Docs, онлайн-переводу в Google Translate или Bing или онлайн-публикации (Pastie.com or Pastebin.com).