распознать текст с картинки

Распознать текст с картинки

Распространенная ситуация – Вы получаете фотографию страницы книги или журнала, снимок экрана, на которой присутствует текст, нужный Вам для работы. Можно, разумеется, просто перепечатать посимвольно текст с картинки, но если картинок 100 и времени нет? В данном случае проще распознать текст с картинки.

OCR или в переводе оптическое распознавание текста давно и успешно используется в офисной, образовательной и полиграфической сфере деятельности. По сути, это преобразование графической информации в символьную с учетом языка распознания. Очень хорошо распознаются страницы, заполненные только текстом, довольно неплохо распознаются смешанные таблицы, плохо поддаются распознанию страницы с формулами или, к примеру, интегрально-дифференциальными выражениями. В целях экономии времени некоторые места распознанного текста проще перепечатать руками, чем разбираться в том абсурде, который выдала программа OCR.

Все программы OCR работают по одному алгоритму:

  1. Загрузка изображения или сканирования непосредственно из программы
  2. Анализ изображения, разделяя по типу блоков на изображении (текст, таблица, картинка)
  3. Распознание символьной информации
  4. Вывод результатов

Простой способ для рядового пользователя – это распознать текст с картинки онлайн. Существует множество бесплатных, условно-бесплатных ресурсов, которые специализируются на распознании текста с изображения, который загружаются пользователем. Одну страницу текста Вы получите быстро, просто и без всякой регистрации. Для зарегистрированных пользователей открываются новые горизонты такие, как работа с многостраничными файлами PDF, обработка больших изображений, использование архиваторов, вывод текста в распространенном формате для дальнейшего редактирования. Для примера рассмотрим ресурс onlineocr.net. Все предельно просто – загрузили картинку, выбрали язык и формат выходного файла, получили файл Microsoft Word, в котором бесплатный сервис по мере сил распознал Ваш текст.

Сложный (и очень даже платный!) вариант для рядового (и не только) пользователя – это специализированный комплекс OCR, созданный специально для работы по распознанию текста. Для примера рассмотрим широко известный продукт ABBY Fine Reader. Принцип работы ПО, разумеется, тот же – загрузка, анализ, распознание. Деньги компании-разработчику платятся за комфорт и возможности. Тут и прямая работа со сканерами с широким выбором настроек, и большое количество встроенных языков распознания, и скорость распознания текста, и теснейшая интеграция с офисным пакетом (одной кнопкой можно распознать текст с картинки в ворд), но за это надо платить. Есть онлайн сервис от этой же компании, где тоже можно распознать текст с картинки онлайн в ворд.


В завершении нельзя не упомянуть, как вариант, всем известный OneNote, который тоже умеет распознавать текст, пусть это и не является его прямой работой.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *