Главная » Компьютерное » Как распознать текст с картинки

Как распознать текст с картинки

[sc name=»ads3″]

Приветствую вас, читателей блога 3kit.net! Уверен, люди, которым приходиться постоянно работать с компьютером, сталкивались с такой ситуацией, когда нужно быстро и надежно перенести текст с бумажного носителя в текстовый электронный вариант. Это может быть страница книги, фотография, pdf-книга, реферат или еще что-то.

Так же хочется обратить внимание не только сайтостроителей, но и обычных строителей, на то, что в настоящий момент сетка кладочная приобретается на сайте promsnab.org по очень выгодным ценам и лучшего качества от производителя. Данный сайт часто попадается мне и уже успел набрать много положительных отзывов в сети.

Как известно, сканированный документ представляет собой картинку, не говоря уже про фотоснимок страницы, а нам нужен простой текс, который можно без ограничений редактировать. Для этих целей было выпущено много программных решений, как online распознания текста та и offline.

Самые эффективные показатели, на мое мнение, показывает компания ABBYY, продуктами которой я и советую пользоваться. В соответствие ваших возможностей и предпочтений вы можете выбрать:

[sc name=»ads2″]
  1. Онлайн сервис ABBYY FineReader Online, который позволяет  распознать текст с картинки бесплатно, но не более 10 страниц.
  2. Программа ABBYY FineReader, которая производит чтение текста с картинки или pdf-файла.

А теперь давайте ознакомимся с этими двумя продуктами на практике и сделаем небольшие выводы. Для начала я отсканирую и сфотографирую одну и ту же страницу, а затем попытаюсь преобразовать картинку в текст.

Сразу стоит сказать, что программа распознать текст с картинки не сможет, если вы будете загружать рукописные материалы. Так же вы убедитесь, что считать текст с картинки не составляет абсолютно никакого труда.

ABBYY FineReader Online.

Заходим на главную страницу сайта и нажимаю на зеленую кнопку с текстом Начать Распознавание.

На первом этапе необходимо выбрать файлы для обработки на вашем компьютере. Для этого кликаем по Загрузить файлы и выбираем необходимые материалы, ждем, пока они загрузятся на сервер.

После этого указываем язык текста, если на странице присутствует несколько языков, то для более качественной обработки нужно указать все дополнительные языки.

Третьим шагом будет выбор формата документа, который вы хотите получить после того, как программа копировать текст с картинки. Я ничего не изменял в этом параметре и оставил .docx.

Так же присутствует еще парочка возможностей, а именно сохранение результата в ваше хранилище и помещение итогового текста и один файл.

2015-01-08_214003

После того, как вы выполнили все необходимые пункты, можно смело жать кнопку Распознать. Ждем какое-то время, как правило, 10-30 секунд и получаем результат.

Онлайн сервис распознал более качественно тот вид файла, где я сделал снимок на смартфон (8 Мп). А вот сканированную страницу было распознано с небольшими погрешностями. В итоге, страницу с 2494 символами в виде фотографии сервис распознал просто идеально, с сохранением таблиц и колонок, а сканированный документ дал 3 ошибки, которые были связанны с сочетанием латинских и кириллических букв.

ABBYY FineReader (Программа)

[sc name=»ads1″]

Стоимость программы довольно таки большая, я даже сомневаюсь, что кто-то ее купить (среди читателей), а как всегда найдет другой источник. У мене программа лицензирована, но мне она досталась почти даром, так как шла в наборе к моему сканеру.

На официальном сайте ознакомительный вариант программы можно скачать бесплатно на 15 дней.

И так, вы уже достали программу и установили ее на свой компьютер… значит можно переходить, непосредственно, к самому процессу распознания текста.

Добавить необходимые файлы можно по старинке — перетаскиванием, либо через вкладку Файл — Открыть PDFили изображение… либо нажатием кнопок Ctrl+O.

2015-01-08_21590922После выбора файлов программа начнем сразу же распознавать текст. В случае, когда распознано некачественно (не был автоматически подобран язык и другие параметры), вы можете указать их вручную, а затем нажать на копку Распознать.

2015-01-08_220119

После обработки изображений программой, я получил точно такие же результаты.

Вывод: разницы в качестве распознания, тем более значительной, быть не может. И я это говорю не основываясь на свой примитивный эксперимент, а на официальные данные компании. В обеих продуктах используются все те же методы и инструменты, разница только в том, что в первом варианте мы использовали программу на компьютере компании, а во втором – на своем ПК.

Каждый вариант имеет свои плюсы. Онлайн сервис выгоден тем, что людям, работающим с компьютером дома, на работе, в друзей и т.д., не будет надобности искать и везде устанавливать программу. В то же время, онлайн вариант дает возможность распознать бесплатно только 10 страниц, разумеется, что с каждого ПК по 10. Но если таких страниц много, скажем, целя книга, то будет эффективнее установить полноценную программу.

3 комментария

  1. Ирина

    Для меня такой проверки обычно недостаточно в особенности если в тексте много научных или технических терминов, профессионального жаргона и тому подобной несловарности. Надо еще пройтись по распознанному вручную внимательно просмотреть его на ошибки и непонятные символы.

  2. Аристарх

    Не распознает, выдает ошибку.( Документ распознан с ошибками. Страницы не списаны.)
    ХЕРНЯ распозновалка!!

    • может у вас низкое качество картинки? Или язык выбран некорректно. Как правило сервисы работают стабильно и распознают текст, допуская максимум 2-3 ошибки.

Оставить комментарий

Ваш email нигде не будет показанОбязательные для заполнения поля помечены *

*

x

Посмотрите

Как восстановить удаленные файлы в Windows

[sc name=»ads1″] Здравствуйте, друзья. На днях я по неосторожности удалил важную для меня папку с ...