Программы оптического распознавания текста
После создания сканеров,
позволяющих делать графические копии изображений и текстов, возникла
идея создать программы, которые могли бы распознать текстовые символы и
преобразовать графическое изображение текста в текстовый формат, при
котором текст можно редактировать.
Такие программы появились сначала в США, а затем, и в России.
По-английски программы распознавания текста называются OCR - optical
character recognition (оптическое распознавание символов).
Первой популярной американской программой распознавания текста была
Cuneiform. Этой программой комплектуются сканеры многих производителей.
Российская компания ABBYY Software House выпустила программу
FineReader, которая стала популярной как в России, так и в других
странах.
Программы распознавания текста позволяют перевести в текстовый вид
копии очень сложных по структуре текстовых документов, включая таблицы,
формы, диаграммы, рисунки. После распознавания и перевода копии в
текстовый вид программы сохраняют расположение текста на странице,
шрифт, размер и цвет шрифта. Для уменьшения возможных ошибок
распознавания символов, программы проверяют орфографию текста.
После распознавания текст может быть сохранен в виде файла в любом
текстовом формате, а также в форматах электронных таблиц и баз данных.
Программа распознования текста FineReader
Программа распознования текста Cuneiform
|