Секреты сканирования на ПК
Добавить в закладки К обложке
- Часть 1.Сканирование и распознавание - Страница 1
- Глава 2.Ручные сканеры - Страница 2
- Глава 3.Листовые сканеры - Страница 3
- Глава 4.Планшетные сканеры - Страница 4
- Глава 5.Слайд-сканеры - Страница 6
- Глава 6.Барабанные сканеры - Страница 7
- Глава 7.Цветное сканирование - Страница 8
- Глава 8.Параметры сканеров - Страница 9
- Глава 9.Глубина цвета - Страница 10
- Глава 10.Размер области процесса сканирования - Страница 11
- Глава 11.Скорость процесса сканирования - Страница 12
- Глава 12.Способ подключения - Страница 13
- Глава 13.Драйверы - Страница 14
- Глава 14.Домашний сканер - Страница 15
- Глава 15.Как осуществляется сканирование в программе Adobe Photoshop TWAIN - Страница 16
- Глава 16.OCR — системы - Страница 18
- Глава 17.Сканирование - Страница 19
- Глава 18.Обработка - Страница 20
- Глава 19.Системы распознавания текстов в офисе - Страница 21
- Глава 20.Программа ABBYY FineReader - Страница 22
- Глава 21.Омнифонтовая OCR-система - Страница 25
- Глава 22.Установка программы - Страница 26
- Глава 23.Запуск программы - Страница 28
- Глава 24.Распознавание в программе FineReader - Страница 29
- Глава 25.Пакет - Страница 30
- Глава 26.Крупный план - Страница 33
- Глава 27.Клавиатурные эквиваленты для работы с окнами - Страница 34
- Глава 28.Сканирование TWAIN-интерфейс - Страница 35
- Глава 29.Процесс сканирования и распознавания печатного материала - Страница 37
- Глава 30.Сканирование многостраничных документов - Страница 39
- Глава 31.Блоки - Страница 43
- Глава 32.Распознавание - Страница 47
- Глава 33.Как обучить FineReader - Страница 49
- Глава 34.Как проверить и отредактировать распознанный текст - Страница 53
- Глава 35.Редактирование текста - Страница 56
- Глава 36.Редактирование таблиц - Страница 58
- Глава 37.Экспорт результатов распознавания во внешние приложения - Страница 59
- Глава 38.Описания основных команд меню - Страница 62
- Часть 2.Тонкости и хитрости - Страница 66
- Глава 2.Обработка сканированных изображений для использования в различных системах САПР и ГИС - Страница 69
- Глава 3.Обработка сканированных изображений для использования в различных ГИС - Страница 72
- Глава 4.Цветопередача - Страница 75
- Глава 5.Использование цифровых камер - Страница 77
- Глава 6.Лазерные принтеры и сканеры - Страница 80
- Глава 7.Словарь - Страница 84
- Б - Страница 85
- В - Страница 86
- Г - Страница 87
- Д - Страница 88
- 3 - Страница 89
- И - Страница 90
- К - Страница 91
- Л - Страница 92
- М - Страница 93
- Н - Страница 94
- О - Страница 95
- П - Страница 96
- Р - Страница 97
- С - Страница 98
- Т - Страница 99
- У - Страница 100
- Ф - Страница 101
- Ш - Страница 102
- Э - Страница 103
- Я - Страница 104
Глава 20.Программа ABBYY FineReader
С появлением компьютеров человека увлекла идея научить машины мыслить так же, как это делает он сам. Такую гипотетическую возможность компьютеров предаваться размышлениям окрестили «искусственным интеллектом». С тех пор этот термин прочно укоренился в лексике околокомпьютерных кругов. Но теперь под «искусственным интеллектом» стали понимать, пожалуй, не способность машины мыслить аналогично человеку, а, скорее, технологии, которые позволяют решать неформализованные нетривиальные задачи, в которых не существует однозначно определяемого алгоритма решения. При создании программ, способных решать такие задачи, делается попытка смоделировать рассуждения человека в подобных ситуациях, поэтому термин «искусственный интеллект» пришелся здесь весьма кстати, хотя и потерял в некоторой степени свое первоначальное значение. В реальности, большинство «жизненных» задач не имеют четкого алгоритма решения, поэтому трудно поддаются формализации. Особенно хорошо это заметно в области лингвистики и работы с речью, как устной, так и письменной. Такова, например, проблема машинного перевода. Не раз, наверно, приходилось улыбаться, глядя на результаты работы программы-переводчика. Действительно, нелегко создать программу, которая могла бы сделать осмысленный перевод с учетом всех тонкостей и особенностей живого языка. Не менее сложна и задача распознавания изображений, в частности текстов. Заманчиво заставить машину понять, что за текст мы предлагаем ее вниманию. При всей сложности этой задачи, сегодня в этом направлении достигнуты хорошие результаты.
Первые шаги в этой области были предприняты еще в конце 50-х годов. Принципы распознавания, заложенные тогда, и сегодня еще используются в большинстве систем OCR (Optical Character Recognition). Традиционный подход к проблеме распознавания заключается в сведении задачи распознавания к задаче классификации некоторого набора признаков. Идея проста: по изображению определяется некоторый набор признаков, который сравнивается с каждым из имеющихся образцов, так называемых эталонов. По результатам сравнения находится эталон, с которым этот набор признаков совпадает лучше всего, и изображение относится к соответствующему классу. То есть все решение заключается в сравнении предлагаемого изображения с образцами и выборе наиболее подходящего, иначе говоря, производится некий перебор возможных вариантов. Такой подход по сути своей не позволяет добиться по-настоящему высокого качества распознавания, как бы он не был усовершенствован. Главный его недостаток заключается в том, что в любом случае в наборе признаков содержится не вся информация об изображении, иными словами, эталонов заложить в программу можно много, но не бесконечное число, а вот вариантов изображения того или иного символа может быть бесчисленное количество. Поэтому, как только система сталкивается с нестандартным написанием буквы или цифры, она дает сбой: либо не может распознать вообще, либо распознает неправильно.
Альтернативой традиционному шаблонному методу распознавания стало распознавание на основе принципов Целостности, Целенаправленности и Адаптивности.
Согласно принципу целостности, распознаваемый объект рассматривается как целое, состоящее из частей, связанных между собой пространственными отношениями.
Изображение интерпретируется как определенный объект, только если на нем присутствуют все структурные части этого объекта, и эти части находятся в соответствующих отношениях. Сами части получают интерпретацию только в составе гипотезы о предполагаемом объекте.
По принципу целенаправленности распознавание строится как процесс выдвижения и целенаправленной проверки гипотез о целом объекте. Источниками гипотез являются признаковые классификаторы и контекстная информация. Части картинки анализируются не априорно, а только в рамках выдвинутой гипотезы о целом. Традиционный подход, состоящий в интерпретации того, что наблюдается на изображении, заменяется подходом, состоящим в целенаправленном поиске того, что ожидается на изображении.
Принцип адаптивности подразумевает способность системы к самообучению.
Впервые эти принципы были применены на практике в системе распознавания «Графит», которая была разработана под руководством Александра Шамиса в конце 80-х годов. Это была система распознавания рукопечатных знаков.
На этих же принципах в 1993 году фирмой Bit Software (ныне компания ABBYY) была создана система распознавания печатного текста FineReader. В своей работе эта система использовала признаковый классификатор в сочетании с целенаправленной проверкой гипотез о распознаваемых словах по словарю.
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104