Microsoft Office
Добавить в закладки К обложке
- Предисловие - Страница 1
- ЛОГИЧЕСКАЯ СТРУКТУРА ЖЕСТКОГО ДИСКА - Страница 3
- Разделы и диски - Страница 4
- Кластеры и секторы - Страница 5
- Как хранится информация? - Страница 6
- Программы и их виды - Страница 10
- MICROSOFT WORD - Страница 15
- Интерфейс - Страница 16
- Интерфейс Microsoft Word - Страница 17
- Создаем и открываем документ - Страница 21
- Самые распространенные ошибки - Страница 22
- Форматирование текста - Страница 23
- Выделение участка текста - Страница 24
- Меняем шрифты - Страница 25
- Границы абзацев и выравнивание - Страница 26
- Работаем со стилями - Страница 27
- Оформление текста - Страница 28
- Картинки - Страница 29
- Надписи и заголовки - Страница 30
- Специальные символы - Страница 31
- Таблицы - Страница 32
- Разбивка на страницы и нумерация - Страница 33
- Работаем с автозаменой - Страница 34
- Проверка орфографии - Страница 35
- Защищаем текст от потери - Страница 36
- Сохраняем документ - Страница 37
- Горячие клавиши Microsoft Word - Страница 38
- Другие функциональные сочетания клавиш - Страница 39
- MICROSOFT EXCEL - Страница 40
- Кнопочная панель Excel - Страница 41
- Рабочее поле Excel - Страница 42
- Ячейки - Страница 43
- Столбцы и строки - Страница 46
- Листы и книги - Страница 47
- Формулы - Страница 48
- Функции - Страница 51
- Диаграммы - Страница 53
- Сортировка данных - Страница 56
- Форматирование таблиц - Страница 57
- Форматирование данных при помощи «Автоформата» - Страница 58
- Создание и изменение заголовка - Страница 59
- Установка размера столбца - Страница 60
- Сохранение данных в Excel - Страница 61
- Печать электронных таблиц и диаграмм - Страница 62
- Горячие клавиши Microsoft Excel - Страница 63
- MICROSOFT OUTLOOK - Страница 64
- Возможности Outlook - Страница 65
- Электронная почта - Страница 66
- Календарь - Страница 68
- Контакты - Страница 69
- Задачи - Страница 70
- Заметки - Страница 71
- Горячие клавиши Microsoft Outlook - Страница 72
- MICROSOFT PUBLISHER - Страница 73
- Выбор шаблона - Страница 74
- Заполнение личных данных - Страница 75
- Элементы макета - Страница 76
- Операции с объектами - Страница 77
- Добавление и удаление объектов - Страница 78
- Порядок расположения объектов - Страница 79
- Параметры макета - Страница 80
- Проверка и сохранение макета - Страница 81
- Горячие клавиши Microsoft Publisher - Страница 82
- MICROSOFT POWERPOINT - Страница 83
- Интерфейс PowerPoint - Страница 84
- Создание презентации - Страница 85
- Создание основного слайда - Страница 86
- Эффекты анимации - Страница 87
- Эффекты перехода между слайдами - Страница 88
- Звуковое сопровождение презентации - Страница 89
- Сохранение презентации - Страница 91
- Горячие клавиши PowerPoint - Страница 92
- MICROSOFT ACCESS - Страница 93
- Создаем базу данных - Страница 94
- Горячие клавиши Microsoft Access - Страница 96
- «РУССКИЙ ОФИС» – ПОЛЕЗНЫЕ ДОПОЛНЕНИЯ - Страница 97
- ОРФО – проверка орфографии - Страница 98
- FineReader – распознавание текста - Страница 99
- PROMT – перевод текста - Страница 101
- Яндекс. Поиск – быстрый поиск документов - Страница 103
- OpenOffice: бесплатная альтернатива - Страница 104
- Word Utilities - Страница 106
- FinePrint – оптимизатор печати - Страница 107
- Lingvo – электронный словарь - Страница 108
- Домашние финансы - Страница 109
FineReader – распознавание текста
Ввести со сканера текст в компьютер – задача не слишком трудная. Однако работать с таким текстом невозможно: как и любое сканированное изображение, страница с текстом представляет собой графический файл – обычную картинку. Отсюда возникают проблемы: во-первых, в графическом формате страница занимает слишком много места, и, скажем, отсканированная книга не на каждый жесткий диск поместится. И вторая, самая главная проблема: сканированный текст можно будет только читать, но не редактировать и не вставлять его фрагменты в создаваемый вами документ. Ведь сам сканер распознавать буквы именно как буквы не умеет: они для него – всего лишь пятна и точки черного цвета.
К счастью, на свете существуют программы, способные перевести сканированный текст из графического в текстовый формат – программы распознавания текста или OCR.
Современная OCR должна уметь многое: распознавать тексты, набранные не только определенными шрифтами (именно так работали распознавалки первого поколения), но и самыми экзотическими, вплоть до рукописных. Уметь корректно работать с текстами, содержащими слова на нескольких языках, корректно распознавать таблицы. И самое главное – корректно распознавать не только четко набранные тексты, но и такие, качество которых, мягко говоря, далеко от идеала. Например, текст с пожелтевшей газетной вырезки или третьей машинописной копии. Само собой, распознать текст – это еще полдела. Не менее важно обеспечить возможность сохранения результата в файле популярного текстового (или табличного) формата – скажем, формата Microsoft Word или Excel.
Как видим, для того чтобы получить электронную, готовую к редактированию копию любого печатного текста, программе OCR необходимо выполнить «цепочку» из множества отдельных операций:
Сканирование. За эту работу отвечает, собственно, не программа OCR, а встроенное в систему программное обеспечение вашего сканера. Именно с его помощью вы можете задать нужные вам параметры сканирования – например, разрешение (рекомендуется 300 dpi), цветовой режим (для простых текстов достаточно черно-белого или LineArt) – и выделить ту область документа, которую вам необходимо «скопировать» в компьютер.
Сегментация. Полученную со сканера «картинку» подхватывает OCR-программа. Но до распознавания еще далеко – сначала надо отделить текстовые элементы от графики, да и текст в ряде случаев разбить на отдельные куски (например, при многоколоночной верстке).
Распознавание. На этом этапе текст переводится из графической формы в обычную текстовую.
Проверка орфографии и правка. Встроенная система проверки орфографии «проходится» по тексту, проверяя и корректируя последствия работы системы распознавания. Спорные слова и символы выделяются особым предупреждающим цветом. Потом наступает очередь пользователя, который также может внести свою лепту в этот ответственный процесс.
Сохранение. Для дальнейшей обработки документ должен быть передан «на поруки» соответствующей программе – как правило, одному из продуктов семейства Microsoft Office. Или сохранен в формате, соответствующем его содержанию: текст – в DOC или RTF, таблица – в XLS... Да и встроенную графику желательно в документе оставить...
Все эти операции в большинстве программ OCR могут выполняться как в автоматическом, с помощью программы-мастера, так и в ручном режиме, по отдельности. С двумя первыми и последней операциями с легкостью справится любая программа распознавания. А вот весь процесс целиком по зубам, увы, только нескольким продуктам, разработанным в нашей стране. Тут надо сделать небольшую поправку: на самом деле корректно работать с русским языком умеют практически все современные «распознавалки», вне зависимости от того, где они были разработаны. Более того, в состав Microsoft Office-2003 уже включена абсолютно бесплатная программа распознавания Microsoft Office Document Scanning! Однако для российских пользователей само понятие «программа распознавания текста» чаще всего неразрывно связано с программой FineReader. Ибо компания ABBYY смогла не просто создать удобный для пользователя и качественный продукт, но и, самое главное, удачно «раскрутить» его.
Одним из козырей FineReader является поддержка неимоверного количества языков распознавания – 176, в числе которых вы найдете экзотические и древние языки, и даже популярные языки программирования (Basic, С/C++, COBOL, Fortran, Java, Pascal)! Так что FineReader сможет без запинки справиться с древнегреческим свитком или с бледными распечатками исходных текстов программ, сделанных вашими предками лет 30 назад. Как ни странно, большинство пользователей на деле интересуется совсем другим. Офисных работников интересует распознавание типовых форм документов, студентов – возможность быстро «передрать» для реферата многостраничный текст из учебника, сканируя и распознавая книжный разворот целиком, бухгалтеров – возможность автоматического распознавания таблиц и документов на бланках... Все это и многое другое FineReader умеет... или не все, а только частично, в зависимости от модификации продукта. Далеко не все возможности из нашего перечня включены в самую простую модификацию программы, которую вы можете получить бесплатно вместе со сканером. Пакетное сканирование, грамотная обработка таблиц и изображений – для всего этого стоит приобрести профессиональную версию программы – FineReader Pro. Заодно она умеет безукоризненно читать штрихкоды, позволяет добавлять в базу данных новые языки. А самая мощная (и дорогостоящая) версия – FineReader Office – без труда справится и с распознаванием любых бланков и форм! Все версии FineReader, от самой простой до самой мощной, объединяет, на мой взгляд, главное достоинство программы – интерфейс. Для запуска процесса распознавания вам достаточно просто положить документ в сканер и нажать единственную кнопку (мастер Scan & Read) на панели инструментов программы. Все дальнейшие операции – сканирование, разбивку изображения на «блоки» и, наконец, собственно распознавание программа выполнит автоматически. Пользователю останется только установить нужные параметры сканирования – рекомендуется разрешение в 300 dpi и режим черно-белого изображения или LineArt. Впрочем, текст можно отсканировать и в цветном режиме: в этом случае FineReader сможет грамотно распознать цветовое выделение шрифтов и сохранить его в готовом документе.
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110