Создание электронных книг в формате FictionBook 2.1: практическое руководство (beta 4)
Добавить в закладки К обложке
- Предуведомление - Страница 1
- Предисловие - Страница 2
- Введение - Страница 3
- Часть I Формат FictionBook и его место в мире электронной литературы - Страница 4
- § 1.2 Многообразие форматов электронных книг - Страница 5
- § 1.3 Несколько слов о XML - Страница 9
- § 1.4 Формат FictionBook — стандарт де-факто для электронных книг - Страница 10
- Часть II Подробное описание формата FictionBook - Страница 12
- § 2.2 Пример книги в формате FictionBook - Страница 13
- § 2.3 Элементы описания книги. Базовые структурные элементы - Страница 15
- § 2.4 Элементы описания книги (description). Элементы первого уровня - Страница 17
- § 2.5 Элементы описания книги (description). Элементы второго уровня - Страница 19
- § 2.6 Элементы описания книги (description). Элементы третьего уровня (информация об авторе) - Страница 24
- § 2.7 Элементы тела книги (body). - Страница 25
- § 2.8 Элементы раздела книги (section). Элементы первого уровня. - Страница 26
- § 2.9 Элементы раздела книги (section). Элементы второго уровня. - Страница 28
- § 2.10 Элементы таблиц - Страница 29
- § 2.11 Элементы абзаца (стилевые элементы) - Страница 30
- § 2.12 Элементы для платных книг - Страница 33
- § 2.13 Спецсимволы - Страница 34
- § 2.14 Список атрибутов элементов - Страница 35
- § 2.15 Алфавитный список всех элементов FictionBook 2.1 - Страница 37
- Часть III Конвертирование книг из других форматов - Страница 38
- § 3.1 Требования к исходному тексту - Страница 39
- § 3.2 Any to FB2 - Страница 40
- § 3.3 ExportXML - Страница 43
- § 3.4 doc2fb - Страница 44
- § 3.5 Перенос через буфер обмена - Страница 45
- § 3.6 Конвертор ExportToFB21 для Open Office - Страница 46
- Часть IV Редактирование книг. FB Editor - Страница 47
- § 4.1 Установка программы - Страница 48
- § 4.2 Описание функций и основные приемы работы - Страница 49
- § 4.3 Заполнение заголовка книги - Страница 51
- § 4.4 Структурирование документа - Страница 53
- § 4.5 Использование регулярных выражений - Страница 58
- § 4.6 Использование скриптов - Страница 59
- § 4.7 Баги с нами! - Страница 60
- § 4.8 Дальнейшее развитие редактора - Страница 61
- Часть V Прочие вопросы создания книг в формате FictionBook - Страница 62
- § 5.2 Подготовка картинок - Страница 64
- § 5.3 Обложки - Страница 66
- § 5.4 Сборник или по отдельности? - Страница 67
- § 5.5 Советы по вычитке книг - Страница 68
- § 5.6 Символы, которых нет на клавиатуре - Страница 70
- § 5.7 Высокое искусство аннотации - Страница 71
- Часть VI Просмотр и конвертирование книг в формате FictionBook - Страница 72
- § 6.1 Читалки - Страница 73
- § 6.2 Пакет FB2Any - Страница 75
- Часть VII Прочее программное обеспечение для работы с FictionBook - Страница 77
- § 7.2 Утилита Booki - Страница 81
- § 7.3 Программа-библиотекарь JEFLibrarian - Страница 82
- Заключение. Копирайт и доступность - Страница 83
- Благодарности - Страница 87
- Обратная связь - Страница 88
- Приложения - Страница 89
- Приложение Б Техническое задание на написание читалки (ридера) - Страница 90
- Приложение В Список жанров FictionBook - Страница 91
- Приложение Г Список возможных языков - Страница 93
- Приложение Д Регулярные выражения - Страница 94
«Do not convert _italic_ текст» — не конвертировать текст, обрамленный знаками подчеркивания в курсив. Ставим галочку. Не стоит разрешать программе делать это самой. Очень часто получается так называемый «рваный» курсив (<emphasis>С</emphasis> <emphasis>ло</emphasis> <emphasis>во</emphasis>) или, того хуже, курсивным становится только первое слово абзаца.
«Do not restore broken paragraphs» — не восстанавливат разорванные абзацы. Ставим галочку.
«Do not detect poems» — не выделять стихи. Ставим галочку однозначно. Программа определяет стихи исключитенльно по коротким строчкам и делает это крайне коряво.
«Only use marked with <h#>|^T^U headers» — выделять как заголовки исключительно абзацы выделенные тэгами <h1>…<h6> и (или) esс-последовательностями ^T^U. Ставим галочку, если текст скачан из библиотеки Максима Мошкова (Lib.ru).
«Ignore line indent (spaces at the line start)» — не считать пробелы в начале сроки признаком абзаца.
«Convert leading '-' to long dash '—' (dialogs)» — конвертировать компьютерный «минус» в начале строки в длинное тире. Ставим галочку, особенно, если конвертируем DOS-текст.
Вторая закладка — «Links», предназначена для настройки обработки html-файлов.
Первый блок — «Images», относится к картинкам, если таковые во входном файле имеются.
Опция «Remove ALL images from the document» убирает вообще все картинки.
«Remove off-site images» — убирает только те картинки, которые располагаются не на сайте, с которого был загружен конкретный html.
«Preserve dynamic images» — не удалять картинки с URL динамического вида, например, счетчики.
Блок «Linked documents»
«Remove external links» — просто убирает линки, ведущие за пределы документа.
Включение опции «Follow links» делает активными все последующие опции.
Теоретически, если исходный текст представлен в виде пачки html-файлов и имеется некий файл-оглавление со ссылками, можно включить эту опцию, открыть файл-оглавление, а остальные программа подстыкует автоматически. На практике это зачастую получается довольно коряво.
«Follow off-site links» — следовать по линкам, ведущим за пределы сайта.
Рядом находится уровень следования (level deep).
«Only follow matching the expression» — следовать только линкам, совпадающим с нижеуказанным выражением.
«Never follow matching the expression» — НЕ следовать линкам, совпадающим с нижеуказанным выражением.
Третья закладка — «RegEXP» — обработка текста с помощью регулярных выражений.
Подробнее о том, что такое регулярные выражения и как ими пользоваться, можно прочесть в приложении Д в конце книги.
«Header detection regular expression» — регулярные выражения, с помощью которых программа может распознавать заголовки.
«Regular expression to run on-load» — регулярные выражения, предназначенные для обработки исходного текста.
Окошко разделено на два столбца. Первый (+new search pattern) предназначен для выражения поиска. Второй (+new replace pattern) — для выражений замены.
Регулярных выражений может быть несколько.
Вот как можно обойти вышеописанный баг с неправильным распознаванием новых абзацев.
в графе «+new search pattern» вводим:
\r\n(\S)
(перевод строки, новая строка, не-пробел).
А в графу «+new replace pattern» вводим:
$1
Здесь не видно, но перед «$1» должен идти пробел. То есть символы перевода строки и новой строки будут заменены на пробел. А само «$1» есть обращение к выражению в скобках в регэкспе поиска. Оно нужно, чтобы сохранить в неприкосновенности не-пробел, который идет сразу после символа новой строки.
«Regular expression to run on result document» — регулярные выражения, предназначенные для обработки выходного документа.