Создание электронных книг в формате FictionBook 2.1: практическое руководство (pre-release)
Добавить в закладки К обложке
- Предуведомление - Страница 1
- Предисловие - Страница 2
- Введение - Страница 3
- Часть IФормат FictionBook и его место в мире электронной литературы - Страница 4
- § 1.2 Многообразие форматов электронных книг - Страница 5
- § 1.3 Несколько слов о XML - Страница 9
- § 1.4 Формат FictionBook — стандарт де-факто для электронных книг - Страница 10
- Часть IIПодробное описание формата FictionBook - Страница 13
- § 2.2 Пример книги в формате FictionBook - Страница 14
- § 2.3 Элементы описания книги.Базовые структурные элементы - Страница 16
- § 2.4 Элементы описания книги (description). Элементы первого уровня - Страница 18
- § 2.5 Элементы описания книги (description). Элементы второго уровня - Страница 20
- § 2.6 Элементы описания книги (description). Элементы третьего уровня (информация об авторе) - Страница 24
- § 2.7 Элементы тела книги (body). - Страница 25
- § 2.8 Элементы раздела книги (section).Элементы первого уровня. - Страница 26
- § 2.9 Элементы раздела книги (section).Элементы второго уровня. - Страница 28
- § 2.10 Элементы таблиц - Страница 29
- § 2.11 Элементы абзаца (стилевые, они же inline элементы) - Страница 30
- § 2.12 Элементы для платных книг - Страница 33
- § 2.13 Спецсимволы - Страница 34
- § 2.14 Список атрибутов элементов - Страница 35
- § 2.15 Алфавитный список всех элементов FictionBook 2.1 - Страница 37
- Часть IIIКонвертирование книг из других форматов - Страница 38
- § 3.1 Требования к исходному тексту - Страница 39
- § 3.2 Any to FB2 - Страница 40
- § 3.3 ExportXML - Страница 43
- § 3.4 doc2fb - Страница 44
- § 3.5 Перенос через буфер обмена - Страница 45
- § 3.6 Конвертор ExportToFB21 для Open Office - Страница 46
- § 3.7 Написание собственного конвертора - Страница 47
- Часть IVРедактирование книг. FB Editor - Страница 51
- § 4.1 Установка программы - Страница 52
- § 4.2 Описание функций и основные приемы работы - Страница 53
- § 4.3 Заполнение заголовка книги - Страница 55
- § 4.4 Структурирование документа - Страница 58
- § 4.5 Использование регулярных выражений - Страница 63
- § 4.6 Использование скриптов - Страница 64
- § 4.7 Баги с нами! - Страница 65
- § 4.8 Дальнейшее развитие редактора - Страница 66
- § 4.9 Альтернативные средства редактирования - Страница 67
- Часть VПрочие вопросы создания книг в формате FictionBook - Страница 69
- § 5.2 Подготовка картинок - Страница 71
- § 5.3 Обложки - Страница 73
- § 5.4 Сборник или по отдельности? - Страница 75
- § 5.5 Советы по вычитке книг - Страница 76
- § 5.6 Символы, которых нет на клавиатуре - Страница 78
- § 5.7 Высокое искусство аннотации - Страница 79
- § 5.8 Проблемы распространения - Страница 80
- Часть VIПросмотр и конвертирование книг в формате FictionBook - Страница 82
- § 6.1 Читалки - Страница 83
- § 6.2 Пакет FB2Any - Страница 85
- § 6.3 FB2GrWolf - Страница 87
- § 6.4 FB2PDF - Страница 88
- Часть VIIПрочее программное обеспечение для работы с FictionBook - Страница 90
- § 7.2 Утилита Booki - Страница 94
- § 7.3 Программа-библиотекарь JEFLibrarian - Страница 95
- § 7.4 Программа-библиотекарь MyHomeLib - Страница 96
- § 7.5 FB2Fix - Страница 97
- Заключение.Копирайт и доступность - Страница 101
- Благодарности - Страница 107
- Обратная связь - Страница 108
- Приложения - Страница 109
- Приложение БТехническое задание на написание читалки (ридера) - Страница 110
- Приложение ВСписок жанров FictionBook - Страница 111
- Приложение ГСписок возможных языков - Страница 113
- Приложение ДРегулярные выражения - Страница 114
- Приложение EОписание Base64 - Страница 117
- Приложение ЖОписание стандарта ISBN - Страница 118
- Приложение ЗПопытка анализа влияния «пиратов» на тиражи книг - Страница 120
- Приложение ИКопирайт и новая война луддитов - Страница 121
# теоретически должен обрабатывать журналы сделанные по июль 2007 включительно
# но уже с мая 2007 в тексте могут попадаться дополнительные тэги, мешающие правильной конвертации
# хотя все это касается, в основном, журнала "Хакер" ("Хакер-спец").
# "Мобильные компьютеры", к примеру, по-прежнему, как шли, так и идут в старом формате
# да и чтобы обрабатывать журналы, сделанные до ноября 2003, достаточно подправить ключевые фразы
#
# запускать из директории, где находится файл-оглавление журнала (index.htm)
# запуск: ruby ws_j_cnv.rb
#
# считываем файл-оглавление в строку
wfile=File.open("index.htm")
ltext=wfile.readlines.to_s
wfile.close
# выгрызаем заголовок
fbtitle=/<SPAN CLASS="titleSet">(.+)<font color="#FF0000">(#\d{1,3})<\/font>(.+)<\/SPAN>/.match(ltext).captures
# выгрызаем ссылки на статьи и разделители
filtr=/<SPAN CLASS="minSet">(.+)<\/SPAN>|<a href="(\d{3}\/\d.htm)">(.+)<\/a>/
lmas = ltext.grep(filtr)
# начинаем формировать выходной текст
outtext="<title><p>"+fbtitle[0]+fbtitle[1]+fbtitle[2]+"</p></title>\n"
# начинаем формировать аннотацию
annotation="<p>Содержание номера:</p>\n"
# флажок открытой секции раздела
flagSect=false
# прокручиваем список ссылок
lmas.each do |line|
if line.include? "SPAN" then # ССЫЛКА ИЛИ РАЗДЕЛИТЕЛЬ?
if flagSect then outtext=outtext+"</section>\n" end # РАЗДЕЛИТЕЛЬ. Секцию закрывать надо?
/<SPAN CLASS="minSet">(.+)<\/SPAN>/.match(line) # выгрызаем разделитель...
outtext=outtext+"<section>\n<title><p>"+$1+"</p></title>\n" # открываем секцию раздела
annotation=annotation+"<p>"+$1+":</p>\n" # и дополняем аннотацию
flagSect=true # секция осталась открыта...
else # НЕ-ЕТ, ВСЕ-ТАКИ ССЫЛКА...
filtr.match(line)
pathf = $2 # берем путь к первому файлу статьи...
annotation=annotation+"<p>"+(149).chr+" "+$3+"</p>\n" # дополняем аннотацию...
puts pathf[0..2] # это чтобы не скучно было ждать...
outtext=outtext+"<section>\n" # открыли секцию...
while File::exists?(pathf) do # обрабатываем статью
# считали файлик в текстовую строку...
wfile=File.open(pathf)
wtext=wfile.readlines.to_s
wfile.close
wtext[/<html>.+?<\/p>/m]="" # чик! головка...
wtext[/<center>.+<\/html>/m]="" # чик! хвостик...
# заголовок статьи оставлять?
wtext = pathf[4,2].to_i == 1 ? wtext.sub(/.*\n(.*\n.*\n).*\n.*\n/,' \1') : wtext.sub(/.*\n.*\n.*\n.*\n.*\n/,' \1')
outtext=outtext+wtext # оставшийся текст - к основному массиву
# модифицируем имя файла
if pathf[4,2].to_i >= 10
pathf[4,2] = (pathf[4,2].to_i + 1).to_s
else
pathf[4] = (pathf[4,2].to_i + 1).to_s
end
end # конец цикла
outtext=outtext+"</section>\n" # закрываем секцию
end # усе. статью оформили...
end # все статьи собрали в одну строку...
# модифицируем выходной текст под FB2
outtext.gsub!("<p><big><big><big><strong>","<title><p>")
outtext.gsub!("</strong></big></big></big></p>","</p></title>")
outtext.gsub!("<p><big><strong>","<epigraph><p>")
outtext.gsub!("</strong></big></p>","</p></epigraph>")
outtext.gsub!(" ",(160).chr)
outtext.gsub!(/&(?!lt;|gt;)/,"&")
annotation.gsub!(/&(?!lt;|gt;)/,"&")
outtext.gsub!("<br>","</p><p>")
outtext.gsub!("<br>","</p><p>")
# чистим мусор
outtext.gsub!(/\x01|\x12|\x18|\x1E/, "?") # удаляем непечатные символы
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122