Введение в Perl
Добавить в закладки К обложке
- От простого к сложному - Страница 1
- Запуск интерпретатора Перл - Страница 4
- Синтаксис - Страница 6
- Переменные - Страница 10
- Встроенные переменные Перл - Страница 13
- Регулярные выражения (шаблоны) - Страница 15
- Операторы и приоритеты - Страница 17
- Встроенные функции - Страница 23
- Группа системных вызовов - Страница 27
- Подпрограммы - Страница 35
- Модули (packages) - Страница 37
- Форматы - Страница 39
- Отладка Перл программ - Страница 41
- Список литературы - Страница 42
- Интернет – ссылки - Страница 43
Внутри класса символов '\b' обозначает символ backspace (стирания).
Метасимволы \A и \Z – аналогичны '^' и '$' но если началостроки '^' и конец строки '$' действуют для каждой строки в многосторочной строке то \A и \Z обозначают начало и конец всей многосторчной строки.
Если внутри шаблона применяется группировка (круглые скобки) то номер подстроки группы обозначается как '\цифра'.
Заметьте что за шаблоном в пределах выражения или блока эти группы обозначаются как '$цифра'. Кроме этого существуют дополнительные переменные:
$+ – обозначает последнее совпадение
$& – все совпадение
$` – все до совпадения
$' – все после совпадения
Пример:
$s = «Один 1 два 2 и три 3»;
if ($s =~ /(\d+)\D+(\d+)/)
{
print «$1\n»; # Результат '1'
print «$2\n»; # '2'
print «$+\n»; # '2'
print «$&\n»; # '1 два 2'
print «$`\n»; # 'Один '
print «$'\n»; # ' и три 3'
}
Перл версии 5 содержит дополнительные конструкции шаблонов:
(?#комментарий) – комментарий в теле шаблона.
(?:шаблон) – группировка как и '( )' но без обратной ссылки
(?=шаблон) – «заглядывание» вперед.
Например /\w+(?=\t)/ соответствует слову за которым идет табуляция но символ '\t' не включается в результат.
Пример:
$s = «1+2-3*4»;
if ($s =~ /(\d)(?=-)/) # Наити цифру за которой стоит '-'
{
print «$1\n»; # Результат '2'
}
else { print «ошибка поиска\n»;}
(?!шаблон) – «заглядывание» вперед по отрицанию.
Пример:
$s = «1+2-3*4»;
if ($s =~ /(\d)(?!\+)/) # Наити цифру за которой не стоит '+'
{
print «$1\n»; # Результат '2'
}
else { print «ошибка поиска\n»;}
(?ismx) – «внутренние» модификаторы. Удобно применять в шаблонах где например нужно внутри шаблона указать модификатор.
Правила регулярного выражения. (regex)
1. Любой символ обозначает себя самого если это не метасимвол. Если вам нужно отменить действие метасимвола то поставьте перед ним '\'.
2. Строка символов обозначает строку этих символов.
3. Множество возможных символов (класс) заключается в квадратные скобки '[]' это значит что в данном месте может стоять один из указанных в скобках символ. Если первый символ в скобках это '^' – значит не один из указанных символов не может стоять в данном месте выражения. Внутри класса можно употреблять символ '-' обозначающий диаппазон символов. Например a-z один из малых букв латинского алфавита, 0-9 – цифра и т.д.
4. Все символы, включая специальные можно обозначать с помощью '\' как в языке С.
5. Альтернативные последовательности разделяются символом '|' Заметьте что внутри квадратных скобок это обычный символ.
6. Внутри регулярного выражения можно указыват «подшаблоны» заключая их в круглые скобки и ссылаться на них как '\номер' Первая скобка обозначается как '\1'.