ПОСЛЕДОВАТЕЛЬНОСТЬ ДЕЙСТВИЙ ИНТЕРПРЕТАТОРА SHELL
Shell выполняет определенную последовательность действий по интерпретации команд для каждой прочитанной им строки. Зная эту последовательность, вы можете изолировать многие проблемы на соответствующем уровне. Иногда на определенном шаге этой последовательности могут появиться странные вхождения символов. Поэтому важно знать, когда изменяются значения переменных.
Один из примеров относится к раскрытию имени файла и символу звездочки. Shell НЕ раскрывает метасимволы во время присвоения значений. Оператор F=* означает в действительности, что переменной F присваивается один символ. Когда выполняется шаг 7 последовательности действий, звездочка раскрывается как метасимвол имени файла, превращаясь во все имена файлов в текущем каталоге. Это можно продемонстрировать на примере команды "echo $F". Для того чтобы сохранить литеральное значение звездочки, вам нужно экранировать ее, что защитит ее от шага 7. Получается команда echo "$F". А для того чтобы вообще подавить значение переменной F, вам следует исключить шаг 3 - подстановку параметров. Указывая команду echo '$F', вы печатаете буквы $F, а не значение переменной F.
Действия выполняются в таком порядке:
- Командная строка или логическая конструкция читается с терминала или из файла данных. Чтение останавливается при обнаружении следующих символов: точки с запятой (;), символа фоновой задачи (&), логического и (&&), логического или () либо символа новой строки (\n). Выполняется разбор введенных данных на слова с учетом пробелов и табуляций.
- Если в текущем интерпретаторе shell установлен флаг многословности (-v), то прочитанная строка отображается на стандартное устройство регистрации ошибок.
- Выполняется подстановка параметров. Сюда входит подстановка позиционных параметров, подстановка переменных и подстановка специальных выражений. Параметры всегда имеют префикс в виде денежного знака ($).
- Выполняется подстановка команд. Это относится ко всем командам, взятым в символы ударения (`). Такая команда вычисляется и выполняется, а результирующий текст заменяет исходное выражение в полной командной строке. Выполняемая команда может содержать последовательные команды, конвейеры или команды, сгруппированные в скобках. Любые лишние пробелы, табуляции или символы новой строки, появившиеся в результате выполнения команды, впоследствии удаляются при обработке внутренних разделителей полей. Если нужно сохранить эти лишние символы, примените двойные кавычки вокруг всего выражения.
- Проверяется переназначение ввода-вывода. Если таковое имеется, исходный дескриптор файла (0, 1 или 2) закрывается, а затем открывается повторно с новым значением. Вновь открытый дескриптор файла занимает в файловом вводе-выводе то же место, что и закрытый файловый дескриптор. Символы переназначения удаляются из командной строки.
- Поскольку командная строка могла измениться по сравнению со своим исходным состоянием в результате подстановок, она вновь разбирается на слова с учетом переменной среды IFS. Эта переменная содержит разделители между полями, которые отделяют слова друг от друга в командной строке. Каждый символ командной строки, который занесен в IFS, заменяется на пробел, чтобы разграничить слова. Все неэкранированные пробелы, табуляции, символы новой строки и нулевые аргументы удаляются из командной строки. Все экранированные значения переменных защищены от разбора, выполняемого в соответствии с IFS. Для того чтобы увидеть значение IFS, введите такой конвейер команд:
- Далее shell ищет все слова, для которых требуется раскрытие имени файла (метасимвола). Делается попытка сопоставить образец с файлами текущего каталога. Если подходящие файлы найдены, они заменяют выражение в командной строке. Если соответствия не обнаружено, метасимволы остаются в этом выражении. Все присвоения переменным защищены от раскрытия метасимволов. Типичным примером является команда "ls z*". Если имена каких-либо файлов начинаются с буквы z, эти имена перечисляются. В противном случае печатается сообщение "z* not found".
- Если установлен флаг трассировки выполнения (-x), то командная строка отображается на стандартное устройство регистрации ошибок перед тем, как она будет фактически выполнена. Если это командная строка, то она выводится с префиксом "+", если же это просто присвоение значения переменной, префикса нет.
- На этом шаге всем переменным присваиваются значения, затем в соответствии с переменной среды PATH ищется местонахождение команды. Присвоение значений переменным происходит справа налево вдоль командной строки. Поиск по переменной PATH, наоборот, происходит слева направо. Если имя найдено, то полное маршрутное имя заменяет вызов команды в командной строке. Если переменная PATH имеет пустое значение, подразумевается текущий каталог. Если в каком-либо месте исходного имени команды имеется косая черта (/), то переменная PATH не просматривается, а считается, что указано полное маршрутное имя.
- Наконец, команда выполняется. Если это встроенная команда, текущий shell отрабатывает ее. В противном случае делается попытка загрузить команду в память, как если бы это была скомпилированная программа. Если эта попытка успешна, команда выполняется посредством системного вызова exec(2). Если загрузка команды не удалась, то считается, что это командный файл еще одного интерпретатора shell, и порождаемый shell читает этот командный файл в качестве своих данных.
Далее эти шаги рассматриваются более подробно. Когда вы программируете на языке shell, попытайтесь представить себе, какой шаг вы используете для каждой строки текста программы. Возможно, вы путаете два-три шага между собой. Зная порядок шагов, вы можете проще определять эффект от действия ваших команд и сокращать число возможных ошибок.
echo "<$IFS>" | od -bc