Пролог (заголовок) XML-документа может содержать общие для всего документа комментарии и команды обработки (Processing instructions), к которым относятся:
- объявление XML;
- подключение к XML сценария XSLT или ссылка на таблицу стилей;
- команды обработки конкретного парсера;
- секции CDATA.
Команды обработки - это специальные теги, ограничиваемые с двух сторон парами символов и ?>. Команды представляют собой инструкции анализатору для выбора тех или иных режимов или параметров. Рекомендуется, чтобы инструкция обработки начиналась с адреса того приложения, которому она предназначена.
Как правило, XML-документ начинается с объявления (XML declaration). Эта команда обработки не обязательна, но рекомендована W3C, так как указывает номер версии XML:
Кроме обязательного номера версии, объявление XML может содержать описание типа кодировки и признак автономности:
Если в документе содержатся указания на внешние DTD-схемы, то автономным он не является.
Перед объявлением XML в документе не должно быть никаких символов даже пробелов, иначе анализатор выдаст сообщение об ошибке.
Ссылка на таблицу стилей xml-stylesheet – это команда обработки, которая указывает на таблицу стилей на языке XSL, используемую для отображения xml-документа:
Примером инструкции обработки парсера Cocoon служит команда:
,
которая указывает, что обрабатываемый XML –документ должен быть преобразован в формат HTML.
Секции CDATA используются когда необходимо поместить в документ содержимое, которое не должно обрабатываться анализатором. Все содержимое, находящееся между анализатор пропускает, не проверяя на соответствие синтаксису XML.
В теле документа могут встречаться и другие команды, в том числе специфичные для конкретного анализатора. Незнакомая команда не должна приводить к исключительной ситуации, она будет просто пропущена анализатором.
XML-документы могут содержать комментарии, которые игнорируются приложением, обрабатывающим документ:
не использовать внутри комментария символы "--".