Общие сведения о XML в InDesign

Сначала в двух словах о том, что есть XML. Вот цитата из Википедии:

XML (англ. eXtensible Markup Language — расширяемый язык разметки; произносится [экс-эм-эл]) — рекомендованный Консорциумом Всемирной паутины язык разметки, фактически представляющий собой свод общих синтаксических правил. XML — текстовый формат, предназначенный для хранения структурированных данных (взамен существующих файлов баз данных), для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки (например, XHTML), иногда называемых словарями. XML является упрощённым подмножеством языка SGML. Целью создания XML было обеспечение совместимости при передаче структурированных данных между разными системами обработки информации, особенно при передаче таких данных через Интернет. Словари, основанные на XML (например, RDF, RSS, MathML, XHTML, SVG), сами по себе формально описаны, что позволяет программно изменять и проверять документы на основе этих словарей, не зная их семантики, то есть не зная смыслового значения элементов. Важной особенностью XML также является применение так называемых пространств имён (англ. namespace).

Что это означает в переводе с википедиевского на русский верстальный?

Главное, что нужно запомнить, это то, что XML — язык структурированный, то есть предназначен он для описания структур. Часто ли верстальщик сталкивается со структурами в процессе верстки? Да постоянно! Грамотно размеченный стилями текст любой статьи является структурой. Коллекция всех статей в документе — это тоже структура, коллекция документов в книге — снова структура. Или, к примеру, при верстке каталога информационный блок составляется не как попало, а с учетом структуры: наименование, производитель, цена, описание (в самом простом случае). Информционные блоки группируются (то есть, структурируются) по определенному признаку, например, по типу товара, эти группы объединяются в более общие структуры, которые в конечном итоге и представляет собой каталог.

Если подойти к процессу верстки с философской точки зрения, то верстку можно определить как структурирование информации для большего удобства восприятия. Получается, что каждый верстальщик, как герой Мольера, создает структуры данных, которые могут быть описаны с помощью XML и зачастую не подозревает об этом. А уж сталкивается с XML, сделанным другими людьми, постоянно, если, конечно, серьезно относится к своей профессии и интересуется новостями в издательском деле. Новости RSS — они ведь тоже XML.

У скептиков может возникнуть вопрос: а зачем верстальщику нужно иметь понятие об XML? Вот раньше люди верстали себе без всякого XML и горя не знали, так и мы как-нибудь обойдемся.

Не обойдемся — по многим причинам.

Во-первых, даже скептикам заметно, с какой скоростью развивается сейчас интернет. Специально обученые люди говорят, что каждый год количество информации в интернете чуть ли не удваивается. Заметим в скобках — в том числе и за счет онлайн-версий газет, журналов, книг. То есть, за счет того, что делают верстальщики. Конечно, некоторое время можно будет отбояриваться от наступающего интернета pdf-версиями изданий, но долго так продолжаться не может — слишком много устройств используется для доступа в сеть, не каждое из этих устройств может работать с pdf, а нормально читать pdf-версии газет формата A3 можно только на 30-дюймовом Apple Cinema Display. Поэтому структурированные данные с различными способами представления для разных устройств сейчас де-факто являются стандартом.

Во-вторых, вопрос автоматизации верстки эффективнее всего решается при использовании xml как источника данных и скриптов для обработки этих данных. Почему так получается? В первую очередь из-за пути, которым информация попадает в верстку. Вот, например, обычный способ получения размеченного текста — через документ Microsoft Office Word. Казалось бы, автор текста может грамотно оформить текст, верстальщик — грамотно поместить этот текст в публикацию и получить на выходе грамотно сверстанный текст. В идеальном случае, может быть, так и происходит. Но только в идеальном случае, поскольку Microsoft Office Word имеет отвратительную привычку вольно обращаться со стилями, цветами заливки и прочим. Так что в результате вполне может получиться текст в черном RGB цвете, который очень «грамотно» поделится при фотовыводе. Хорошо, если такой текст выловят после фотовывода, обойдется в затраты на вывод новых пленок, а если уже в середине печати тиража? Скептики спросят: а разве XML гарантирует от ошибок верстки? Нет, 100% гарантии дает, как известно, только страховой полис (© Ильф и Петров). Но использование XML позволяет свести риск ошибок к минимуму, поскольку XML гораздо предсказуемее Microsoft Office Word. К тому же, XML позволяет обмениваться данными из любых программ, которые этот формат поддерживают. И методы обмена информацией могут быть самыми разнообразными, например, непосредственно из интернета в верстку.

В-третьих, многие заказчики уже сейчас требуют, чтобы электронные версии их продуктов соответствовали стандарту, который основан на XML, например, специальному стандарту PDF для слабовидящих людей. То есть, не просто красиво сверстанный документ в электронном виде, но и красиво структурированный документ. Или, например, заказчика заинтересует возможность получения аналога сверстанной книги в формате ePub. Вручную оформлять электронную книгу в этом формате сложно так же, как сверстать бумажный вариант. А при помощи XML (и, конечно, скриптов) можно быстро и грамотно экспортировать книгу в ePub.

В-четвертых, Adobe настойчиво внедряет XML в программы верстки. Наиболее интересный нам продукт InDesign CS4 получил новый компактный формат экспорта и обмена — idml, который дополняет (а со временем, несомненно, вытеснит) inx.

Так что, как верно заметил в своем бессмертном произведении «Алиса в Зазеркалье» Льюис Кэрол, мы должны бежать со всех ног, чтобы оставаться на месте. А Ильф и Петров подтвердили устами Остапа Бендера: жизнь диктует нам свои суровые законы. Научиться использовать XML лучше заранее и в добровольном порядке, а не в состоянии цейтнота.

Надеюсь, мне удалось убедить скептически настроенных верстальщиков, и, что немаловажно, скептически настроенных начальников отделов верстки. В ближайшее время приступим к изучению XML применительно к InDesign и начнем с усвоения основных понятий, без четкого понимания которых XML одолеть не удасться. Это тег (tag) и элемент (element).

Следите за новостями.

3 комментария на “Общие сведения о XML в InDesign

  1. Борис

    Каким XML-редактором порекомендуете пользоваться верстальщику, начинающему изучать технологию XML. Есть ли бесплатные? Откуда скачать?

  2. Oleg Butrin Автор записи

    Борис, за последние два-три года XML-редакторов появилось достаточно много.
    Лично я пользовался и Dreamwaver и XMLSpy (на PC) и Oxygen на Mac. В случае необходимости даже Word может работать с XML вполне прилично. И бесплатный OpenOffice так же неплохо приспособлен для XML.
    Главная проблема, как я ее понимаю, состоит в том, чтобы найти более-менее приличный редактор для конечного пользователя. Разработчик может пользоваться хоть Блокнотом для описания структуры XML, а пользователю нужна простая в изучении программа. С такими программами пока туго, конечно. по большей части я сталкивался с ситуацией, когда издательства сами для себя пишут или заказывают редакторы XML, приспособленные для своих нужд. Кстати, спойлер: кое-что для опытов будет раздаваться мною в теме XML. Бездвоздмездно, то есть даром.
    Что же касается бесплатных редакторов XML, то стоит обратить внимание на Liquid: http://www.liquid-technologies.com/XmlStudio/XmlStudio.aspx. Сам я в нем не работал, но описание оставляет самые благоприятные впечатления.

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход /  Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход /  Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход /  Изменить )

Connecting to %s