Технические подробности KWord

Приложение E. Технические подробности KWord

Формат файла KWord

KWord использует два открытых, независимо разработанных стандарта для формата своего файла. Это сочетание было выбрано ради баланса между удобством и открытостью разработки.

Во-первых, все файлы KWord - это множественные файлы XML™, сжатые ради экономии места.

KWord 1.1 и более ранние

Файлы XML™ сжаты в один архивный файл с помощью алгоритма tar.

Эти файлы можно разжать командой:

% tar -xzvf имя_файла

Тем самым документ KWord будет разархивирован в свои составляющие файлы.

Текстовая часть во всех файлах KWord описана в формате XML™ (eXtensible Markup Language - расширяемый язык разметки).

Замечание

Более подробно с документами XML™, их обработчиками и технологиями можно познакомиться на

веб-страницах консорциума World Wide Web, посвященных XML™
Путеводитель по ресурсам XML.org
Вопросы и ответы по XML™

Документ KWord включает в себя как минимум два файла XML™:

maindoc.xml

В этом файле содержится большая часть текста KWord, таблицы и формулы. Он размечен тегами XML™ согласно официальному DTD. Копия DTD для KWord 1.1 хранится по адресу: http://www.koffice.org/DTD/kword-1.1.dtd.

documentinfo.xml

В этом файле хранятся сведения о документе. Именно они вводятся в диалоге при выборе пункта меню Файл->Сведения о документе. Эта информация полезна для сбора данных об авторах, их контактах и пр.

Копия DTD для KOffice 1.1 хранится здесь: http://www.koffice.org/DTD/document-info-1.1.dtd.

Кроме этого, в документ KWord могут входить и другие файлы. Рисунки, встроенные файлы и прочие двоичные данные входят в документ KWord как отдельные файлы.

Более подробно с форматом файла KWord и прочей технической информацией можно познакомиться на страницах KOffice API и General KDE developer information pages.

KWord 1.2

Текстовые файлы сжимаются в единый файл с помощью алгоритма zip. Это изменение было сделано ради улучшения производительности и уменьшения требований к памяти, а также потому, что оно очень широко используется в других открытых офисных пакетах.

Эти файлы можно разжать командой:

% unzip имя_файла

Тем самым документ KWord будет разархивирован в свои составляющие файлы.

Текстовая часть во всех файлах KWord описана в формате XML™ (eXtensible Markup Language - расширяемый язык разметки).

Замечание

Более подробно с документами XML™, их обработчиками и технологиями можно познакомиться на

веб-страницах консорциума World Wide Web, посвященных XML™
Путеводитель по ресурсам XML.org
Вопросы и ответы по XML™

Все документы KWord состоят как минимум из трех файлов:

maindoc.xml

В этом файле содержится большая часть текста KWord, таблицы и формулы. Он размечен тегами XML™ согласно официальному DTD.

Копия DTD для KWord 1.2 хранится здесь: http://www.koffice.org/DTD/kword-1.2.dtd.

documentinfo.xml

В этом файле хранятся сведения о документе. Именно они вводятся в диалоге при выборе пункта меню Файл->Сведения о документе. Эта информация полезна для сбора данных об авторах, их контактах и пр.

Копия DTD для KOffice 1.2 хранится здесь: http://www.koffice.org/DTD/document-info-1.2.dtd.

mimetype

Этот файл содержит типы MIME файлов KWord. KDE использует эту информацию, чтобы отличать файлы KWord от других файлов.

Этот файл обязательно содержит строку: application/x-kword

Кроме этого, в документ KWord могут входить и другие файлы. Рисунки, встроенные файлы и прочие двоичные данные входят в документ KWord как отдельные файлы.

Более подробно с форматом файла KWord и прочей технической информацией можно познакомиться на страницах KOffice API и General KDE developer information pages.

KDE Logo