KWord использует два открытых, независимо разработанных стандарта для формата своего файла. Это сочетание было выбрано ради баланса между удобством и открытостью разработки.
Во-первых, все файлы KWord - это множественные файлы XML™, сжатые ради экономии места.
Файлы XML™ сжаты в один архивный файл с помощью алгоритма tar.
Эти файлы можно разжать командой:
% tar -xzvf имя_файла
Тем самым документ KWord будет разархивирован в свои составляющие файлы.
Текстовая часть во всех файлах KWord описана в формате XML™ (eXtensible Markup Language - расширяемый язык разметки).
Более подробно с документами XML™, их обработчиками и технологиями можно познакомиться на
веб-страницах консорциума World Wide Web, посвященных XML™ |
Путеводитель по ресурсам XML.org |
Вопросы и ответы по XML™ |
Документ KWord включает в себя как минимум два файла XML™:
В этом файле содержится большая часть текста KWord, таблицы и формулы. Он размечен тегами XML™ согласно официальному DTD. Копия DTD для KWord 1.1 хранится по адресу: http://www.koffice.org/DTD/kword-1.1.dtd.
В этом файле хранятся сведения о документе. Именно они вводятся в диалоге при выборе пункта меню Файл->Сведения о документе. Эта информация полезна для сбора данных об авторах, их контактах и пр.
Копия DTD для KOffice 1.1 хранится здесь: http://www.koffice.org/DTD/document-info-1.1.dtd.
Кроме этого, в документ KWord могут входить и другие файлы. Рисунки, встроенные файлы и прочие двоичные данные входят в документ KWord как отдельные файлы.
Более подробно с форматом файла KWord и прочей технической информацией можно познакомиться на страницах KOffice API и General KDE developer information pages.
Текстовые файлы сжимаются в единый файл с помощью алгоритма zip. Это изменение было сделано ради улучшения производительности и уменьшения требований к памяти, а также потому, что оно очень широко используется в других открытых офисных пакетах.
Эти файлы можно разжать командой:
% unzip имя_файла
Тем самым документ KWord будет разархивирован в свои составляющие файлы.
Текстовая часть во всех файлах KWord описана в формате XML™ (eXtensible Markup Language - расширяемый язык разметки).
Более подробно с документами XML™, их обработчиками и технологиями можно познакомиться на
веб-страницах консорциума World Wide Web, посвященных XML™ |
Путеводитель по ресурсам XML.org |
Вопросы и ответы по XML™ |
Все документы KWord состоят как минимум из трех файлов:
В этом файле содержится большая часть текста KWord, таблицы и формулы. Он размечен тегами XML™ согласно официальному DTD.
Копия DTD для KWord 1.2 хранится здесь: http://www.koffice.org/DTD/kword-1.2.dtd.
В этом файле хранятся сведения о документе. Именно они вводятся в диалоге при выборе пункта меню Файл->Сведения о документе. Эта информация полезна для сбора данных об авторах, их контактах и пр.
Копия DTD для KOffice 1.2 хранится здесь: http://www.koffice.org/DTD/document-info-1.2.dtd.
Этот файл содержит типы MIME файлов KWord. KDE использует эту информацию, чтобы отличать файлы KWord от других файлов.
Этот файл обязательно содержит строку: application/x-kword
Кроме этого, в документ KWord могут входить и другие файлы. Рисунки, встроенные файлы и прочие двоичные данные входят в документ KWord как отдельные файлы.
Более подробно с форматом файла KWord и прочей технической информацией можно познакомиться на страницах KOffice API и General KDE developer information pages.