О формате EPUB

Часто на форумах и в приходящих мне электронных письмах встречается вопрос «Что такое формат EPUB?». Задают и другие вопросы по данному формату — чем он хорош, чем отличается от FB2, MOBI и DOC, стоит ли покупать книги в нем или же предпочесть другой формат. В этой статье я отвечу на эти и другие вопросы, расскажу об истории создания и развития EPUB, его главных особенностях, а также о перспективах EPUB и существующих альтернативах данному формату.

 

История

Формат EPUB (название происходит от английского словосочетания «electronic publication) был разработан Международным форумом по цифровым публикациям (International Digital Publishing Forum — IDPF). Первоначальная версия появилась еще в 1999 году под названием OEB (Open eBook Publication), но окончательная версия вышла в свет в сентябре 2007 года. Это был уже собственно EPUB.

EPUB очень быстро завоевал популярность в США и Европе, где до этого был популярен формат Mobipocket (расширения MOBI, PRC, AZW). Крупнейшая зарубежная библиотека Gutenberg.com сделала epub своим стандартным форматом для хранения электронных книг. Подавляющее большинство онлайн-магазинов электронных книг (контента) перешли на EPUB в 2008-2010 годах.

В 2009 году проектом www.epubreader.com было выпущено специальное расширение для браузера FireFox, позволяющее читать книги в EPUB с комфортом прямо в окне браузера. Можно как загружать книги из интернета, так и открывать книги, хранящиеся на компьютере.

EpubReader для Firefox

В том же 2009 году компания Sony перевела свой онлайн-магазин электронных книг (контента) на формат EPUB (ранее использовался фирменный формат Sony LRF (BBeB)). Ридеры Sony поддерживали EPUB еще с 2008 года, а к 2012 году Sony полностью исключила поддержку LRF из программного обеспечения своих ридеров, таким образом окончательно и бесповоротно перейдя на EPUB.

В 2010 году был проведен конкурс на разработку логотипа формата EPUB. В конкурсе участвовало 203 человека из 18 стран, а победил дизайнер Ральф Бёркхардт (Ralph Burkhardt), плод его трудов можете увидеть чуть ниже. Основные черты логотипа, согласно Бёркхардту — простота и узнаваемость.

Логотип EPUB

В июле 2010 года произошло еще одно событие — формат EPUB обновился до новой версии 2.0.1. Никаких серьезных изменений, однако, не было: просто исправили некоторые ошибки и недочеты.

В том же 2010 году случилось еще одно весьма интересное событие — экономический отчет Президента США был опубликован в том числе и в формате EPUB — для того, чтобы его смогли с удобством прочитать владельцы устройств для чтения электронных книг и планшетов.

В настоящее время популярность EPUB только растет, в частности, в России и других странах СНГ количество доступных в этом формате электронных книг увеличивается, можно сказать, непрерывно. В США и Европе EPUB уже является стандартом для хранения и распространения электронных книг, единственный его конкурент — MOBI (и его DRM-вариация AZW).

Международный форум по цифровым публикациям сейчас работает над созданием новой версии формата — EPUB 3; уже созданы предварительные версии. Вероятно, в 2013 году окончательное обновление выйдет в свет. Новая версия, в частности, отличается улучшенной поддержкой формул (MathML), поддержкой комиксов, аудио, в перспективе — и видео. Основная задача сейчас, как я понимаю, состоит в том, чтобы сделать EPUB поистине универсальным форматом, хорошо подходящим для учебников и интерактивной литературы.

 

Что такое формат EPUB?

Я попытаюсь ответить на данный вопрос, используя минимальное число технических терминов: совсем без них, увы, обойтись не получится. EPUB — это формат электронных книг в виде XML-документов. Файл EPUB, по сути, является ZIP контейнером (это аналог ZIP-архива). Пользователь видит только один файл, но на самом деле внутри него «спрятано» множество других файлов — собственно тексты книги, иллюстрации, обложки, шрифты, таблицы стилей и другое.

Каждый элемент текста книги в EPUB описывается так называемыми тегами. В результате получается книга, в которой цитаты оформлены одним образом, основной текст — другим, аннотации — третьим, сноски — четвертым, и так далее. Процесс создания книг EPUB автоматизирован, существует несколько программ для создания файлов EPUB, а также целый ряд конвертеров, о которых я расскажу чуть позже.

Формат EPUB поддерживает такие элементы книг, как картинки (и растровые, и векторные), обложки, таблицы, формулы (в том числе и сложные!), заголовки, подзаголовки, цитаты, эпиграфы, стихи. Каждый элемент форматируется определенным образом (который, в общем-то, создатель книги может изменять по своему усмотрению), в результате же получается электронная книга, приближенная по форматированию (и вообще внешнему виду) к реальной бумажной.

В файл EPUB обычно также встраивается краткая информация о книге, ее название, имя автора, название серии, жанр, год издания, иногда и другие данные. Хорошие ридеры и программы эту информацию умеют извлекать. Согласитесь, приятно, когда на книжной полке вместо названий файлов указаны названия книг, имена авторов и названия серий. Такое невозможно, например, в случае с TXT, RTF и даже DOC.

EPUB является открытым форматом, при желании каждый может его дорабатывать. Помимо этого, для чтения книг в формате EPUB можно без проблем создавать программы. Сами книги EPUB можно распространять без ограничений и открывать на любом количестве устройств. В то же время книги в EPUB можно и оснащать защитой от копирования — используется защита DRM, разработанная Adobe. Практически все книги, продаваемые в европейских и американских магазинах контента, оснащены защитой DRM.

Книгу в формате FB2, как вы, вероятно, уже знаете, можно легко изменить, копировать, передать другому пользователю, выложить в открытый доступ на какой-нибудь сайт, и она откроется на неограниченном числе других устройств; это же относится и к книгам EPUB без защиты. А вот книгу в EPUB с защитой DRM просто так размножить нельзя: она будет открываться только на строго ограниченном количестве устройств, зарегистрированных на конкретного покупателя. Это позволяет соблюдать авторские права.

Каждая программа при открытии EPUB сохраняет исходное форматирование книги, но позволяет изменять ряд параметров: размер, гарнитуру и начертание шрифта; ширину полей, величину межстрочного интервала (спектр изменяемых параметров зависит от конкретной программы). Такая гибкость очень удобна. Специалисты называют это «плавающей версткой». Программа верстает текст сама, исходя из задумки создателя книги EPUB и желаний конечного пользователя. «Плавающая верстка» позволяет добиться комфорта при чтении одного и того же файла на устройствах с самыми разными диагоналями экрана.

В то же время необходимо отметить и такой момент: сам создатель книги EPUB может встроить в нее тот или иной шрифт и таблицу стилей, таким образом «задав» читателям параметры отображения текста. В результате читатели смогут только менять размер шрифта (иногда и некоторые другие параметры). В этом случае, как вы понимаете, гибкость существенно ограничивается. Однако все-таки книги в EPUB создают обычно профессионалы — специалисты по верстке, и они подбирают наилучшие значения параметров.

Стоит отметить, что формат EPUB предназначен главным образом для художественной литературы; для литературы научной, технической и учебной он не очень-то подходит ввиду ряда ограничений. И тем не менее — учебники в EPUB создавать можно, но пока этого практически никто, увы, не делает. Для переделки одного учебника из, скажем, DJVU в EPUB требуется очень много времени.

 

Преимущества EPUB над TXT и RTF

Собственно говоря, EPUB безоговорочно лучше TXT — ведь в TXT вообще отсутствует какое-либо форматирование, там не поддерживаются даже простейшие иллюстрации, а текст всего документа и вовсе оформлен одним стилем. Это крайне убогий формат, и я не советую скачивать (и тем более покупать) книги в TXT.

RTF — несколько более продвинутый формат; он, в частности, позволяет форматировать текст, но возможности этого форматирования предназначены скорее для обработки документов, а не книг. RTF также не поддерживает автоматически собираемое оглавление, сноски и многие другие полезные вещи. Помимо этого, книги в формате RTF обычно «весят» заметно больше, чем книги в формате EPUB, и на ряде устройств они могут отображаться не вполне корректно. Поэтому приобретать книги в RTF я также не советую.

 

Преимущества EPUB над DOC

Пожалуй, DOC — самый популярный и известный формат. Его плюсы — очень широкий функционал для оформления документов. Однако именно для книг он подходит не столь хорошо, как EPUB. Одна из главных проблем DOC заключается в его тяжеловесности, в отсутствии полной совместимости программ, читающих (и создающих) DOC-файлы. E-ink ридеры обычно поддерживают этот формат в ограниченной степени — из-за сложности создания программ, читающих его корректно. Поэтому книги в DOC я тоже не рекомендую приобретать.

 

Преимущества EPUB над FB2

EPUB является более мощным форматов, нежели FB2. Он поддерживает формулы и некоторые другие специфические элементы форматирования. Также в файлы EPUB можно встраивать защиту от копирования DRM, но этот плюс, разумеется, является существенным только для издателей и магазинов.

Единственный, наверное, минус EPUB — файлы книг в этом формате весят несколько больше, чем в формате FB2 (и тем более в FB2.ZIP). Кроме того, в Росии и вообще на постсоветском пространстве EPUB пока еще распространен менее, чем FB2, однако найти книги в этом формате уже давно не проблема.

Я не могу сказать, что EPUB однозначно лучше FB2 — это будет неправильно. На самом деле, особой разницы для большинства пользователей нет. И FB2, и EPUB хорошо подходят для чтения художественной литературы. О формате FB2, кстати, можете почитать в написанной мной о данном формате статье.

 

Преимущества EPUB над DJVU

Ну, тут и говорить нечего. DJVU, грубо говоря, является простым набором картинок — отсканированных страниц книги, сведенных воедино и иногда дополненных OCR-слоем (такой слой накладывает программа для распознавания текстов). DJVU файлы отличаются очень большими размерами, их обычно неудобно читать. В то же время многие учебники и научные книги доступны только в DJVU. И тут уже, увы, ничего не поделаешь.

 

Программы для чтения EPUB

Существует целый ряд популярных программ для чтения EPUB: Adobe Digital Editions, iBooks, Calibre, Okular, BookReader, AlReader, CoolReader, FBReader, CoolReader. Все эти программы являются бесплатными и достаточно активно развиваются. У многих есть версии для Windows, Mac, Linux, iOS, Android, Windows Mobile и Windows CE. Здесь я подробно не буду останавливаться на описаниях этих программ; для Windows и Android рекомендую CoolReader и AlReader — на мой взгляд, они наиболее функциональны. Для iOS неплохим вариантом является iBooks, для MacOS — Adobe Digital Editions, Okular, BookReader.

 

Программы для создания EPUB

Пожалуй, наиболее мощным инструменталом обладает платная (и очень дорогая) программа Adobe InDesign. В качестве альтернативных программ можно назвать Pages (для MacOS; платная), eCub (почти для всех операционных систем, бесплатная), Sigil (аналогично), Padilicious (для MacOS, бесплатная), ABBYY FineReader 11 (платная).

 

Как сконвертировать книгу или документ в формат EPUB?

Для конвертации FB2 и многих других форматов (DOC, TXT, RTF) в EPUB было создано большое количество конвертеров: некоторые из них являются онлайн-конвертерами. Они не требуют установки на компьютер, что очень удобно. Есть и более мощные конвертеры, выполненные в виде программ, которые уже надо ставить на компьютер. У них заметно шире функционал. Список конвертеров можете посмотреть на этой странице.

 

Как конвертировать EPUB в другие форматы?

Список конвертеров можете посмотреть на этой странице.

 

Конкуренты формата EPUB

У формата EPUB есть, пожалуй, три основных конкурента — FB2, MOBI, PDF. С FB2 мы уже сравнивали EPUB выше, а формат MOBI принциально от FB2 мало чем отличается, однако предоставляет возможность поставить защиту от копирования — тот же DRM, что и на EPUB. Также надо сказать, что MOBI в основном используется для создания книг для Amazon Kindle. Итоговый формат (с защитой от копирования, созданной Amazon) называется AZW. На мой взгляд, EPUB заметно лучше, так как у MOBI имеются определенные ограничения на форматирование.

PDF мощнее EPUB, в него можно встраивать анимацию, звук (хотя с выходом EPUB 3 это уже неважно); возможности форматирования практически неограничены. С другой стороны, PDF файлы обычно «тяжелее» EPUB, и многие е-инк ридеры справляются с их чтением заметно хуже. Главный же минус PDF — фактически, под каждый размер экрана необходимо создавать отдельный файл. Поэтому PDF нельзя назвать удачным форматом для хранения художественной литературы; а вот для литературы начной и учебной это очень даже неплохой вариант, хотя, опять же, готовящийся к выходу EPUB 3 будет, вероятно, еще лучше.

 

Мое мнение о формате EPUB

Мне формат EPUB нравится своей универсальностью, гибкостью, а также богатством возможностей форматирования книги, в частности — поддержкой формул и самых разных иллюстраций. Это отличный формат не только для художественной литературы, но и для учебной, и для научной (пока, правда, больше в перспективе).

 

Перспективы EPUB

Сейчас ведется активная работа над совершенствованием формата EPUB. Есть все основания утверждать, что в ближайшие годы он станет широко использоваться для создания и распространения учебных и научных книг. На сегодняшний же день, EPUB является, вероятно, самым удачным решением для хранения и распространения художественной литературы. Я думаю, что его популярность будет только расти — в том числе и в России. Перспективы формата, на мой взгляд, очень неплохие. 

 


 

2 Replies to “О формате EPUB”

  1. В Википедии достоверность информации не гарантированна, но с ошибками встречаюсь не часто. По ее данным ePub это на самом деле всего лишь контейнер, но содержать он может не только то, что вы описали — структурированный текст в XML, XHTML, но и банальные HTML или даже PDF.
    Так что ваше сравнение с последним в главе «Конкуренты формата» излишне.

    • Честно говоря, сомневаюсь, чтобы в контейнере EPUB могли находиться PDF-файлы. Это же совершенно другой формат, он и рядом не стоит с HTML/XHTML…
      Кстати, в англоязычной Википедии про то, что EPUB может содержать PDF, не говорится.