сетевые сервисы web 2

5

Click here to load reader

Upload: elena-bolgarina

Post on 15-Apr-2017

97 views

Category:

Education


0 download

TRANSCRIPT

Page 1: сетевые сервисы Web 2

Сетевые сервисы web 2.0

Создание электронных книг онлайн

1. Понятие электронных книг

В последние годы электронные книги стали популярным трендом как среди любителей

информационных новинок, так и среди обычных читателей. Это очередной этап развития

книг. Уже никого не удивляют люди на улицах, в метро, кафе и других общественных

местах, читающие с планшетов, ридеров и телефонов.

Естественно, что каждое устройство поддерживает определённый набор форматов

электронных книг, которые может «прочесть» или распознать.

До недавнего времени электронные книги существовали только в программной

интерпретации, во всевозможных форматах, как обычных (например, .txt, .doc, .htm, .chm,

.pdf, .rtf, .djvu), так и специфических (например, .fb2). Некоторые файлы электронных

книг созданы, как самостоятельные приложения, в формате исполняемых exe-файлов.

Рассмотрим некоторые форматы электронных книг и их достоинства и недостатки.

Наиболее распространённые типы файлов

Формат Назначение Кроссплатформенность

Способ

создания

книги

Недостатки

PDF

Формат

пригоден для

создания книг,

буклетов и т. д.

с высоким

качеством

изображений

Да

Текстовый

редактор MS

Word,

специальное

ПО

Слишком

большой размер

DJVU

Открытый

формат

подходит для

хранения

сканов прессы

и книг, где не

требуется

высокое

качество

изображений

или где трудно

распознать

текст

Да, при наличии

специального ПО Конвертер

Не всегда

высокое

качество

результата

DOC

Подходит как

для создания

текста “с

нуля”, так и

для

размещения

готовой

Нет. Только Windows.

Unix и JAVA (при

наличии ПО

(конвертер))

Текстовый

редактор MS

Word

Большой

размер, не

слишком

удобный

просмотр

Page 2: сетевые сервисы Web 2

информации

(графической

или текстовой)

RTF

Отображает

размеченную

текстовую и

графическую

информацию

(до 256 цветов)

Да

Текстовый

редактор

(Word,

OpenOffice)

Не очень

качественное

отображение

графики

HTML

Язык

гипертекстовой

разметки,

который

подходит для

отображения

любого текста

и графики

Да

Текстовый

редактор

или HTML-

редактор

Нужны навыки

работы,

небольшие

возможности

форматирования

FB2

Основан на

XML, служит

для

отображения

любого текста

или графики,

легко создается

из DJVU и

HTML формата

Да, при наличии ПО

Специальное

приложение

или

конвертер

Не всегда

корректное

отображение

некоторых

символов и

таблиц

EXE

Компилируется

на основе

HTML и

позволяет

создавать

книги с самым

разнообразным

контентом

Нет, только Windows

Специальное

приложение-

компилятор

Поддержка

формата только

семейством

Windows

CHM

Чаще всего

используется

для создания

файлов

справки к

программе,

компилируется

на основе

HTML

Да, для Windows,

остальные — при

наличии специального

ПО

Специальное

приложение

или

конвертер

Поддержка

формата только

семейством

Windows

JAVA

Используется

для чтения

книг на

мобильных

телефонах,

КПК и т. п.

устройствах

Нет Конвертер

Не всегда

корректное

отображение

некоторых

символов и

изображений

Page 3: сетевые сервисы Web 2

Разные форматы используются для разных типов литературы. Для художественных

текстов чаще используются форматы EPUB, FB2 или MOB, а для научной, технической и

учебной литературы - PDF, DJVU, DOC (DOCX). Рассмотрим, с чем это связано. .

2. Художественная литература

К специализированным форматам, предназначенным именно для художественной

литературы, относятся EPUB, MOBI, FB2 (и его разновидность FB2.ZIP). Данные

форматы основаны на так называемой «плавающей верстке», которая позволяет менять

размер, гарнитуру шрифта, величину межстрочного интервала и ширину полей. При этом

данные форматы поддерживают картинки, таблицы, автоматически создаваемое

оглавление, сноски и многое другое.

Разумеется, есть определенные различия между данными форматами, но для рядовых

читателей они несущественны. Хотя стоит отметить, что в русскоязычном интернете

больше всего книг в FB2, в EPUB — уже меньше, а в MOBI — еще меньше.

3. Научная, техническая и учебная литературы

Подобная литература обычно распространяется в форматах PDF, DJVU, DOC (DOCX),

каждый из которых, имеет определенные недостатки. Бывают ситуации, что некоторые

книги доступны только в одном формате, а подчас — и только в одной версии.

Page 4: сетевые сервисы Web 2

Формат DOC хорошо подходит для чтения книг с компьютера. Но другие устройства для

чтения могут отображать его некорректно, исключая ряд иллюстраций, таблицы, формулы

и прочее или же отображать текст как картинку: элементы оформления показываются, но

нельзя менять размер и гарнитуру шрифта, что на маленьком экране очень затрудняет

чтение.

Формат файла PDF (от англ. Portable Document Format - переносимый формат

документов) - предназначен для представления в электронном виде различных

документов с полным сохранением форматирования (какой вид имеет документ при

создании, так он и будет отображаться).

Данный формат был разработан компанией Adobe и предназначался для отображения

полиграфической продукции, различных глянцевых журналов и периодических изданий.

PDF файл, после создания, не может быть отредактирован, так изначально задумано

разработчиками.

Сегодня формат PDF является незаменимым инструментом при создании и ведении

документации, создании иллюстрированных электронных книг, хранении различной

технической информации.

Есть три варианта этого формата: текстовый, графический («картиночный») и

графический («картиночный») с OCR-слоем.

* OCR (оптическое распознавание символов) – это технология, которая позволяет

преобразовывать цифровые изображения и PDF-файлы в электронные текстовые

документы для удобного редактирования, копирования, поиска и хранения в электронном

архиве.

Первый вариант наиболее предпочтителен: он может содержать все элементы

форматирования, а текст остается масштабируемым. В случае же с графическим PDF

текст является просто картинкой, которую можно увеличивать только целиком; размер

шрифта изменению не подлежит. На устройствах с маленькими экранами графические

PDF читать поэтому очень затруднительно.

Иногда на страницы графических PDF накладывается OCR-слой при помощи программы

распознавания текста. В книге PDF с OCR-слоем можно проводить поиск,

использовать словарь. Это вариант неплохой. Но, опять же, не все устройства для чтения

этот OCR-слой «видят». Да и увеличить размер шрифта он не позволяет. Поэтому OCR-

слой часто оказывается бесполезным.

Page 5: сетевые сервисы Web 2

Формат DJVU в целом напоминает графический PDF: обычно это просто набор сканов

или фотографий бумажной книги. Качество этих сканов/фото может быть просто

ужасным, а может быть и вполне приличным. Иногда на сканы/фото накладывается OCR-

слой при помощи программы распознавания текста. В книге DJVU с OCR-слоем можно

проводить поиск, использовать словарь. Это вариант неплохой. Но, опять же, не все

устройства для чтения этот OCR-слой «видят», да и размер шрифта он увеличить не

позволит. Поэтому частенько OCR-слой бывает практически бесполезен.

4. Документы, таблицы и презентации

Многие документы, таблицы и презентации распространяется в форматах MS Office:

DOC/DOCX, XLS/XLSX, PPT/PPTX. Это форматы очень функциональные, но, к

сожалению, довольно «громоздкие» и весьма «закрытые» (иными словами, сторонним

разработчикам довольно сложно создать программу для чтения файлов в данных

форматах). Поэтому некоторые устройства их не поддерживают. По этой причине, следует

переводить документы в PDF.

5. Зачем уметь создавать электронные книги?

Умение создавать электронные книги может оказаться очень актуальным в следующих

ситуациях:

у вас возникла необходимость издать свою научную или художественную работу

(большинство типографий работают с форматом PDF);

вы обладаете книгой, которой хотели бы поделиться с друзьями, коллегами или миром

вообще, но она в бумажном варианте;

вы решили заняться информационным бизнесом и стремитесь привлечь внимание к

своему сайту;

вы любите читать, у вас есть ридер и вы хотели бы читать книги, которые правильно

отображаются;

в Интернете можно заработать на распространении электронных книг;

в электронных книгах значительно легче защитить контент от копирования;

хранение информации в электронных книгах может оказаться незаменимым, если нет не

всегда есть возможность обратиться к сети Интернет.

Вопросы для самоконтроля

1. Для чего предназначен формат PDF?

2. Для какой литературы (художественная, научная или другие документы) применяется

формат EPUB?

3. Что такое OCR-слой и зачем он используется?