A
Alex Penguin
Гость
Как я делаю e-book. Часть 1
В последнее время мне достаточно часто задают вопрос - как я делаю
книги с таким хорошим качеством (насчет качества - это мнение пишущих).
Вот я, по возможности, подробно и описал весь процесс.
Итак.
1. Сканирую с помощью IrfanView (в нем есть функция пакетного
сканирования) в комплекте с родной оболочкой сканера. Можно, конечно,
использовать и встроенные средства FineReader-а, но я как-то привык к
ирфану. Кстати, для OCR вполне достаточно разрешения 300 точек. Это, к
тому же, ускоряет процесс сканирования. У меня выходит в среднем 30
секунд на разворот. Кроме того, перед началом пакетного сканирования
делаю несколько сканов с разными настройками яркости и контрастности
чтобы было меньше мусора и текст читался четко.
2. Определяю в каком формате буду делать книгу. Если много графики или
сложное форматирование с использование нестандартных шрифтов, то делаю
DjVu. Если же графики мало или она в черно-белом формате, то можно
делать PDF.
Вариант 1. Подготовка книги в PDF
- Загоняю отсканированное в FineReader и встроенными средствами
поворачиваю страницы, а затем разбиваю развороты на отдельные
страницы и запускаю анализ макетов всех страниц для автоматического
выравнивания текста по горизонтали. После этого для дальнейшей
обработки в фотошопе беру tiff-овские файлы из пакета FineReader-а и
перегоняю их тем же ирфаном в jpeg-формат (фотошоп не признает tiff-
овские файлы после FineReader-а).
- Делаю пустую стандартную страницу на основе отсканированных
(примерно по размеру обложки за минусом переплета).
- Открываю выдранные из FineReader-а страницы в фотошопе, вставляю их
в шаблонную страницу по центру и сохраняю вновь во временный каталог.
Делаю это для того чтобы после распознавания и сохранения текста в PDF
текст на страницах располагался по центру. Можно, конечно, отценровать
текст и впоследствии при редактировании в Adobe Acrobat-е, но я привык
к такому варианту (да и при использовании быстрых клавиш в
FineReader-е это получается все-таки несколько быстрее).
- Снова загоняю уже отредактированные страницы в FineReader. При этом
страницы окончательно поворачиваются "по курсу".
- Дальнейшая обработка идет в FineReader-е. Запускаю анализ макетов
страниц. После того корректирую макеты вручную (например, удаляю
мусор, принятый программой как текст, или заменяю формат блоков таблиц
на картинки - таблицы FineReader распознает хреновенько, а средств для
их редактирования практически нет).
- Следующий этап - распознавание текста и его проверка встроенными
средствами FineReader-а. После этого вручную редактирую шрифты и
размер заголовков, шапок и номеров страниц.
- После окончания редактирования сохраняю все в PDF.
- Следующий этап - вычитка в Acrobat Reader-е. Сильно не вчитываюсь -
в основном обращаю внимание на оформление. Если что-то нахожу,
исправляю в FineReader-е. После окончания вычитки снова сохраняю все
из в FineReader-а в PDF.
- Дальше открываю текст в Акробате. Дело в том, что при конвертации в
PDF FineReader зачастую неправильно расставляет интервалы между
буквами и словами и текст превращается "вабракадарбу,которуюневозмож-
ночитать". Эту проблему и устраняю, вручную задавая инервалы в
проблемных местах с использованием средств Акробата. Если при этом
дополнительно нахожу какие-либо ошибки в тексте или оформлении,
исправляю их в FineReader-е, сохраняю отдельные страницы в
pdf-формате и заменяю их в Акробате (мой "Акробат 6 про" не дает
возможности редактировать русский текст).
- Ну и последний этап - оптимизирую размер выходного файла с помощью
Акробата и, при желании, задаю ограничения на использование книги.
Хотя снять эти ограничения проще простого - программ для этого в
и-нете достаточно.
Вариант 2. Подготовка книги в DjVu
Это будет во второй части, т.к. пока окончательно не определился с
используемыми программами.
Надеюсь, столь замороченным описанием не отпугну желающих попробовать
себя в скане книг. Можно делать их и попроще, не обращая внимание на
мое стремление доводить все до идеала.
На последок:
"КОМФОРТНОГО И БЫСТРОГО СКАНА ВСЕМ!"
В последнее время мне достаточно часто задают вопрос - как я делаю
книги с таким хорошим качеством (насчет качества - это мнение пишущих).
Вот я, по возможности, подробно и описал весь процесс.
Итак.
1. Сканирую с помощью IrfanView (в нем есть функция пакетного
сканирования) в комплекте с родной оболочкой сканера. Можно, конечно,
использовать и встроенные средства FineReader-а, но я как-то привык к
ирфану. Кстати, для OCR вполне достаточно разрешения 300 точек. Это, к
тому же, ускоряет процесс сканирования. У меня выходит в среднем 30
секунд на разворот. Кроме того, перед началом пакетного сканирования
делаю несколько сканов с разными настройками яркости и контрастности
чтобы было меньше мусора и текст читался четко.
2. Определяю в каком формате буду делать книгу. Если много графики или
сложное форматирование с использование нестандартных шрифтов, то делаю
DjVu. Если же графики мало или она в черно-белом формате, то можно
делать PDF.
Вариант 1. Подготовка книги в PDF
- Загоняю отсканированное в FineReader и встроенными средствами
поворачиваю страницы, а затем разбиваю развороты на отдельные
страницы и запускаю анализ макетов всех страниц для автоматического
выравнивания текста по горизонтали. После этого для дальнейшей
обработки в фотошопе беру tiff-овские файлы из пакета FineReader-а и
перегоняю их тем же ирфаном в jpeg-формат (фотошоп не признает tiff-
овские файлы после FineReader-а).
- Делаю пустую стандартную страницу на основе отсканированных
(примерно по размеру обложки за минусом переплета).
- Открываю выдранные из FineReader-а страницы в фотошопе, вставляю их
в шаблонную страницу по центру и сохраняю вновь во временный каталог.
Делаю это для того чтобы после распознавания и сохранения текста в PDF
текст на страницах располагался по центру. Можно, конечно, отценровать
текст и впоследствии при редактировании в Adobe Acrobat-е, но я привык
к такому варианту (да и при использовании быстрых клавиш в
FineReader-е это получается все-таки несколько быстрее).
- Снова загоняю уже отредактированные страницы в FineReader. При этом
страницы окончательно поворачиваются "по курсу".
- Дальнейшая обработка идет в FineReader-е. Запускаю анализ макетов
страниц. После того корректирую макеты вручную (например, удаляю
мусор, принятый программой как текст, или заменяю формат блоков таблиц
на картинки - таблицы FineReader распознает хреновенько, а средств для
их редактирования практически нет).
- Следующий этап - распознавание текста и его проверка встроенными
средствами FineReader-а. После этого вручную редактирую шрифты и
размер заголовков, шапок и номеров страниц.
- После окончания редактирования сохраняю все в PDF.
- Следующий этап - вычитка в Acrobat Reader-е. Сильно не вчитываюсь -
в основном обращаю внимание на оформление. Если что-то нахожу,
исправляю в FineReader-е. После окончания вычитки снова сохраняю все
из в FineReader-а в PDF.
- Дальше открываю текст в Акробате. Дело в том, что при конвертации в
PDF FineReader зачастую неправильно расставляет интервалы между
буквами и словами и текст превращается "вабракадарбу,которуюневозмож-
ночитать". Эту проблему и устраняю, вручную задавая инервалы в
проблемных местах с использованием средств Акробата. Если при этом
дополнительно нахожу какие-либо ошибки в тексте или оформлении,
исправляю их в FineReader-е, сохраняю отдельные страницы в
pdf-формате и заменяю их в Акробате (мой "Акробат 6 про" не дает
возможности редактировать русский текст).
- Ну и последний этап - оптимизирую размер выходного файла с помощью
Акробата и, при желании, задаю ограничения на использование книги.
Хотя снять эти ограничения проще простого - программ для этого в
и-нете достаточно.
Вариант 2. Подготовка книги в DjVu
Это будет во второй части, т.к. пока окончательно не определился с
используемыми программами.
Надеюсь, столь замороченным описанием не отпугну желающих попробовать
себя в скане книг. Можно делать их и попроще, не обращая внимание на
мое стремление доводить все до идеала.
На последок:
"КОМФОРТНОГО И БЫСТРОГО СКАНА ВСЕМ!"