Шрифт:
Интервал:
Закладка:
При качественном сканировании никакой обрезки и чистки не требуется, можно запускать программу кодирования в djvu, для примера выбран Document Express Editor 6.0.1 Build 1259, в других версиях отличия незначительны.
Запускаем программу, щелкаем на меню "File" — "Open", в меню "Тип файлов" выбираем tif, если сканирование было именно в этом формате и открываем первый файл. Он будет отображен в главном окне, а также, в виде эскиза слева, щелкаем по эскизу правой мышкой и выбираем пункт "Insert Page(s) After" — Добавить страницу (страницы) после открытой.
В меню опять выбираем тип файлов tif, выделяем все файлы, которые нужно добавить после первой страницы (кроме первого, он уже открыт), начиная с последнего, это особенность всех djvu кодеров. Ждем их открытия, если файлов много, то это занимает некоторое время, в результате они появляются в виде колонки эскизов слева.
В меню "File" выбираем пункт "Save As… — Сохранить как…" или щелкаем по иконке на панели с аналогичной функцией. Появляется диалог сохранения и кодирования djvu файла:
Выбираем папку и имя файла для сохранения, тип файла djvu "Bundle/Indirect — Одним файлом/В виде отдельных страниц".
В пункте "Profile — Профиль" нужно установить тип кодирования изображения, для всех типов изображений подходит "Normal". Если затрудняетесь с выбором подходящего профиля, то либо предварительно попробуйте их по очереди на одном файле, либо сразу выбирайте "Normal", результаты будут вполне удовлетворительные. Для получения черно-белых изображений выбирается "Bitonal". В пункте DPI установите разрешение, с которым сканировали, не стоит выбирать его больше или меньше, это не имеет смысла. Затем устанавливаем параметр "Text Quality", от которого зависит качество текста на страницах файла djvu:
Обычно хорошие результаты дает aggressive, но если встречается мелкий текст или важно не потерять качество текста, то выбирается lossless — без потерь, хотя размер конечного файла будет несколько больше. Минимальные размеры файла с текстом дает lossy, но при невысоком разрешении и мелком тексте очень высока вероятность появления ошибок, когда путаются буквы "и" и "н", "а" и "в", "з" и "э" и т. д. Поэтому данный режим следует использовать с большой осторожностью. Если есть сомнения и затруднения в выборе, используйте lossless — лучше увеличенный размер файла, чем масса ошибок, которые потом не исправить.
Отметка в пункте "OCR" позволяет получить текстовый слой в djvu файле. Параметры OCR выбираются через меню "Edit-Preferences", закладка "OCR":
Здесь можно выбрать язык распознавания и уровень координат привязки word — слова или char — символы. К сожалению, возможность выбрать несколько языков распознавания заблокирована, а сам движок OCR оставляет желать лучшего по качеству распознавания текста. Применение программы FineReader дает неизмеримо лучшие результаты распознавания текста, но рассмотрение работы с ним и необходимых для этого утилит, выходит за рамки данной статьи[12].
Когда все параметры установлены, нажимается кнопка "Сохранить" и через некоторое время получаем файл djvu. Типичной ошибкой при конвертировании в djvu является излишнее количество цветов, поэтому не забывайте проверить, что получено в результате кодирования. Сделать это очень просто: щелкните правой мышью на изображении в программе просмотра djvu файла и выберите пункт со свойствами страницы. Если у вроде бы черно-белой страницы вы увидите приблизительно такие строчки:
DJVU Image (2355x3262, 300 dpi) version 25:
0,0 Kb 'INFO' Page information.
0,0 Kb 'INCL' Indirection chunk (020009_0001.djbz).
11,2 Kb 'Sjbz' JB2 foreground mask (2355x3262, 300 dpi)
0,0 Kb 'FGbz' JB2 foreground colors (1 color, 4084 ccs).
0,6 Kb 'BG44' IW44 background (785x1088, 100 dpi).
0,1 Kb 'BG44' IW44 background (part 2, 100 dpi).
0,0 Kb 'BG44' IW44 background (part 3, 100 dpi).
0,2 Kb 'BG44' IW44 background (part 4, 100 dpi).
Compression ratio: 1837,5 (12,2 Kb)
то это не черно-белое, а серое изображение, даже если указан всего один цвет. Помеченное серым совершенно напрасно увеличивает объем файла.
DJVU Image (3295x2539, 300 dpi) version 25:
0,0 Kb 'INFO' Page information.
0,0 Kb 'CIDa' Unrecognized chunk.
7,6 Kb 'Sjbz' JB2 foreground mask (3295x2539, 300 dpi).
Compression ratio: 3197,6 (7,7 Kb)
А если выглядит так, то все нормально, страница действительно черно-белая.
Если проводилось распознавание текста, то добавляется строка с информацией об этом:
DJVU Image (2126x2717, 600 dpi) version 25:
0,0 Kb 'INFO' Page information.
0,0 Kb 'INCL' Indirection chunk (shared_anno.iff).
0,0 Kb 'CIDa' Unrecognized chunk.
0,0 Kb 'INCL' Indirection chunk (sishkov_0010.djbz).
3,8 Kb 'Sjbz' JB2 foreground mask (2126x2717, 600 dpi).
0,5 Kb 'TXTz' Text (text, etc.).
Compression ratio: 3760,6 (4,5 Kb)
Заключительным этапом можно считать кодирование обложки и вставка ее после самой последней страницы. Для этого окно с предыдущими файлами сворачивается (но не закрывается!), открывается новое, вставляются файлы обложки, кодируются, затем щелчком правой мышки на эскизе выбирается пункт "Сору Page(s) — Копировать страницу (страницы)", то есть, берем страницу или страницы djvu в буфер обмена. Опять открываем первое окно, на последней странице щелкаем правой мышкой и выбираем пункт "Paste Page(s) After — Вставить страницу (страницы) после текущей". Обратите внимание на отличие в работе двух пунктов меню: "Insert Page(s) After" добавляет файлы из внешних источников, a "Paste Page(s) After" добавляет страницы из буфера обмена.
Как из готовой djvu книги в сером или цветном сделать черно-белый djvu, когда нужен только текст и небольшой объем файла? Это может понадобиться, если изначально был неправильно выбран режим сканирования, а потом кодирования. Сначала во вьюере, например, в WinDjVu, измените режим просмотра страниц на "Черно-Белый":
Затем просмотрите все страницы в режиме "Задний план", не исключено, что часть текста или отдельные буквы могут оказаться в фоне. Только в том случае, когда фон не несет никакой полезной информации, файл отправляется на печать в виртуальный принтер djvu: LizardTech Virtual Printer Pro, его установки кодирования изменяются именно под черно-белое изображение. Об этих установках еще будет сказано в пятой части статьи. Наглядный пример такой операции:
Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то ни было форме и какими