Шрифт:
Интервал:
Закладка:
Когда компания решила, что необходимо создать собственный цифровой архив, возникла необходимость в разработке процедур архивирования и наполнения архива цифровыми активами компании. Это было намного сложнее, чем может показаться на первый взгляд. Во-первых, объем книг был колоссальный – в таком большом издательстве со множеством импринтов, у которых была собственная длинная история публикаций, в продаже числилось 40 000–50 000 наименований. Кроме того, цифровой контент можно было использовать в разных целях. «Мы говорим о печати по требованию или об электронных книгах? Потому что это могут быть разные вещи. О чем идет речь – о переводе их в цифру, просто чтобы было, или о переводе в цифру того, что представляет непосредственную ценность? Хотите ли вы окупить вложенные в оцифровку средства сразу или это долгосрочные инвестиции? Начинаются вот такие вопросы. Но нашей отправной точкой и философией, которой мы пытаемся тут следовать, является то, что книга – это не книга. Книги – это категории. Книги – это типы. Книги – это разные стили. Так что нельзя просто сказать: „Пойди и оцифруй 20 000 книг“». Стив поясняет:
Если вы продолжаете думать о книгах как об объектах, вы думаете о бумажных книгах. На бумаге они все одинаковы – вот книга, для ее производства требуется дерево. Если ваш механизм доставки предназначен для доставки деревьев, вам конец. Если он предназначен для доставки цифровых товаров, надо иметь в виду, что они очень различны. Поэтому, когда начинается обсуждение бэк-листа, встает вопрос: «Какова ваша цель? Каковы параметры? Чего вы хотите и о какого типа книге идет речь?» Это гораздо сложнее. Люди всегда надеялись, что цифровой мир будет проще, а на самом деле все намного сложнее, потому что ваш конечный результат другой. Конечный результат – это база данных, конечный результат – это PDF, это PDF с изображениями, это файл XML, это набор инструментов для рекламы, для поисковой системы Google – у нас гораздо больше цифровых активов, чем в случае бумажной книги. Сейчас у нас есть семь физических активов: крупноформатные издания, издания для массового рынка, издания в твердом переплете, издания в мягкой обложке, какие-то странные сборники и т. д. В онлайне у нас есть контент для рекламы, контент для виджетов, контент для электронных книг, контент для подписок, фрагментированный контент – сотни форматов, типов, стилей. Так что цифровой мир намного больше, чем бумажный. Поэтому, когда вы говорите: «О, давайте оцифруем весь бэк-лист» – что это значит? Вы что, хотите оцифровать кулинарные книги? Вы хотите, чтобы мы оцифровали книги, которых сейчас нет в наличии? Вы хотите, чтобы мы оцифровали книги, которые вышли из продажи? Вы хотите, чтобы мы оцифровали только 10 000 самых продающихся книг? Мы обсудили это. Мы сошлись на 10 000 самых продаваемых книг всех времен считая от текущего года – давайте оцифруем их и решим, как сделать их доступными. Это был эксперимент с бэк-листом.
Каждая из этих 10 000 самых продаваемых книг была отправлена на сканирование и превращена в файл XML с использованием программы для OCR (Optical Character Recognition). Это было дороже, чем просто создать файл PDF: превратить книгу среднего размера в файл XML стоило 200 долларов, тогда как создать PDF с помощью простого сканирования – примерно 50 долларов. PDF отлично подходит для печати по требованию, но он менее адаптируемый, его нельзя использовать для вывода электронных книг и он представляет собой файл гораздо большего размера, который, следовательно, дороже хранить.
К 10 000 наименований из бэк-листа они добавили около 4000 новых изданий, которые выпускались каждый год, так что к 2008 году у них был цифровой архив, содержащий около 40 000 книг. Помимо наполнения архива, им необходимо было разработать процедуру обработки контента. Она включала три разных процесса: «управление цифровыми активами», «цифровое преобразование» и «цифровое распространение». Стив вытащил чистый лист бумаги и набросал схему (см. рис. 14). С левой стороны рисунка находятся различные производственные отделы компании, которые создают новые книги и добавляют их в виде цифровых файлов в систему Digital Asset Management (DAM) – архив компании. То, что происходит в производственных отделах, зависит от их рабочих процессов и желаемой степени сложности файлов, – например, если они хотят сделать разметку XML, это происходит там. Когда файлы готовы, они выгружаются в DAM, архив, в котором хранятся файлы разных типов – Quark, InDesign, PDF, XML и т. д. – для каждой книги. Файлы для каждой книги хранятся под одним ISBN, обычно ISBN издания в твердом переплете, поэтому есть четыре-пять разных файлов для одной и той же книги. Это сразу создает уровень сложности, которым нужно тщательно управлять. Так, например, если вы хотите внести правку в определенную страницу определенной книги, вы должны убедиться, что у вас есть процедуры, гарантирующие, что правка будет внесена до того, как книга будет допечатана, независимо от того, какое издание будет допечатываться. «Главное – корректность файла для печати, – объясняет Стив. – Основная задача архива, которую он должен выполнять без сбоев, – всегда иметь правильную версию файла для печати. Это золотое правило, которое нельзя нарушать».
Рис. 14. Цифровой архив
Задача может показаться достаточно простой, но при ее выполнении легко допустить промах. Например, предположим, что у одного из импринтов есть книга, которая хорошо продается, и им нужно быстро ее допечатать, но они обнаруживают, что у них поврежден шрифт на странице 90. Работники типографии говорят, что могут это исправить, им отвечают: «Отлично, исправьте, потому что нам нужен тираж как можно скорее». «Они перезванивают, говорят, что исправили. Прекрасно, процесс пошел, мы говорим: „Слава богу“. Но этот файл больше не синхронизирован с моими цифровыми файлами. Попросили ли мы прислать исправленный файл? Нет. Мы просто ждем, пока та же самая проблема возникнет при допечатке? Производственная ошибка – хуже всего, точка. Если что-то не работает, или ломается, или идет в печать с ошибкой, нет никаких сомнений, что это нужно немедленно исправить. Проблема в восстановлении файла – нам нужен файл обратно. Об этом просто забывают». Теперь файл в типографии отличается от файла, хранящегося в цифровом архиве, и издательство не знает, каким образом файл был изменен для исправления ошибки. Проблема может повториться в следующий раз, когда книга будет допечатываться. Целостность файлов в архиве была нарушена вследствие необходимости решить производственную проблему и быстро допечатать книгу.
Заставить сотрудников различных издательских