Авторизация

Главная > НАРБ в прессе > Опыт создания и использования цифровых копий большеформатных документов

Опыт создания и использования цифровых копий большеформатных документов

Михеенок Т.С.,

зав. отделом автоматизированных архивных технологий

 

Документы большого формата есть в каждом архиве. Чаще всего это картографические материалы, научно-техническая документация, газеты, плакаты, а также другие документы самой разнообразной тематики. Такие документы требуют индивидуального подхода уже при организации их хранения в архиве. Специально изготавливаются стеллажи и коробки для большеформатных документов. Для удобной и безопасной работы с оригиналами требуются большие столы. Из-за своих размеров эти документы часто не имеют страхового фонда и фонда пользования, либо сняты частями, что приводит к неудобству, а в некоторых случаях – практически к невозможности их использования. Два республиканских архива – Национальный исторический архив Беларуси (НИАБ) и Национальный архив Республики Беларусь (НАРБ) – имеют опыт по созданию цифровых копий большеформатных документов, а также по организации их использования.

Первое оборудование, позволяющее изготавливать цифровые копии большого формата, появилось в отрасли в Белорусском научно-исследовательском центре электронной документации (БелНИЦЭД). В конце 2008 года БелНИЦЭД предоставил НИАБ возможность использовать книжные сканеры ЭЛАР ПланСкан формата А2 и BOOK EYE 3 формата А1 для оцифровывания своих документов. НИАБ отобрал небольшой по объему комплекс особо ценных документов – всего 30 дел (2805 листов) фонда № 319 «Минское дворянское депутатское собрание», опись 1 с цветными изображениями генеалогических древ и гербов дворянских родов Минской губернии. Из указанных документов 21 единица хранения является генеалогическими таблицами. Основной массив из них в картонных обложках размером 45 х 50 см, причем сами документы, подшитые в делах, имеют разный размер. Многие генеалогические таблицы хранятся сложенными и в развернутом виде значительно превышают размеры обложки и в ширину, и в длину. Оставшиеся 9 дел представляют собой фрагменты родословных книг, состоящих из отдельных листов размером 36 х 52 см. Такой лист составлял половину оригинального документа. Интересно, что эти документы поступили в НИАБ из государственного архива Минской области, где были обнаружены в результате переработки фондов бывшего Центрального партийного архива Компартии Белоруссии. Плотная бумага генеалогических документов была использована в качестве обложек для дел Минского обкома КПБ. Служба в таком качестве наложила на внешний вид документов заметный отпечаток: листы изношены в местах сгибов, имеют написанные чернилами заголовки и другие посторонние пометки. Нужно отметить, что в фонде № 319 имеются и другие генеалогические таблицы, которые не были оцифрованы, что объясняется их небольшими размерами и неплохой сохранностью.

В НАРБ в конце 2008 года были запущены в эксплуатацию большеформатные книжные сканеры Zeutschel Omniscan 10000, после чего началась активная работа по созданию фонда пользования в цифровом формате. В первую очередь для оцифровывания были отобраны интенсивно используемые документы фонда № 1450 «Белорусский штаб партизанского движения», опись 5. Это списки личного состава партизанских формирований, спецгрупп и спецотрядов органов госбезопасности, подпольных групп и организаций, радистов, героев Советского Союза и др. за 1941–1944 годы  – всего 509 дел (более 72 000 листов). Комплекс этих документов нельзя полностью отнести к большеформатным документам. Но их особенность в огромном разнообразии размеров документов внутри одного дела, среди которых встречаются и документы большого формата. Чаще всего носителями таких документов являются карты, плакаты, альбомы для черчения или обои.

Критериями для выбора указанных комплексов документов для оцифровывания в обоих случаях стали: их ценность и востребованность исследователями, неудовлетворительное физическое состояние, а также отсутствие страхового фонда и фонда пользования.

Генеалогические таблицы были составлены в 1798–1812 годах для представления в Минское дворянское депутатское собрание вместе с другими доказательствами рода на дворянство. Они используются при изучении дворянских родословных, являются дополнением к текстам протоколов заседаний дворянского депутатского собрания, с их помощью легко отображаются родственные связи. Рисунки отличаются большим разнообразием: от простых шаблонных схем до шикарных художественно оформленных деревьев. Для специалистов по геральдике интерес представляют исторические рисунки гербов. Например, изображения гербов именно из генеалогических таблиц вошли во 2-й том «Гербовника белорусской шляхты», изданный НИАБ.

Физическое состояние этих документов неудовлетворительное: листы повреждены плесенью, измяты, с изорванными и истрепанными краями, изношенные в местах изгибов. Часто лист с генеалогической таблицей вшит в дело за середину, поэтому повреждена ее центральная часть, где изображены ствол дерева, родоначальник и прямые потомки. Некоторые документы сохранились во фрагментах. Из-за своего физического состояния документы в последнее время были практически недоступны исследователям. Согласно листов использования генеалогические таблицы после 2000 г. в читальный зал не выдавались, единичные дела изредка использовались лишь сотрудникам архива. А вышеописанные фрагменты родословных книг вообще не были доступны исследователям.

Документы НАРБ моложе более чем на 100 лет, однако их физическое состояние также далеко от идеального, и они нуждаются в принятии срочных мер по обеспечению их сохранности. Это объясняется экстремальными военными условиями, в которых они возникли и первоначально хранились. При их создании очевиден дефицит бумаги и средств письма. Использовались практически любые носители – школьные тетради, альбомы для рисования, карты, калька, незаполненные бланки других документов, обои, агитационные плакаты и др. Понятно, что ничего из вышеперечисленных бумаг не предназначалось для долговременного хранения. Такое же многообразие наблюдается и в средствах письма – чернила, простые и цветные карандаши, слабо различимая машинопись. Поэтому в указанных документах большое количество слабоконтрастного, плохочитаемого текста. Кроме этого многие списки повреждены водой, листы измяты, разорваны, особенно в начале и в конце дела, текст истерт по краям документа. В связи с этим в последние годы использование указанного комплекса пользователями читального зала было существенно ограничено.

В обоих случаях цифровые копии изготовлены на книжных сканерах формата А1. Отдельные генеалогические таблицы были такого большого размера, что, несмотря на формат сканера, документ приходилось делить на 4, а иногда даже на 8 частей. После окончания сканирования такие копии для удобства последующего использования были соединены в единое изображение средствами графического редактора Adobe Photoshop. Самые большие документы НАРБ разделены на 2 части. Необходимости в объединении их в единый файл не было, т.к. второй фрагмент является просто продолжением списка.

Использование книжных сканеров позволяет более бережно относиться к документам. Во-первых, документ не нужно переворачивать как для планшетного сканера или ксерокопировального аппарата, что позволяет избежать возможных повреждений дела, таких как отрыв обложки, выпадение листов, разлом переплета. Во-вторых, размещение документа «лицом вверх» позволяет оценить его расположение без проведения предварительного сканирования, и работа с ним приближена к обычному просмотру.

Наиболее важными качествами современных книжных сканеров является сведение к минимуму теплового и светового воздействия излучения на оригинал, что особенного важно для архивных документов. Отсутствует ультрафиолетовая составляющая излучения, способная вызывать угасание текстов и пожелтение бумаги. Достоинством сканеров Zeutschel и BOOK EYE 3 является то обстоятельство, что освещение активируется только на время сканирования.

Производители книжных сканеров постарались максимально уменьшить физические нагрузки на оператора. Все усилия сводятся к перелистыванию страниц и нажатию педалей, управляющих мотором. В сканере Zeutschel после окончания сканирования автоматически поднимается стекло, что делает работу с ним более удобной.

Многофункциональное специализированное программное обеспечение позволяет улучшать качество получаемых изображения путем применения различных встроенных фильтров.

Целью создания фонда пользования в любом формате является получение полноценной качественной копии, способной при необходимости заменить оригинал. Для этого важным оказывается подход к работе с документами. Например, руководством НИАБ было принято решение не расшивать дела, что в данном случае объясняется отсутствием в архиве переплетной мастерской. Это значительно усложнило работу и в некоторых случаях не позволило получить идеальную копию. Толстый корешок дела и нестандартные размеры документов не позволяли добиться полного прижатия оригинала к стеклу. Иногда в переплет «уходили» фрагменты текста или рисунка, части документа возле переплета затемнялись тенью. Хотя желание сохранить оригинальный переплет для исторических документов часто является вполне обоснованным.

В НАРБ для получения максимального качества цифровой копии было принято решение расшивать при необходимости документы. Это значительно облегчило работу и исключило случаи, когда особенности переплета не позволяют оптимально разместить документ на сканере. Например, плотно сшитые документы, в которых текст закрывается переплетом или искажается изгибом листа, были расшиты, выровнены стеклом и оцифрованы полистно. Такая технология работы также позволила увеличить скорость сканирования, поскольку размеры оборудования и возможности программного обеспечения позволяют размещать на столе и оцифровывать одновременно несколько листов. Копии некоторых большеформатных документов без расшивки вообще невозможно было бы изготовить, поскольку конструкция имеющегося сканера ограничивает рабочее пространство столом, а крепления  стекла не позволяют разложить большеформатный документ с открытой обложкой.

Однако следует понимать, что для получения идеальной копии, одной расшивки недостаточно. Многим документам нужны ремонт, реставрация, выравнивание под прессом и только затем полистное оцифровывание. В условиях отдельного архива это зачастую невозможно из-за отсутствия необходимых оборудования, материалов и специалистов-реставраторов. Полный цикл работ по реставрации и оцифровыванию в Беларуси выполняется только Республиканской технической лабораторией микрофильмирования страхового фонда документации в Гомеле.

Оптимальными параметрами для получения качественного изображения в обоих случаях признаны разрешение 300 dpi, формат JPEG с минимальным сжатием (10–20%). Средний размер копии генеалогической таблицы в этих условиях получался около 10–15 мегабайт. При попытке организации использования изготовленных документов НИАБ столкнулся со следующими трудностями. Открытие файла указанного размера на маломощном компьютере занимало около минуты. Поэтому просмотр дела из нескольких сотен листов становился достаточно утомительным и явно проигрывал традиционному просмотру оригинала. Первым шагом для решения указанной проблемы является создание пользовательской копии с экранным разрешением. Следующим и наиболее эффективным шагом является создание научно-справочного аппарата (НСА) к документам. НИАБ создана база данных, состоящая из следующих полей: фамилия и название герба (на русском и польском языках), дата признания рода в дворянстве, архивный шифр. Таким образом, для оптимального пользования цифровыми копиями генеалогических таблиц необходимо изначально проверить базу данных, а затем просмотреть копии только необходимых листов.

Значительный объем цифровых копий вышеописанных документов НАРБ изготовлен в 2009 году, и в конце года первые дела были выданы пользователям в читальный зал. Просматривать документы с большим разнообразием форматов на экране монитора также оказалось не совсем удобным. Это связано с тем, что разный размер листа и текста приводит к необходимости в некоторых увеличивать изображение. И пользователю приходится то просто листать копии, то увеличивать изображение и просматривать его частями.

НСА к делам со спискам партизанских формирований имеется. В первую очередь поиск осуществляется по описи – по названиям партизанских формирований. Электронный вариант описи 5 фонда № 1450 доступен всем сотрудникам архива и исследователям в читальном зале, а также выставлен на официальном сайте НАРБ в разделе «НСА». Для поиска по фамилии необходимо создание базы данных. В настоящее время в архиве имеется картотека, составленная Центральным партийным архивом. Однако в процессе использования, возможно, во время реставрации, проводившейся в 1950-х годах, некоторые листы были утрачены, поэтому в настоящее время имеются небольшие несоответствия в нумерации листов между данными картотеки и оригиналами. В таких условиях для автоматизации поиска необходимо организовать не только перевод картотеки в электронный вид, но и ее сверку с документами.

Как пример создания и организации широкого многопользовательского доступа к цифровым копиям документов можно назвать обобщенный банк данных (ОБД) «Мемориал», реализованный под эгидой Министерства обороны Российской Федерации. На сегодняшний день в ОБД  представлено: 9,8 млн. цифровых копий документов Центрального архива Министерства обороны о безвозвратных потерях периода Великой Отечественной войны, свыше 30 000 паспортов существующих мест воинских захоронений, а также другие архивные документы (похоронки, трофейные карточки советских военнопленных, документы госпиталей и др.). Всего в ОБД значится около 20 млн. записей. Удобная информационно-аналитическая система обеспечивает оперативный поиск по ключевым полям, позволяющим идентифицировать личность, а дополнительную информацию можно почерпнуть непосредственно из копии документа, причем пользователю не нужно даже читать весь лист, чтобы обнаружить искомую запись – она выделяется цветом.

Не следует забывать, что успешность, масштабность и краткие сроки исполнения этого проекта связаны с привлечением специализированной организации – корпорации «Электронный архив», имеющей многолетний опыт по созданию электронных ресурсов и массовому оцифровыванию документов. В работе над проектом ОБД «Мемориал» было задействовано более сотни сканеров различного типа, столько же операторов для сканирования и ретроконверсии, а также разработана специализированная информационно-поисковая система. На этом фоне усилия отдельных архивных учреждений Беларуси выглядят скромными и недостаточными даже при обеспечении 100% загрузки имеющегося оборудования.

С другой стороны, работа белорусских архивов по оцифровыванию вносит дополнительный вклад в процесс создания фонда пользования документов Национального архивного фонда, который традиционно является одним из актуальных направлений обеспечения сохранности. Рассмотренный опыт подтверждает, что даже без широкомасштабного оцифровывания можно ощутить эффективность данного вида работы. Исследователи получают ранее недоступные документы, а оригиналы при этом остаются в оптимальных условиях в архивохранилищах. В такой ситуации особую важность приобретает выбор документов для оцифровывания. Архивисты должны оценить информационную значимость документов, степень их использования и физическое состояние. Дополнительные ограничения накладывают возможности имеющегося оборудования.

Документы готовятся к оцифровыванию так же, как и для микрофильмирования. Очень важно, чтобы в листе-заверителе нашли отражение все особенности нумерации, наличие чистых листов, а также затухающего и слабоконтрастного текста. Дела, нуждающиеся в ремонте или реставрации, должны поступить на копирование после проведения специальной обработки. Не следует относиться к сканированию как к механическому процессу, связанному с переворачиванием листов и нажатием кнопок. Для получения качественной копии необходимо изучить возможности оборудования и программного обеспечения, выбрать параметры оцифровывания и форматы для хранения данных. Бездумная работа оператора может привести к потере части информации или неудобству пользования копиями документов.

Заключительным этапом является создание НСА к оцифрованным документам, наличие которого позволяет не только ускорить, но и повысить качество поиска информации. Выдача цифровых копий сотрудникам архива и пользователям читального зала затрагивает вопросы обеспечения сохранности информации, которые решаются в каждом учреждении индивидуально в зависимости от его технического оснащения.

220114, г. Минск,
пр-т Независимости, 116
Читальный зал: тел. (017) 351-05-12
Приемная: тел/факс (017) 272-67-78
Отдел использования документов и информации: тел. (017) 272-29-52
narb@narb.by