+7 (495) 956-79-28
Демо-версия клиента под BlackBerry
Версия для печати
Главная / Пресс-центр / Статьи и интервью / Создание хранилища образов электронных документов
Статьи и интервью

Создание хранилища образов электронных документов

02.06.2009

Одним из ценнейших активов в любой современной компании является информация, которая может быть представлена в разнообразных формах. Корпоративная документация имеет особую ценность, поскольку фиксирует не только опыт и знания, накопленные в организации за годы ее деятельности, но и является носителем свидетельств этой деятельности. Поэтому информационные системы, обеспечивающие задачи хранения и использования корпоративной документации, занимают особое место в структуре современного предприятия как с точки зрения получения максимальной отдачи от накопленных документов, так с точки зрения качественного исполнения требований государства-регулятора.

Системы управления корпоративным контентом (ECM) и более распространенные в России системы электронного документооборота (СЭД) должны поддерживать все этапы жизненного цикла управления документацией от создания проекта, обработки, регистрации, публикации документов и использования в текущей деятельности организации до передачи на архивное хранение и дальнейшее их уничтожение. В Российской Федерации процессы архивного дела должны быть подчинены требованиям как Федерального закона от 22.10.04 г. № 125- ФЗ «Об архивном деле в Российской Федерации», так и нормативной базы профильного регулятора – Всероссийского научно-исследовательского института документоведения и архивного дела (ВНИИДАД).

Закон № 125-ФЗ определяет архивный документ как материальный носитель с зафиксированной на нем информацией, который имеет реквизиты, позволяющие его идентифицировать, и подлежащий хранению в силу значимости указанных носителя и информации для граждан, общества и государства. Уже это определение дает некоторое понимание ситуации, а именно: как бы ни была спроектирована электронная архивная система, у нее всегда должна быть функция архивной картотеки, т.е. в нее должен быть заложен функционал каталога, обеспечивающий возможность автоматизации управления обычным материальным ведомственным архивом.

Очевидно, что такой подход, несмотря на красоту и удобство, не обеспечивает пользователя, во-первых, полнотекстовым поиском документов (очевидно, что найти документ по контенту в системе невозможно без размещения в ней указанного контента), во-вторых, возможностью, даже найдя документы, выдать их в пользование лицу, подготовившему соответствующий запрос. А ведь речь может идти о компании с высоким уровнем территориальной распределённости, где время фактического пути человека к архивному документу может занимать часы, а то и дни, тогда как лицу, подготовившему запрос, достаточно просто ознакомиться с архивным документом. Выдача оригинала в читальный зал, как и передача дела с документом на руки, в этой ситуации становится высокозатратным, а главное, ненужным занятием.

Решением обозначенных задач является создание информационной архивной системы в виде картотеки или каталога, регистрационно-контрольные карты (РКК) документов которого хранят не только атрибуты-метаданные, но и поисковый контент (распознанный индексированный текст документа) и его образ, защищенный от изменений, например, многостраничный TIFF или PDF.

Рассматривая автоматизацию архивного дела, нельзя обойти стороной общую архитектурную схему такой системы. Представляя современный подход к конструированию информационных систем – сервисно ориентированную архитектуру (SOA), - в рамках этой концепции можно представить структуру информационно-архивной системы следующим образом.

Серверная часть системы состоит из основания – системы управления базами данных, в задачу которой входит обеспечение надлежащего хранения данных архивной картотеки и самих хранилищ контента, а также первичного управления доступом к записям баз данных. Второй уровень системы составляет программную прослойку, обеспечивающую базовый функционал системы – криптографическое обеспечение подсистемы защиты информации, поддерживающую функционал электронной цифровой подписи (ЭЦП) и при необходимости криптографическую защиту информации, находящуюся в виде записей баз данных первого уровня.

Также на это уровне находятся служебные подсистемы, обеспечивающие такие процессы, как:

В структуре данной архивной системы необходимо рассмотреть ее верхнюю часть. В ней находятся сервисы – модули, имеющие разнообразный функционал, но характеризующиеся унифицированными программным интерфейсом, позволяющим использовать как функционал друг друга, так и функционал нижестоящий структур.

Сервисами в рассматриваемой системе будут являться:

Пополнение системы архивным контентом

Пополнение информационной архивной системы через импорт данных из других систем, например СЭД, сможет проходить по методике, близкой к оригинальной методике архивного дела с поправкой на то, что передаваемый в архив контент является электронным. Если же в СЭД зафиксированы документы (либо существуют их РКК, не содержащие контента), имеющие материальные аналоги в текущем делопроизводстве, то никаких проблем не возникает. Если же документы находятся в СЭД исключительно в электронном виде (документы, жизненный цикл которых полностью протекает в СЭД, материальных аналогов не имеющие) и не подходят под определение архивного документа, соответственно, в архив переданы быть не могут. Если же ценность таких документов признается достаточно высокой, то такие документы могут и должны быть сохранены в архивном фонде организации с некоторыми корректировками процесса: вследствие отсутствия материальных аналогов эти документы не проходят архивной обработки, при формировании дел из них не появляется разбиение дела по томам, а при размещении таких дел в архиве в системе устанавливается соответствующая пометка, извещающая о том, что документы этого дела не имеют топологического размещения в хранилище, соответственно и выдача документа по запросу может быть произведена исключительно в электронном виде путем временного предоставления доступа к хранилищу либо передачи формируемого образа документа в каком-либо стандартизованном формате, например в PDF. Остальные же процедуры полностью идентичны классическому архивному делопроизводству. Так, перед передачей дела в архив делопроизводитель подразделения должен проконтролировать полноту и соответствие его электронного аналога в СЭД фактическому материальному. В дальнейшем делопроизводитель производит архивную обработку материального дела, распечатывая формируемую системой внутреннюю опись его документов. Дальнейшее оформление (переплет, нумерация страниц и т.д.) может производиться в зависимости от особенностей непосредственно организационного документооборота.

По окончании подготовки дела к передаче в архив делопроизводитель извещает об этом систему, и архивариус организации получает уведомление о том, что дело или дела конкретного подразделения готовы к сдаче, сформирована сдаточная опись и можно запланировать фактическую передачу материальных дел с последующим их контролем и размещением в хранилищах, с дальнейшим вводом в систему их топологического расположения.

Процедурой, отличной от описанной, является другая модель ввода данных в информационную архивную систему – ретроспективный ввод. Эта модель подразумевает формирование фонда архивной системы исключительно за счет документов, уже переданных в архив и находящихся в нем.

Отдельным ответвлением обоих описанных методов формирования электронного архива является чисто методологический подход, при котором документы передаются в архив без их фиксации в сопряженной СЭД, а архивариус уже осуществляет их ретроспективный ввод в информационную архивную систему путем ручного либо потокового сканирования.

При ретроконверсии вся процедура ввода в архивную систему документов и дел осуществляется силами и на территории архивного подразделения. К примеру, архивариусом формируется дело, указываются его основные атрибуты (индекс, заголовок, шифр и т.д), в деле автоматически формируется внутренний документ - опись, задача которой прежде всего зафиксировать принадлежность совокупности РКК документов определенному конкретному делу. Очевидно, что такая система, существующая обычно исключительно в рамках подразделения фондов, не является общедоступной и служит только для оптимизации управления контентом ведомственного архива.

Таким образом, после ввода в систему информации о деле начинается его наполнение РКК документов с одновременным вводом атрибутов самого документа (дата создания, регистрационный номер, подразделения подписанта) и прикрепления к нему отсканированного образа и его распознанного контента, который в дальнейшем сможет обеспечить возможность функционирования в системе полнотекстового поиска. Описанная методика ввода документа называется ручным вводом вследствие большого количества более или менее трудоемких операций, производимых вручную.

Альтернативой ручному вводу является автоматизированный потоковый ввод документов. При потоковом вводе РКК документов создаются в системе либо заблаговременно, либо по заранее определяемым шаблонам. Созданные РКК индексируются, и полученные индексы наносятся посредством штрихкодирования непосредственно на документ либо распечатываются на клейких стикерах с дальнейшим их переносом стикеров со штрихкодированным индексом непосредственно на вводимые в систему документы. Дальнейшее скоростное сканирование архивных документов позволяет системе сразу ассоциировать образ документа и его РКК, а впоследствии, после того как пройдет автоматизированное распознавание образа, занимающее обычно значительно большее время, чем само сканирование, еще и добавить в РКК поисковый контент документа.

Следует остановиться на возможностях применяемого штрих-кодирования. Если ранее использовались более устаревшие технологии, позволявшие записать в одном коде около 100 байт данных, что ограничивало применение такого кодирования исключительно идентификацией документов при ретроконверсии (присвоение уникального номера, обеспечивавшего ассоциативную связь между сканируемым документом и его РКК); то современные методики штрихкодирования, например DataMatrix, Aztech, Tags, успешно применяемый в идентификации и акцизном учете PDF 417 позволяют кодировать до 2000 байт информации и более. Это дает возможность указывать в штрихкодировании сразу принадлежность документа к определенному делу, идентифицировать тома дел на стеллажах хранилищ, а также обеспечивать дополнительную конфиденциальность и надежность путем маркировки коробок с делами на стеллажах хранилищ.

В заключение рассмотрим модель иерархического хранения архивных данных. Концептуально модель такого хранения основывается на том, что из 90% запросов к архивным данным обращается всего 5% архивного контента, что предполагает размещение этих архивных данных, входящих в 5%, на скоростном накопителе, тогда как остальные данные могут быть сохранены на более емком, но более медленном накопителе типа Juke-Вox.

Вне зависимости от выбранной в качестве основания информационной архивной системы СУБД система иерархического хранения даст, с одной стороны, значительный прирост производительности при обработке поисковых запросов, с другой - значительно повысит надежность сохранения архивного контента путем регулярного сохранения срезовых состояний информационной архивной системы в специализированных накопителях.

В заключение отметим, что разработка информационной системы – электронного архива является процессом значительно более сложным и объемным, чем было рассмотрено здесь, но, учитывая, что процедуры архивного делопроизводства являются завершением цикла управления документами организации, невозможно преувеличить важность автоматизации архивного дела в целом и создания хранилищ архивного контента в частности. Как следствие, рынок СЭД России будет постоянно требовать такие решения и производители систем СЭД будут расширять функциональность своих продуктов.

 
Подписка на новости
Ваш E-mail
вернуться наверх