+7 (495) 956-79-28
ГлавнаяПресс - центрСтатьи и интервьюСоздание хранилища образов электронных документов

Создание хранилища образов электронных документов

Одним из ценнейших активов в любой современной компании является информация, которая может быть представлена в разнообразных формах. Корпоративная документация имеет особую ценность, поскольку фиксирует не только опыт и знания, накопленные в организации за годы ее деятельности, но и является носителем свидетельств этой деятельности. Поэтому информационные системы, обеспечивающие задачи хранения и использования корпоративной документации, занимают особое место в структуре современного предприятия как с точки зрения получения максимальной отдачи от накопленных документов, так с точки зрения качественного исполнения требований государства-регулятора.

Системы управления корпоративным контентом (ECM) и более распространенные в России системы электронного документооборота (СЭД) должны поддерживать все этапы жизненного цикла управления документацией от создания проекта, обработки, регистрации, публикации документов и использования в текущей деятельности организации до передачи на архивное хранение и дальнейшее их уничтожение. В Российской Федерации процессы архивного дела должны быть подчинены требованиям как Федерального закона от 22.10.04 г. № 125- ФЗ «Об архивном деле в Российской Федерации», так и нормативной базы профильного регулятора – Всероссийского научно-исследовательского института документоведения и архивного дела (ВНИИДАД).

Закон № 125-ФЗ определяет архивный документ как материальный носитель с зафиксированной на нем информацией, который имеет реквизиты, позволяющие его идентифицировать, и подлежащий хранению в силу значимости указанных носителя и информации для граждан, общества и государства. Уже это определение дает некоторое понимание ситуации, а именно: как бы ни была спроектирована электронная архивная система, у нее всегда должна быть функция архивной картотеки, т.е. в нее должен быть заложен функционал каталога, обеспечивающий возможность автоматизации управления обычным материальным ведомственным архивом.

Очевидно, что такой подход, несмотря на красоту и удобство, не обеспечивает пользователя, во-первых, полнотекстовым поиском документов (очевидно, что найти документ по контенту в системе невозможно без размещения в ней указанного контента), во-вторых, возможностью, даже найдя документы, выдать их в пользование лицу, подготовившему соответствующий запрос. А ведь речь может идти о компании с высоким уровнем территориальной распределённости, где время фактического пути человека к архивному документу может занимать часы, а то и дни, тогда как лицу, подготовившему запрос, достаточно просто ознакомиться с архивным документом. Выдача оригинала в читальный зал, как и передача дела с документом на руки, в этой ситуации становится высокозатратным, а главное, ненужным занятием.

Решением обозначенных задач является создание информационной архивной системы в виде картотеки или каталога, регистрационно-контрольные карты (РКК) документов которого хранят не только атрибуты-метаданные, но и поисковый контент (распознанный индексированный текст документа) и его образ, защищенный от изменений, например, многостраничный TIFF или PDF.

Рассматривая автоматизацию архивного дела, нельзя обойти стороной общую архитектурную схему такой системы. Представляя современный подход к конструированию информационных систем – сервисно ориентированную архитектуру (SOA), - в рамках этой концепции можно представить структуру информационно-архивной системы следующим образом.

Серверная часть системы состоит из основания – системы управления базами данных, в задачу которой входит обеспечение надлежащего хранения данных архивной картотеки и самих хранилищ контента, а также первичного управления доступом к записям баз данных. Второй уровень системы составляет программную прослойку, обеспечивающую базовый функционал системы – криптографическое обеспечение подсистемы защиты информации, поддерживающую функционал электронной цифровой подписи (ЭЦП) и при необходимости криптографическую защиту информации, находящуюся в виде записей баз данных первого уровня.

Также на это уровне находятся служебные подсистемы, обеспечивающие такие процессы, как:

  • хранение и управление аутентификацией пользователей;

  • управление структурой организации и присущих пользователям системы прав;

  • поддержка различных типов клиентских приложений (такой подход дает возможность не только поддерживать различные типы приложений, но и создавать приложения под разные клиентские платформы, в том числе и кросс-платформенные решения, например, когда частичный функционал системы может быть вынесен в виде web-приложения, ориентированного на работу с универсальными кросс-платформенными браузерами типа Mozilla Firefox, Google Chrome, Apple Safari, Opera);

  • создание решения для мобильных платформ, использующих, к примеру, открытую систему рендеринга интернет-страниц WebKit.

В структуре данной архивной системы необходимо рассмотреть ее верхнюю часть. В ней находятся сервисы – модули, имеющие разнообразный функционал, но характеризующиеся унифицированными программным интерфейсом, позволяющим использовать как функционал друг друга, так и функционал нижестоящий структур.

Сервисами в рассматриваемой системе будут являться:

  • сервис поиска - обеспечение обработки поисковых запросов с учетом прав доступа пользователя, обеспечение поиска запрошенного документа либо дела в хранилищах информационной архивной системы или в электронной архивной картотеке;

  • сервис размещения - позволяет импортировать и размещать архивные материалы при передаче их из сопряженных корпоративных информационных систем, например СЭД, с одновременным агрегированием контента и заведением блока архивных метаданных – РКК архивного документа; этот сервис также контролирует топологическое размещение архивных материалов в хранилищах архивного фонда организации;

  • сервис ретроконверсии – организация ввода документов в информационную систему из архивного фонда организации. В ее функционал всходит обеспечение возможности сканирования архивных материалов и ручное либо автоматизированное (для потоковой ретроконверсии) создание РКК архивных документов;

  • сервис отчетных форм - позволяет осуществлять подготовку и распечатку внутренних описей дела, карт (листов) - заместителей дела, а также статистических и срезовых отчетных форм, подготовка которых занимает у архивариусов значительную часть рабочего времени (описей дел долговременного хранения и т.д., описей дел, выделяемых к уничтожению, передаче в структуры Росархива и т.п.).

Пополнение системы архивным контентом

Пополнение информационной архивной системы через импорт данных из других систем, например СЭД, сможет проходить по методике, близкой к оригинальной методике архивного дела с поправкой на то, что передаваемый в архив контент является электронным. Если же в СЭД зафиксированы документы (либо существуют их РКК, не содержащие контента), имеющие материальные аналоги в текущем делопроизводстве, то никаких проблем не возникает. Если же документы находятся в СЭД исключительно в электронном виде (документы, жизненный цикл которых полностью протекает в СЭД, материальных аналогов не имеющие) и не подходят под определение архивного документа, соответственно, в архив переданы быть не могут. Если же ценность таких документов признается достаточно высокой, то такие документы могут и должны быть сохранены в архивном фонде организации с некоторыми корректировками процесса: вследствие отсутствия материальных аналогов эти документы не проходят архивной обработки, при формировании дел из них не появляется разбиение дела по томам, а при размещении таких дел в архиве в системе устанавливается соответствующая пометка, извещающая о том, что документы этого дела не имеют топологического размещения в хранилище, соответственно и выдача документа по запросу может быть произведена исключительно в электронном виде путем временного предоставления доступа к хранилищу либо передачи формируемого образа документа в каком-либо стандартизованном формате, например в PDF. Остальные же процедуры полностью идентичны классическому архивному делопроизводству. Так, перед передачей дела в архив делопроизводитель подразделения должен проконтролировать полноту и соответствие его электронного аналога в СЭД фактическому материальному. В дальнейшем делопроизводитель производит архивную обработку материального дела, распечатывая формируемую системой внутреннюю опись его документов. Дальнейшее оформление (переплет, нумерация страниц и т.д.) может производиться в зависимости от особенностей непосредственно организационного документооборота.

По окончании подготовки дела к передаче в архив делопроизводитель извещает об этом систему, и архивариус организации получает уведомление о том, что дело или дела конкретного подразделения готовы к сдаче, сформирована сдаточная опись и можно запланировать фактическую передачу материальных дел с последующим их контролем и размещением в хранилищах, с дальнейшим вводом в систему их топологического расположения.

Процедурой, отличной от описанной, является другая модель ввода данных в информационную архивную систему – ретроспективный ввод. Эта модель подразумевает формирование фонда архивной системы исключительно за счет документов, уже переданных в архив и находящихся в нем.

Отдельным ответвлением обоих описанных методов формирования электронного архива является чисто методологический подход, при котором документы передаются в архив без их фиксации в сопряженной СЭД, а архивариус уже осуществляет их ретроспективный ввод в информационную архивную систему путем ручного либо потокового сканирования.

При ретроконверсии вся процедура ввода в архивную систему документов и дел осуществляется силами и на территории архивного подразделения. К примеру, архивариусом формируется дело, указываются его основные атрибуты (индекс, заголовок, шифр и т.д), в деле автоматически формируется внутренний документ - опись, задача которой прежде всего зафиксировать принадлежность совокупности РКК документов определенному конкретному делу. Очевидно, что такая система, существующая обычно исключительно в рамках подразделения фондов, не является общедоступной и служит только для оптимизации управления контентом ведомственного архива.

Таким образом, после ввода в систему информации о деле начинается его наполнение РКК документов с одновременным вводом атрибутов самого документа (дата создания, регистрационный номер, подразделения подписанта) и прикрепления к нему отсканированного образа и его распознанного контента, который в дальнейшем сможет обеспечить возможность функционирования в системе полнотекстового поиска. Описанная методика ввода документа называется ручным вводом вследствие большого количества более или менее трудоемких операций, производимых вручную.

Альтернативой ручному вводу является автоматизированный потоковый ввод документов. При потоковом вводе РКК документов создаются в системе либо заблаговременно, либо по заранее определяемым шаблонам. Созданные РКК индексируются, и полученные индексы наносятся посредством штрихкодирования непосредственно на документ либо распечатываются на клейких стикерах с дальнейшим их переносом стикеров со штрихкодированным индексом непосредственно на вводимые в систему документы. Дальнейшее скоростное сканирование архивных документов позволяет системе сразу ассоциировать образ документа и его РКК, а впоследствии, после того как пройдет автоматизированное распознавание образа, занимающее обычно значительно большее время, чем само сканирование, еще и добавить в РКК поисковый контент документа.

Следует остановиться на возможностях применяемого штрих-кодирования. Если ранее использовались более устаревшие технологии, позволявшие записать в одном коде около 100 байт данных, что ограничивало применение такого кодирования исключительно идентификацией документов при ретроконверсии (присвоение уникального номера, обеспечивавшего ассоциативную связь между сканируемым документом и его РКК); то современные методики штрихкодирования, например DataMatrix, Aztech, Tags, успешно применяемый в идентификации и акцизном учете PDF 417 позволяют кодировать до 2000 байт информации и более. Это дает возможность указывать в штрихкодировании сразу принадлежность документа к определенному делу, идентифицировать тома дел на стеллажах хранилищ, а также обеспечивать дополнительную конфиденциальность и надежность путем маркировки коробок с делами на стеллажах хранилищ.

В заключение рассмотрим модель иерархического хранения архивных данных. Концептуально модель такого хранения основывается на том, что из 90% запросов к архивным данным обращается всего 5% архивного контента, что предполагает размещение этих архивных данных, входящих в 5%, на скоростном накопителе, тогда как остальные данные могут быть сохранены на более емком, но более медленном накопителе типа Juke-Вox.

Вне зависимости от выбранной в качестве основания информационной архивной системы СУБД система иерархического хранения даст, с одной стороны, значительный прирост производительности при обработке поисковых запросов, с другой - значительно повысит надежность сохранения архивного контента путем регулярного сохранения срезовых состояний информационной архивной системы в специализированных накопителях.

В заключение отметим, что разработка информационной системы – электронного архива является процессом значительно более сложным и объемным, чем было рассмотрено здесь, но, учитывая, что процедуры архивного делопроизводства являются завершением цикла управления документами организации, невозможно преувеличить важность автоматизации архивного дела в целом и создания хранилищ архивного контента в частности. Как следствие, рынок СЭД России будет стоянно трепобовать такие решения и производители систем СЭД будут расширять функциональность своих продуктов.

Модуль Email-маркетинга в настоящее время недоступен.

Ресурс 1 Ресурс 1