+7 (495) 956-79-28
ГлавнаяПресс - центрСтатьи и интервьюОб электронных архивах: отдельные аспекты

Об электронных архивах: отдельные аспекты

Автор: Алексей Назаренко, директор по качеству, компания "ИнтерТраст"
Источник: журнал "Современные технологии делопроизводства и документооборота"
Дата публикации: 04.2011

Что такое электронный архив? Электронный архив или электронная архивная система – это корпоративная информационная система класса ECM (enterprise content management system), автоматизирующая процедуры архивного дела. Почему емкость рынка архивных систем специалисты считают ограниченной и каковы причины этого? Форматы документов, хранимых в электронных архивах, и сложности ретроконверсии.

Вследствие того, что архивная отрасль уникальна для каждой страны, отметим, что в России программный продукт класса "электронный архив" должен соответствовать следующим актам: Федеральному закону от 22.10.2004 № 125-ФЗ "Об архивном деле в Российской Федерации" и Правилам организации хранения, комплектования, учета и использования документов Архивного фонда РФ и других архивных документов в государственных и муниципальных архивах, музеях и библиотеках, организациях Российской академии наук (далее – Правила комплектования архивов организаций), утв. приказом Министерства культуры и массовых коммуникаций Российской Федерации от 18.01.2007 № 19.

Только при условии соблюдения при разработке программного обеспечения (ПО) всех правил, прописанных в данных правовых актах, мы можем говорить о том, что это ПО является электронным архивом. Данное условие исключает из рассматриваемой области информационные системы, в названии которых может присутствовать слово "архив", но которые не удовлетворяют требованиям нормативных и регулирующих документов, предъявляемых к ним. Таким образом, документоориентированные корпоративные информационные системы (КИС) типа "архив научной и технической информации", "архив ведомственной документации" и прочие подобные варианты не могут быть отнесены к электронным архивным системам.

Вследствие высокого уровня требований к электронным архивным системам, прописанных в нормативных актах, в настоящее время можно говорить всего о нескольких полноценных электронных архивах:

  • "CompanyMedia – Корпоративный электронный архив" (разработан компанией "ИнтерТраст");

  • "Архивное дело" (создан компанией "Электронные офисные системы");

  • "LanDocs – Архив" (разработан компанией "Ланит").

Продукт "Управление архивом документов" (разработчик – компания "DocsVision") зрелым, полнофункциональным решением не является, т. к. выполняет промежуточную задачу – подготовку и оформление дел для сдачи в архив.

Иных решений на отечественном рынке сегодня нет. Почему?

Маркетинговая причина

Потребность рынка в электронных архивах чрезвычайно ограничена. Если современная система электронного документооборота давным-давно переросла автоматизацию делопроизводства и сейчас обеспечивает поддержку управления компанией любой отрасли и сектора (причем как директивного, так и процессного и проектного менеджмента), то потребность в архивных системах испытывают только крупные компании, берущие свое начало еще в СССР, а некоторые – в Российской империи. Архивы этих компаний очень велики, автоматизация помогает в значительной степени упростить управление ими. Средние компании, возникшие в постперестроечные годы, могут обладать архивами, нуждающимися в автоматизации, только в случае, если их профильные процессы являются документоориентированными.

К таким организациям можно отнести современные финансовые структуры (банковские и страховые), предприятия добывающего и топливно-энергетического комплекса, а также органы власти (законодательной, исполнительной, судебной).

Все это приводит к тому, что емкость рынка архивных систем становится ограниченной, а потенциальные потребители могут быть выявлены буквально в течение одного дня. Поскольку разработка электронного архива требует от полутора лет и более, окупаемость новых решений для отечественного рынка является сомнительной, а основные «игроки» рынка уже создали свои решения, становится ясно, что попытки разработки новой, конкурирующей с ними, электронной архивной системы в условиях посткризисной экономической ситуации бесперспективны.

Кадровая причина

Для разработки электронной архивной системы компанияпроизводитель должна иметь в своем штате профильных специалистов-консультантов с высоким уровнем знаний в области архивного дела, богатым опытом работы с архивами, а также навыками проектирования информационных систем. В настоящий момент таких специалистов очень немного и в своей массе они подготовлены компаниями самостоятельно часто именно с целью создания решений, автоматизирующих архивные процедуры. Сегодня специалистами такого уровня на отечественном рынке обладают всего несколько компаний, причем у таких компаний имеются уже готовые решения для автоматизации архивного документооборота.

Финансовая причина

Разработка решения, требующего немалых финансовых вливаний в условиях ограниченного спроса и посткризисной экономической ситуации, является высокорисковой.

Форматы документов, хранимых в электронных архивах

Отдельным вопросом, напрямую затрагивающим развитие электронных архивных систем, является изменение самого понятия документа. В соответствии с Федеральным законом «Об архивном деле в Российской Федерации», который четко определяет понятие документа для целей архивного дела, информация на носителях может быть приравнена к документам в том случае, если она снабжена дополнительными сведениями, позволяющими ее однозначно идентифицировать.

Таким образом, к примеру, база данных, записанная на оптический диск, видео- или аудиоконтент на носителе может быть передана в архив как один документ. Если архивная система обладает возможностью хранить документы большого объема (емкость записи SQL базы – 65 КБ, а записи базы Lotus Domino – 512 MБ), то передача такого рода контента вполне реальна.

Таким образом, задача сдачи в архив медийных документов выглядит достаточно прозаичной до тех пор, пока не будет точно выявлен фактический размер образа медианосителя.

Если емкость стандартного компакт-диска равняется 700 МБ и хранить его контент в архивной системе достаточно реально, то DVD диск обладает емкостью уже 4,7 ГБ. Емкость же Blue-Ray диска может составлять и 25, и 50, и даже 100 ГБ.

Очевидно, что программные решения, позволяющие управлять такого рода архивным контентом, относятся к категории иерархических хранилищ, где основным игроком выступает решение от вендора IBM Tivoli. Когда стоит вопрос о записи в архивную базу изображения, важно отметить, что образ документа, хранимый в системе, и есть изображение форматов TIFF, PNG, JPEG. Этот функционал реализован во всех архивных системах. Возможность просмотра хранимого системой контента обычно реализуется не за счет самой системы, а за счет функционала ее рабочих мест. Поэтому если в системе хранятся файлы документов, то для работы с ними понадобятся сторонние решения других вендоров, к примеру Microsoft Offi ce, OpenOffi ce.org, Google Docs и пр.

Важно знать! Просмотр PDF-, графических многостраничных (TIFF) и одностраничных (JPEG, PNG), звуковых (WAV, MP3, AMR) файлов и медийных дисков в формате образа (ISO) достигается с помощью дополнительно установленных в системе просмотрщиков/проигрывателей/монтировщиков.

Ретроконверсия – важный этап создания электронного архива

Важным этапом создания электронного архива является процесс ввода в него архивной документации. Обычно данный процесс представляет собой прямую передачу надлежащим образом оформленных дел из корпоративной системы электронного документооборота в ее специализированный модуль "электронный архив". Даже если дела в СЭД нуждаются в дополнениях, к примеру в создании описей, а также сдаточной документации, тем не менее этот процесс является практически полностью автоматизированным. Совершенно другим, значительно более затратным и по времени и по финансам является процесс ретроконверсии – оцифровки бумажного архива организации.

Каковы этапы ретроконверсии?

Их несколько:

  • получение образа документа. Для этого может быть использовано разнообразное оборудование.

Самым дешевым являются офисные сканеры, функциональность которых может быть расширена лотком автоподачи и системой двустороннего сканирования документа. Далее идут документные сканеры, затем потоковые сканеры, обеспечивающие самую высокую скорость сканирования, богатые возможности, но при этом отличающиеся высокой стоимостью. Штативные фотосканеры переводят документы в цифровую форму посредством фотографирования;

  • формирование метаданных, то есть хранимых отдельно от контента документа полей с описательной информацией, позволяющей ECM-системе этот документ корректно обрабатывать;

  • маркировка документа, производимая для автоматизированного заполнения метаданных в архивной системе (для этого используются программное обеспечение для генерации штрихкода, принтер штрихкода, программный считыватель штрихкода, ручной сканер штрихкода, необходимый при непосредственной работе с маркированными документами).

Работая в комплексе, подсистема маркировки, построенная таким образом, обеспечивает возможность проведения процедуры ретроконверсии на адекватном техническом уровне;

  • извлечение (распознавание) контента. Производится с использованием OCR-системы. Для этих целей преимущественно используется Abbyy FineReader 7.0 Scripting Editiion. В задачу данной системы входит перевод изображения (образа) документа в текстовый формат с сохранением форматирования либо без такового.

Не оснащенная этим функционалом архивная система не сможет обеспечить полноценную индексацию, а также исключит возможность использования полнотекстового поиска по хранимой в системе документации.

В совокупности перечисленные пункты описывают затраты, необходимые для проведения ретроконверсии документов в рамках одного проекта (не используя аутсорсинг). Эта сумма должна быть разделена на время эксплуатации оборудования и ПО, применяемых для ретроконверсии, стоимость расходных материалов за тот же период, а также затраты на персонал, осуществляющий ввод документных данных в архивную систему. Соотнеся полученные затраты с объемом ретроконверсированной документации, мы получим стоимость ввода в систему единичного документа. Также немаловажно, что само сканирование не является достаточным условием для ввода документа в систему, так как ECM-система требует получения метаданных документа, а поисковая подсистема – текстового контента. Лишь тогда мы можем говорить о полноценном вводе документа в соответствии с требованиями системы электронного архива.

Процесс ретроконверсии столь трудоемок, что перед организацией сразу встает вопрос: проводить ли оцифровку самостоятельно либо передать ее на аутсорсинг компании, для которой этот комплекс задач является профильным.

Рассматривая аутсорсинг именно процедуры ретроконверсии (т. е. пополнения фонда электронного архива из имеющегося архивного фонда предприятия или органа власти), необходимо отметить, что этот рынок настолько мал, что силами единственной хорошо оснащенной компании он покрывается практически полностью (крупнейшей из них, обладающей самой совершенной методической и технической базой, является корпорация "Электронный архив").

Каковы же причины этого? Самая актуальная – низкая востребованность. Многие компании, обладающие обширным архивным фондом, не нуждаются в возможностях ни электронного доступа к образам документов, ни полнотекстового поиска информации по архивам. Главная их потребность – автоматизация функционала архивной картотеки, так как имеющаяся классическая картотека заметно снижает производительность работы архива. Таким образом, вложения в ретроконверсию слишком затратны и одновременно не так сильно необходимы. Рассмотрим в качестве примера две крупных отечественных компании.

Аэрофлот, крупнейший пассажирский авиаперевозчик в стране, согласно собственным локальным актам, дополнительно регулирующим деятельность архива компании, осуществляет хранение всех корешков билетов всех пассажиров, перевозка которых была осуществлена, на всех рейсах с 1923 г. В современных условиях это означает пополнение документного фонда, передаваемого затем на архивное хранение, не менее чем на 20–25 млн документов в год. Безусловно, хранение образов документов в условиях такого обширного документопотока не является эффективным, учитывая, что истребование документации из архивов компании осуществляется только при чрезвычайных ситуациях. Решение в виде архивной картотеки для этих целей более предпочтительно, чем хранение всех образов документов и их контента.

Сберегательный банк Российской Федерации комплектует свои архивы с 1841 г., когда император Николай I принял устав сберегательных касс. С того момента документы, подтверждающие проведение всех финансовых операций в банке, передаются по окончании текущего делопроизводства по ним в архивы организации. В настоящее время филиальная сеть банка насчитывает более 19 000 офисов и является крупнейшей в Восточной Европе. Документы, подтверждающие каждую оплату коммунальных услуг, услуг связи и иные платежи, сохраняются банком для возможности дальнейшего использования. В таких условиях провести процедуру ретроконверсии не представляется возможным в принципе, и даже внедрение архивной системы типа автоматизированной картотеки вызывает большие затруднения вследствие огромного количества дел в архиве этой организации.

Крупные и средние компании в большинстве своем обзавелись системами электронного документооборота и архива. А что делать небольшим организациям, не обладающим мощными материальными ресурсами для приобретения дорогостоящего ПО?

Если еще год или два назад таким предприятиям СЭД была просто не по карману (необходимость поддержания ее работы требовала немыслимых для малого предприятия затрат), то в настоящее время ситуация изменилась. Принципиально новый подход к созданию СЭД для небольших компаний появился параллельно с массовым проникновением сети Интернет в нашу жизнь и в бизнес – возникла идея не передавать программное обеспечение конечному пользователю, а предлагать ему возможность пользоваться находящимся у исполнителя ПО на временной основе с оплатой по количеству рабочих мест за определенный временной срок. Такая модель предоставления услуг по организации электронного документооборота, получившая название SaaS (software as a service), значительно удешевляет проект. Система электронного документооборота лишилась ключевого для предприятий сектора среднего и малого бизнеса недостатка: больших вложений в техническую поддержку ПО, которая передается на аутсорсинг профильной IT-компании. Доступ в СЭД (с определенного договорными отношениями количества рабочих мест) осуществляется через сеть Интернет.

Пока остается открытым вопрос безопасности хранимых в такой системе документов. Решить возникшую задачу способны современные мощные системы криптографии, которые обеспечивают хранение на сервере зашифрованных криптоалгоритмом документов.

На заметку! Сам факт возможной утраты документации исключается шифрованием документов.

Потребность в электронном архиве, создаваемом по модели SaaS, возникнет примерно через 3-4 года после появления на рынке полноценной SaaS-системы электронного документооборота. И это вполне объяснимо жизненным циклом документа, который начинается в форме проекта. В дальнейшем документы формируются в дела, лишь через три года после завершения дела они при условии наличия в них документации, имеющей важность для работников, общества или государства, сдаются на хранение в архив организации. По истечении срока хранения в архиве документация, утратившая актуальность, уничтожается. Для отдельных видов документов срок хранения может быть продлен. Третьи виды документов, имеющих ценность лишь для государства, передаются на хранение в структуры федерального архивного агенства (Росархива). Пока же полноценной СЭД, предлагаемой по модели SaaS, на рынке нет. Тем не менее подвижки в преодолении недоверия к облачным технологиям уже заметны: появились SaaS-учетные системы, SaaS-CRM-системы. В скором времени можно ожидать и появление полноценных SaaS-СЭД, которые поначалу будут использоваться компаниями малого бизнеса. Возможно, это произойдет уже в 2012–2013 гг., а решения архивных хранилищ следующего поколения появятся не ранее 2015–2017 гг.

Словарь

Вендор (англ. vendor продавец, торговец) – юридическое или физическое лицо, являющееся поставщиком товаров и услуг, объединенных торговой маркой.

Оптическое распознавание символов (англ. optical character recognition, OCR) – это механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе.

Программное обеспечение как услуга (англ. software as a service, сокр. SaaS), программное обеспечение по требованию (англ. software on demand, сокр. SoD) – бизнес-модель продажи и использования программного обеспечения, при которой поставщик разрабатывает веб-приложение и самостоятельно управляет им, предоставляя заказчикам доступ к программному обеспечению через Интернет. Основное преимущество модели SaaS для потребителя состоит в отсутствии затрат, связанных с установкой, обновлением и поддержкой работоспособности оборудования и работающего на нем программного обеспечения.

Ретроконверсия или ретроспективная конверсия – это специальная промышленная технология перевода данных с графических образов, полученных после сканирования, в текстовый формат, формат баз данных или в мультистраничный графический.

Система управления взаимодействием с клиентами (или CRM, сокр. от англ. Customer Relationship Management System – система управления взаимодействием с клиентами) – корпоративная информационная система, предназначенная для автоматизации CRM-стратегии компании, в частности, для повышения уровня продаж, оптимизации маркетинга и улучшения обслуживания клиентов путем сохранения информации о клиентах (контрагентах) и истории взаимоотношений с ними, установления и улучшения бизнес-процедур и последующего анализа результатов.

Облачные технологии (облачные вычисления) – в большинстве своем, это технологии обработки данных, в которых компьютерные ресурсы и мощности предоставляются пользователю как интернет-сервис. Пользователь имеет доступ к собственным данным, но не может управлять и не должен заботиться об инфраструктуре, операционной системе и собственно программном обеспечении, с которым он работает.

Модуль Email-маркетинга в настоящее время недоступен.

Ресурс 1 Ресурс 1