Ғаббас
Баталов
1984 жылдың 1 қазаны
2
1
Қасқа тоғыз деген
–
тоғыз құр аттан тұрады екен. Басқа тоғыздан айырмасы сол
.
2
Түпнұсқа А. Сатаевтың жеке мұрағатынан алынды
.
ЖАҢА ТЕХНОЛОГИЯЛАР МЕН ТЕХНОТРОНДЫҚ МҰРАҒАТТАР
НОВЫЕ ТЕХНОЛОГИИ И ТЕХНОТРОННЫЕ АРХИВЫ
43
Б.Д. Шайлазымов,
руководитель управления архивных технологий
Архива Президента РК
ОРГАНИЗАЦИЯ «ЭЛЕКТРОННОГО АРХИВА»
В АРХИВЕ ПРЕЗИДЕНТА РЕСПУБЛИКИ КАЗАХСТАН
Вопрос неуклонного роста объемов архивных документов ее систематизации и обес-
печения сохранности является актуальным
практически для всех предприятий и органи-
заций, независимо от их рода деятельности, формы собственности и отраслевой принад-
лежности.
Сегодня наиболее используемым решением данного вопроса стала автоматизация
процесса, путем внедрения современных информационных технологий, а именно органи-
зация многофункционального электронного архива учреждения.
Современный электронный архив должен как минимум обеспечивать быстрый поиск,
прямой доступ к записанным на них сведениям с возможностью редактирования и функ-
ции передачи записанной информации по каналам связи, поэтому процесс ее организа-
ции является сложным, требующим комплексного подхода и существенных материальных
затрат.
В 2004 г
.
в рамках принятой Го-
сударственной программы формиро-
вания «Электронного правительства»
был разработан проект электронных
архивов государственных органов
СЭАГО, в соответствии с которым, в
2005 г. началась ее опытная эксплуа-
тация на базе Архива Президента
Республики Казахстан.
С тех пор, на протяжении 10 лет
электронный архив АП РК находится в
постоянном процессе улучшения и
совершенствования, результаты ра-
боты будут изложены в данном док-
ладе.
В целом электронный архив уч-
реждения представлен в виде ин-
формационно
-
поисковой
системы
(далее –
ИПС) «Электронный архив»,
которая содержит электронные копии
архивных документов (т.
е. электрон-
ный фонд пользования) и обладает
многоуровневой системой их поиска.
Формирование ИПС начинается с
создания электронных копий архив-
ных документов, а именно перевод
бумажных документов в электронный
вид.
ЖАҢА ТЕХНОЛОГИЯЛАР МЕН ТЕХНОТРОНДЫҚ МҰРАҒАТТАР
НОВЫЕ ТЕХНОЛОГИИ И ТЕХНОТРОННЫЕ АРХИВЫ
44
Рис.
1
Работа по данному направлению осуществляется на Станции оцифровки бумажных
документов, в которой функционирует 6 многофункциональных устройств (далее –
МФУ)
со встроенными высокоскоростными сканерами. Из
-
за разнородности форматов архив-
ных документов выбор пал именно на эти устройства. Дополнительный планшетный ска-
нер и обходной лоток позволяет придерживаться темпов сканирования даже в тех случа-
ях когда в архивном деле встречаются страницы не соответствующие стандартному
формату –
А4 или с колеблющейся плотностью бумаги. Встроенный планшетный модуль
так же необходим для сканирования ветхих архивных документов.
В среднем оператор одной машины сканирует около 12 дел в день объемом
1
200 стр., что в месяц составляет 240 дел (24
000 стр.). Таким образом, за 1 месяц через
6 МФУ проходят около –
1
440 дел (144
000 стр.).
К сканированию допускаются документы, не требующие либо прошедшие реставра-
цию. Данная мера обеспечивает не только физическую сохранность сканируемых доку-
ментов, но и позволяет операторам станции оцифровки придерживаться установленных
темпов работы.
Документы с размытым текстом, механическими повреждениями (мятые, порван-
ные), залитые чернилами, имеющие жировые пятна и следы реставрации, затрудняющие
чтение документа, не всегда поддаются восстановлению, поэтому сканирование произво-
дится с использованием специальных графических редакторов.
Посредством локальной сети сканеры в паре с рабочими станциями взаимосвязаны
единым банком данных. Операторы оцифровки, находясь за своими рабочими местами,
занимаются только сканированием и приданием им первичных атрибутов, такими как:
фонд, опись и дело. Весь отсканированный материал попадает и аккумулируется в еди-
ном банке данных, где их систематизируют, отправляют на электронный носитель и вно-
сят в базу данных.
Значительную помощь в увеличении объемов оцифровки бумажных документов так
же оказывает и Com
-
система. Предназначенная для создания микрофиши страхового
фонда, система была настроена таким образом, что перед экспозицией и проявкой мик-
роформ, отсканированные документы сохраняются в памяти рабочей станции в элек-
тронном виде. Далее остается лишь придать опознавательные атрибуты данным, запи-
сать их на электронный носитель и внести в базу данных.
ЖАҢА ТЕХНОЛОГИЯЛАР МЕН ТЕХНОТРОНДЫҚ МҰРАҒАТТАР
НОВЫЕ ТЕХНОЛОГИИ И ТЕХНОТРОННЫЕ АРХИВЫ
45
Работа по усовершенствованию вопросов ускорения оцифровки продолжается, так
как одной
из приоритетных задач Архива является широкомасштабная оцифрования все-
го объема архивного материала учреждения.
Следующей немаловажной составляющей является организация работ по система-
тизированному наполнению информационно
-
поисковой базы данных ИПС «Электронный
архив».
Данный процесс осуществляется на Станции ввода электронных документов. Про-
цесс ввода начинается с линии ретроконверсии, так как для решения задач атрибутивно-
го и контекстного поиска возникает необходимость перевода документа в машиночитае-
мый вид.
Рис. 2
Ретроконверсия (ретроспективная конверсия)
–
это специальная промышлен-
ная (т.
е. в больших объемах) технология перевода текстовых данных из графическо-
го вида в цифровой машиночитаемый вид путем сканирования и автоматического
распознавания.
Для организации этой линии используется технология оптического распознавания
символов, в нашем случае представленная программным продуктом Capture Batch
Manager компании «Kofax».
Оптическое распознавание символов
(
англ.
optical character recognition OCR)
–
механический или электронный перевод изображений рукописного, машинописного или
печатного текста в текстовые данные –
последовательность кодов, использующихся
для представления символов в компьютере (например, в текстовом редакторе). Рас-
познавание широко используется для конвертации книг и документов в электронный
вид.
По завершению автоматического процесса распознавания мы получаем дополни-
тельную прикрепленную копию исходного документа в формате текстового файла (Word)
с любым заданным расширением (DOC или DOCX).
Полученный машиночитаемый документ позволяет нам в дальнейшем ставить до-
полнительную задачу для поисковой системы по осуществлению полнотекстового поиска
необходимого документа.
Полнотекстовый поиск –
автоматизированный документальный поиск, при ко-
тором в качестве поискового образа документа используется его полный текст или
существенные части текста.
Объем распознанных текстовых символов прямопропорционально зависит от каче-
ства бумажного документа и процесса сканирования. Поэтому для категории слабочитае-
мых документов с затухающим или слабоконтрастным текстом после распознавания не-
обходим процесс верификации и редактирования.
После завершения этого цикла работ данные экспортируются в базу данных (плат-
форма IBM FileNet) и с помощью встроенного функционала им придают поисковые атри-
буты, а также определяют место расположения. Атрибуты подразделяются на основные и
ЖАҢА ТЕХНОЛОГИЯЛАР МЕН ТЕХНОТРОНДЫҚ МҰРАҒАТТАР
НОВЫЕ ТЕХНОЛОГИИ И ТЕХНОТРОННЫЕ АРХИВЫ
46
вспомогательные. Основными атрибутами электронного архивного дела считаются: но-
мер фонда, описи, дела и его название. В случае если за единицу хранения берется до-
кумент, то и его номер с названием. Вспомогательные формируются в зависимости от
рода деятельности и задач каждого учреждения. Учитывая направление работ Архива
Президента Республики Казахстан, а так же предложения наших исследователей в функ-
ции поиска вошли следующие вспомогательные атрибуты:
–
поиск по составу и виду документа;
–
поиск по географическому указателю;
–
поиск по персоналиям;
–
поиск по автору документа;
–
поиск по начальной и конечной дате документа.
Поиск архивных документов по атрибутам бессмыслен без удобного путеводителя по
фондам, поэтому в ИПС «Электронный архив» предусмотрен электронный путеводитель
по фондам –
БД «Архивный фонд».
Рис 3.
Он представляет собой систематизированный перечень наименований архивных
фондов с их краткими характеристиками. Данные БД «Архивный фонд» активны и могут
углубляться до уровня описи, а далее и дела, что в свою очередь позволяет оперативно
получать информацию о составе, количестве и состоянии архивных документов.
Таким образом организован электронный архив нашего учреждения, работы по раз-
витию и совершенствованию которого продолжаются, и по сей день.
Н.Ю. Новикова,
главный эксперт управления архивных технологий
Архива Президента РК
СОЗДАНИЕ СТРАХОВОГО ФОНДА КОПИЙ ДОКУМЕНТОВ
НА МИКРОФОРМАХ В АРХИВЕ ПРЕЗИДЕНТА РК
Обеспечение сохранности исторического и культурного наследия народа нашей
страны является одной из важнейших задач государства, без решения которой невоз-
можно дальнейшее гармоничное развитие общества. Это ясно отражено в Положении о
ЖАҢА ТЕХНОЛОГИЯЛАР МЕН ТЕХНОТРОНДЫҚ МҰРАҒАТТАР
НОВЫЕ ТЕХНОЛОГИИ И ТЕХНОТРОННЫЕ АРХИВЫ
47
Государственном страховом фонде копий документов от 28 мая 2002 г
.
, одной из базовых
задач которого является страховое копирование редких и особо ценных архивных дел и
отдельных документов.
Архив Президента РК является хранителем
уникальных документов по истории Ка-
захстана, и как и перед любым архивом, перед АП
РК стоит задача не только их сохран-
ности, но и возможности долговременного использования.
В АП
РК работа по созданию страхового фонда документов велась с момента обра-
зования архива, для чего использовался наиболее экономичный и практичный способ
создания страховых копий документов –
микрография.
Гарантированный срок хранения информации на микрографическом носителе, в ча-
стности микрофише, без потери качества и специальных требований к условиям хране-
ния составляет не менее 100 лет, а объемы хранения сокращаются в сотни раз.
До 2008 г
.
в архиве использовалось оборудование для микрофильмирования рос-
сийского производства –
комплекс «Старт М». На нем производилось т.
н. классическое
микрофильмирование, являющееся особой разновидностью фотографии. У этого метода
копирования были свои «минусы». Классическое микрофильмирование ведется практи-
чески вслепую, и качество работы можно было оценить только после проявки пленки. Ес-
ли при этом
оператор допускал ошибку, например, в расположении страницы в кадре или
порядке кадров, ошибался при фокусировке и т.
п., оригинал приходилось полностью пе-
реснимать, что дополнительно его травмировало и требовало больших затрат времени.
Классическое микрофильмирование с использованием микрофиш в настоящее время
практически прекращено во всем мире, и соответствующие камеры серийно не произво-
дятся. Со временем оборудование не только морально, но и физически устарело, и встал
вопрос о его замене.
Бурное развитие цифровых технологий и компьютерной техники дало возможность
хранить большие массивы информации в цифровом виде. Практически во всех крупных
архивах мира создаются электронные базы данных документов, т.
к. хранение копий ар-
хивных фондов в электронном виде обеспечивает максимально быстрый поиск информа-
ции и доступ к ней, быстрое копирование и рассылку с использованием Интернета. Каза-
лось бы, что с появлением новых технологий, основанных на создании и хранении элек-
тронных образов документов, востребованность такого способа копирования документов
как микрофильмирование должна снизиться. Но этого не произошло, так как со временем
проявились проблемы хранения информации в цифровой форме.
Одной из проблем является сравнительно малый период хранения –
уже сегодня
носители цифровой информации, произведенные 20 лет назад, невозможно прочитать в
связи с полной сменой парка аппаратных средств и программного обеспечения.
Вторая проблема –
это высокая себестоимость хранения информации: достаточно
надежное хранение цифровой информации подразумевает ее обязательное копирование,
внедрение и использование специальных программ, обеспечивающих постоянное тести-
рование базы данных, обеспечение других процедур, направленных на недопущение по-
тери информации. Кроме того, в ситуации, когда полная замена аппаратных и программ-
ных средств происходит не реже одного раза за несколько лет, возникает необходимость
постоянной закупки новых компьютеров, программ и перезаписи информации. При увели-
чении объема базы данных затраты на ее поддержание растут в геометрической прогрес-
сии. То есть, хранение единицы информации в цифровом виде значительно дороже, чем
хранение на микроформах.
Кроме того информация, хранящаяся в электронном виде, подвержена внешним
воздействиям, таким как электрические и магнитные поля, сбои электропитания, хакер-
ские атаки, рассылки вирусов. Не стоит забывать и «человеческий фактор» –
просто слу-
чайное нажатие клавиши, приводящее к удалению информации.
Вывод –
электронная форма хранения информации может быть охарактеризована
как быстрая, гибкая и оперативная, но дорогая
и недостаточно надежная,
когда речь
идет о хранении копий документов на протяжении сотен лет.
Оптимальное решение задачи заключается в создании комбинированного метода
копирования, сочетающего в себе плюсы обеих технологий. Это т.
н. СОМ–технологии,
ЖАҢА ТЕХНОЛОГИЯЛАР МЕН ТЕХНОТРОНДЫҚ МҰРАҒАТТАР
НОВЫЕ ТЕХНОЛОГИИ И ТЕХНОТРОННЫЕ АРХИВЫ
48
которые идеально встраиваются в концепцию создания параллельно двух фондов доку-
ментов –
электронного фонда пользования и страхового фонда на микроформах.
После тщательного ознакомления с современными мировыми
тенденциями в облас-
ти долговременного хранения информации, было выбрано уникальное оборудование
SMA для сканирования и микрофильмирования, производимое немецкой компанией SMA
Elektronic Document GmbH
–
СОМ
-
система. Это оборудование для существенно усовер-
шенствованной и обогащенной новыми возможностями микрографии. СОМ
-
технология
предусматривает предварительное сканирование оригинала с последующим выводом
полученного графического файла на микроформу (кадр микрофиши).
СОМ
-
системы работают в полном автоматическом режиме с закрытым способом об-
работки микрофотоносителей, т.
е. вся химико–фотографическая обработка микроформ
производится автоматически внутри самой СОМ
-
системы. Подавая на вход файлы, мы на
выходе получаем готовые сухие микрофиши архивного хранения. Система не требует
подачи воды и наличия канализации, т.к. использует готовые наборы герметично закры-
тых химикатов. После отработки химикатов они просто заменяются новыми. СОМ–
система сохраняет документы, представленные в электронном виде в любом формате
(TIFF, PDF, JPEG, BMP и т
.
д.), оперативно конвертируя их в аналоговую форму и запи-
сывая на носитель долговременного хранения (микропленку).
Остановимся подробнее на
преимуществах СОМ
-
системы.
1.
Побочным продуктом СОМ
-
технологии являются электронные образы докумен-
тов, которые можно использовать для пополнения «Электронного архива» и фонда поль-
зования. Возможен и обратный процесс –
использование уже имеющихся электронных
ресурсов для создания страхового фонда на микрофишах.
2
. При работе с документом СОМ
-
процесс подразумевает его только однократное
сканирование. В современных сканерах используется LED–подсветка, низкая по интен-
сивности и не содержащая ультрафиолетовой и инфракрасной составляющей, т.
е. ока-
зывает на оригинал гораздо меньшее влияние, чем микрофильмирующая камера с ее
мощным световым потоком.
3.
В СОМ
-
процессе все файлы можно предварительно проконтролировать, устано-
вить их порядок. Другими словами, СОМ
-
система позволяет проверить качество микро-
фильма
до его создания, а не после.
4.
Имея набор файлов, выведенных на пленку в первый раз, можно повторить эту
операцию многократно, получая микрофиши с исходной читаемостью.
5.
СОМ
-
микрофильмирование не требует создания специальных условий в помеще-
нии, где оно производится. СОМ
-
системы гораздо компактнее микрофильмирующих ка-
мер и требуют намного меньшей площади для их установки и обслуживания, а также ха-
рактеризуются пониженным энергопотреблением.
6.
СОМ
-
системы позволяют микрофильмировать электронные документы, изначаль-
но не существующие на бумаге, но представляющие ценность.
Многие архивы исторически в качестве микроформ для долговременного хранения
информации используют микрофиши, т.
к. микрофиша является наиболее емким носите-
лем. При одинаковом объеме хранимой информации микрофиша занимает гораздо
меньший физический объем по сравнению с рулонным микрофильмом. Именно это об-
стоятельство, а также простота поиска документа, является аргументом в пользу микро-
фиш.
Микрофиша (от «микро»
и француз
.
«f
icher
» –
вбивать, втискивать) –
копия плоских
оригиналов документа, изготовленная в виде микроформы на прозрачной форматной
пленке (реже на непрозрачной основе) с последовательным расположением кадров в не-
сколько рядов.
На одной микрофише помещается от 30 до 130 страниц книжного текста. Существу-
ют ультрамикрофиши –
микрофиши, содержащие копии изображений документов или
предметов с уменьшением более чем в 90 раз.
Для создания страхового фонда в Архиве Президента РК выполняются форматные
микрофиши размером 105 х 148 мм, с уменьшением в 24 раза. На одной микрофише по-
мещается 98 кадров (из них 95 –
копии документов, а 3 это т.
н. служебные кадры –
тра-
ЖАҢА ТЕХНОЛОГИЯЛАР МЕН ТЕХНОТРОНДЫҚ МҰРАҒАТТАР
НОВЫЕ ТЕХНОЛОГИИ И ТЕХНОТРОННЫЕ АРХИВЫ
49
фареты, на которых указываются номера листов оригинала с которых начинается и кото-
рыми заканчивается микрофиша).
Формирование микрофиши производится с помощью программного обеспечения
Batch Scan Wizard, возможности которого позволяют сделать вполне читаемыми даже
слабоконтрастные тексты или тексты с затемненным фоном.
Для чтения м/ф используются специальные проекционные аппараты, (т.
н. читаль-
ные) создающие на встроенном экране увеличенное в 24 раза изображение страниц.
Микрофиши также можно читать с помощью фотоувеличителя, диапроектора или сильной
лупы.
В заключение –
статистические данные. На сегодняшний день в Архиве Президен-
та РК
хранятся
48
128 микрофиш, отснято –
62
484 дела, всего сделано –
7 518 091
кадр, показания счетчика сканера СОМ–системы –
1 276
310 кадров
.
Сальменбаева А.,
главный эксперт управления комплектования и документации
Архива Президента РК
НЕКОТОРЫЕ ВОПРОСЫ СОЗДАНИЯ ЭЛЕКТРОННОГО АРХИВА
В этой статье рассматривается важность создания электронного архива, основные
этапы и современные тенденции.
Достарыңызбен бөлісу: |