Мир стремительно оцифровывается – в электронный вид переводятся не только деловые документы, но и научно-техническая документация, художественные произведения, исторические интерьеры, музейные экспонаты. Электронная версия – гарантия сохранности, несмотря на возможные катаклизмы. А еще оцифровка максимально расширяет общение и ускоряет взаимодействие.
SCAN: Технологии

Фоторепортаж: Как работает фабрика по оцифровке?

scan
мобильная версия
, Текст: Соломатин Павел

Наш корреспондент побывал на крупнейшем производстве и убедился в сложности организации работ по переводу документов в электронный вид.

Экспертиза

Производство цифрового ресурса начинается с экспертных работ. Экспертиза включает в себя предварительную оценку объемов документов, предназначенных для оцифровки, стоимости и сроков проекта. Она всегда проводится очно. Эксперты «обследуют» массивы документов на всей территории РФ и за ее пределами. Они протоколируют требования заказчиков к обработке документов (сканирование/индексирование/загрузка), срокам, условиям выполнения работ на территории корпорации или на клиента, описывают массив и технологию и выполнения проекта, указывая нормативные сроки на конкретные операции по каждому из этапов. Количество экспертов на проекте может варьироваться, оно зависит от сложности работ. Могут формироваться экспертные команды, в которые входят технологи сканирования и ретроконверсии, программисты, специалисты по загрузке информационных ресурсов и т.д.

Рабочая группа

Проект начинается, когда выходит заказ-наряд с указанием сроков и трудозатрат, после чего создается рабочая группа. В нее входят профессионалы, ответственные за каждый этап. В компании действует система внутреннего документооборота, в ней ведется вся отчетность по работам. Например, создаются заявки на проверку информационного ресурса в Отделе контроля качества, отмечаются факты сдачи порций информационного ресурса заказчику и т.д.

Прием документов

Проектный цикл начинается и заканчивается в одной точке. Все документы проходят так называемый входной контроль, от результатов которого зависит их дальнейшее движение по конвейеру. Бумажные носители поступают и тщательно сверяются с актом заказчика, осматривается каждый лист в деле. В результате сверки могут быть выявлены дефекты или особенности, при которых обработка может потребовать проведения дополнительных согласований и изменения технологии.

Подготовка к сканированию

После проверки документы переходят на следующий этап: подготовка к сканированию. Эта операция чаще всего представляет собой просто расшивку дел, но бывает дополнена действиями, позволяющими оптимизировать работу на дальнейших этапах, такими как прокладывание специальных технологических листов, штрихкодирование, сепарация документов по определенному признаку и т.п.

После сканирования

Этот производственный модуль ответственен не только за подготовку документов к оцифровке, но и за подготовку к их возврату заказчику. После сканирования и последующих этапов, предусмотренных технологическим процессом, документы возвращаются сюда, на участок брошюровки.

Возврат в начальное состояние

Документы приводят в исходное состояние, сшивают, убирают технологические листы. Они могут быть специальным образом уложены в короба, затем составляется опись дел с привязкой к коробам, проведена дополнительная маркировка коробов, дел, штрихкодирование, наклеивание RFID-меток. Как на этапе расшивки, так и на этапе сшивки документы, если требуется, могут быть отреставрированы. Например, порванные или выпадающие листы подклеены, частично или полностью заменена обложка. Каждая из перечисленных операций нормирована, по каждому виду работ ведется автоматизированный учет.

Сканирование

После этапа подготовки документы уходят на участки сканирования, оснащенные оборудованием разного типа: в зависимости от характера массива, материалы цифруются на различных устройствах. Например, вот такое оборудование используется для сканирования микрофильмов.

Документные сканеры

На скоростных документных сканерах переводятся в электронный вид в потоковом режиме расшитые документы. Скорость сканирования составляет до 340 страниц/минуту, благодаря чему этот процесс проходит быстрее и оказывается экономически выгоднее по сравнению со сканированием сшитых документов. На центральной производственной площадке ЭЛАР в Москве в настоящее время работает 25 таких сканеров, каждый из которых за смену обрабатывает около 10 тыс. листов. Оборудованием такого типа укомплектованы и региональные центры, на нем же активно работают мобильные бригады, которые выезжают на территорию заказчика.

Сканирование сшитых документов

Другой участок сканирования. Он оборудован техникой для оцифровки документов, которые не могут быть разброшюрованы, поэтому сразу после входного контроля и полистной проверки переходят на этап сканирования.

Сканирование книг

Иногда встречаются книги, угол раскрытия которых ограничен их состоянием (возможен раскол блока из-за ветхости или книга имеет слишком плотную сшивку). Тогда работа проводится на сканере с V-образной колыбелью, который позволяет получать высококачественные образы без потери информации в области сшивки. Чтобы страницы при сканировании не двигались, а готовая картинка получалась гарантированно точной, используются специальные стекла, позволяющие придерживать страницы, но не дающее никаких артефактов на образе.

Сканирование широкоформатных документов, карт и чертежей

Документы больших форматов (например, карты времен Великой Отечественной войны из Центрального Архива Министерства Обороны) обрабатываются на комплексах высококачественного сканирования «ЭЛАР ПауэрСкан». Оцифровка ветхих карт и чертежей – сложный процесс, зачастую требующий нестандартных подходов и оборудования. Для этого подходит, например, сканер формата 8А0. На нем переведено в электронный вид множество уникальных объектов, например, карта боевого пути 223-й стрелковой Белградской Краснознаменной дивизии, выполненная на тканевом холсте размером примерно 6х3. При обработке материалов на оборудовании этого типа получаются цифровые образы очень высокого качества, на которых различимы все мелкие детали и даже структура бумаги.

Особое оборудование

Кстати, многие сканеры разрабатываются ЭЛАР самостоятельно и собираются здесь же, в соседних помещениях производственного центра.

Основные мощности

Когда нужно получать высококачественные электронные образы ветхих и сшитых документов в потоковом режиме, используется один из самых лучших по функциональным возможностям планетарный сканер – ЭЛАР ПланСкан серии «С». Только на Центральной производственной площадке ЭЛАР в Москве таких сканеров 64 единицы.

Внимание к оригиналам

Для каждого типа документов с целью передачи всех особенностей и обеспечения безопасности оригинала подбирается индивидуальный режим освещения. Благодаря этому графические образы всегда имеют высокое качество картинки и хорошую цветопередачу.

Работа с секретными документами

Среди возможностей ЭЛАР – обработка документов всех уровней секретности. Подобные работы осуществляются только на территории заказчика сертифицированными сотрудниками на сертифицированной технике и в сертифицированной системе.

Учет документов

Все участки сканирования оборудованы стеллажами для зонирования документов. На каждом стеллаже есть маркировки: «На сканирование», «На проверку», «На сканирование карт», «На сшивку». Учет также ведется и в автоматизированной системе. Любое дело легко найти, понять, на каком оно этапе, кто из операторов и в какой день с ним работал. После сканирования оператор возвращает дело на конкретный стеллаж. Массив графических образов отправляет на сервер в специальное защищенное хранилище. Эти операции также учитываются в автоматизированной системе, которая сама распределяет массивы графических образов по назначенным заранее этапам.

Школа для практиков

Операторов сканирования готовят здесь же – в Производственном управлении ЭЛАР. При приеме на работу они проходят базовый курс обучения, где знакомятся с основными типами сканеров, программным обеспечением, технологиями обращения с документами, должностными инструкциями и регламентами компании. После базового курса оператор начинает работать на проекте. Операторы, изучившие несколько типов сканеров, получившие практический опыт и дающие хорошие показатели скорости и качества сканирования, проходят аттестацию и повышают разряд.

Внимание к деталям

Перед началом работ на каждом проекте операторы проходят дополнительный технологический инструктаж. Изучаются нюансы выполнения работ, режимы сканирования, все необходимые операции, требования к готовым графическим образам. Инструктаж проводит технолог или руководитель группы операторов. Инструкция также присутствует на каждом рабочем месте оператора.

Проверка результатов

Когда дело полностью отсканировано и отправлено на сервер, автоматизированная система учета сканирования осуществляет его обрезку лишних полей. Затем она покажет результат оператору на этапе проверки полученных графических образов. Образы, требующие доработки, оператор дорабатывает самостоятельно. Образы, не соответствующие качеству сканирования, отправляются на пересканирование.

Финальный контроль сканирования

На этапе контроля массив готовых графических образов проходит проверку специальными программными средствами. Здесь определяется соответствие режимных требований по проекту (цветность, dpi, расширение, формат, размеры, сжатие и т.п.). Заключительную оценку качества готового массива образов даст отдел контроля качества.

Индексирование

Технологический департамент ретроконверсии (индексирования) – самое крупное подразделение ЭЛАР. Несколько тысяч человек в производственных центрах по всей стране извлекают информацию с отсканированных документов. На центральной производственной площадке в Москве трудятся более 100 человек, столько же – в стационарных центрах Твери и Екатеринбурга. Около 50 операторов работают на выездных проектах. Остальной штат – надомные операторы индексирования.

Любое количество, любые объемы

Основным достижением в ЭЛАР считают гибкость производства. В компании умеют оперативно распределять нагрузку между сотрудниками и расширять штат. Благодаря этому удается выполнять одновременно по 90 проектов, среди которых порой встречаются длительные задачи федерального уровня. Если необходимо стремительно увеличить мощности производства, действует готовая система быстрого набора и обучения персонала. Для массового набора штата в «высокий сезон» разработаны специальные программы тестирования соискателей на профпригодность через интернет, автоматизированные курсы обучения и проверки полученных знаний и навыков. Во всех подразделениях компании организована служба сертифицированных специалистов по обучению, работают наставники и кураторы для новичков. В региональных представительствах действуют учебные классы, где операторы индексирования осваивают технологии.

Начальный этап индексирования

Департамент ретроконверсии получает подготовленные электронные образы от Департамента сканирования, и операторы по заданным критериям того или иного проекта извлекают информацию из скан-копий.

Подходы к извлечению сведений

Технологии, скорость и стоимость формирования поисковых баз зависят от того, как написан и в каком состоянии находится документ. Напечатанные на современных принтерах тексты могут быть распознаны автоматически, а нужные данные извлечены с помощью применения шаблонов или автоэкстракции индексов. Напечатанные необычным шрифтом, в низком качестве или поврежденные тексты книг, газет, архивных документов распознать автоматически, как правило, невозможно, поэтому требуется ручной ввод или, по крайней мере, ручная проверка сведений.

Распределение нагрузки

ЭЛАР применяет запатентованную систему управления производственным циклом, которая позволяет в автоматическом режиме распределять нагрузку и контролировать работу. Операторам система «помогает» вводить информацию «подсказками». В ней постоянно пополняется словарь-справочник, поэтому порой достаточно ввести две первые буквы (адреса, наименования, названия), чтобы система сама ввела слово в поле полностью.

Обрабатываются абсолютно различные типы документов

Также применяются запатентованные технологии деперсонификации, позволяющие обрабатывать любую конфиденциальную информацию и персональные данные. Все проиндексированные данные собираются только в закрытом внутреннем контуре.

Контроль, двойной контроль

Для сокращения числа ошибок в компании применяют технологию двойного ввода, при котором два работника независимо друг от друга вбивают одинаковую информацию. Одинаково введенные данные считаются правильными, несовпадающие попадают к специалисту по верификации. В штате компании имеются профессиональные почерковеды, специалисты по технической документации и другие «узкие» специалисты, умеющие работать с различными видами документов.

Ни один массив не может быть сдан без приемки ОКК

Оцифровка – непрерывный процесс, на всех стадиях которого производится контроль результатов. Отдел контроля качества проверяет информационный ресурс на соответствие не только после сканирования, но и индексирования массива документов, а также после записи на диски для сдачи заказчику. Только так удается исключать ошибки в получаемых ресурсах.