Применение разработанной системы, Описание модулей системы - Обзор проблематики и теоретических основ электронного документооборота

Описание модулей системы

Первый модуль - это перевод документов из формата pdf в формат txt. Как было представлено ранее, самым качественным ПО для оптического распознавания текста оказался ABBY FIneReader 12. Данная программа наиболее корректно переводит документы из изображения в текстовый формат. Из-за невозможности получить доступ к исходным кодам данной программы подразумевается, что сотрудник будет выполнять данный модуль вручную. На рисунке 19 представлен перевод сканированного файла из формата pdf в формат txt.

пример обрабатываемого текста в abbyy finereader 12

Рис. 19 Пример обрабатываемого текста в ABBYY FineReader 12.

Второй модуль заключается в том, чтобы внести текстовые фалы в окно программы. Данный модуль реализован на языке C# на платформе Microsoft Visual Studio 2015. Метод взаимодействия пользователя и программы - Windows Forms. Данный модуль работает следующим образом: при запуске программы в окне Form имеется кнопка "загрузка файлов". По нажатию на нее можно выбрать те самые переведенные файлы в формате txt. На рисунке 20 показано начальное окно с активной кнопкой "загрузка из файла".

начальное окно программы с активной кнопкой

Рис. 20 Начальное окно программы с активной кнопкой.

Третий модуль - это анализ загруженных файлов из модуля 2 и загрузка полученных в ходе анализа данных в локальную базу данных.

Данный модуль был реализован с помощью Visual Studio 2015. Для работы данного модуля имеется кнопка "Анализ и занесение в таблицу", которая становится активной только после нажатия на кнопку "загрузка из файла". Последовательность активации кнопок сделана для того, чтобы соблюсти правильный ход выполнения программы. Обработка и анализ по нажатию кнопки данного модуля происходит следующим образом: полученный массив входящих файлов перебирается и разбивается на массив слов из каждого документа. Далее, с помощью конструкции if - else ищутся по заранее заданным параметрам ключевые слова в массиве слов и заносятся в строку таблицы, которая по окончании цикла добавляется в строку базы данных. И так происходит для каждого файла. На рисунке можем видеть пример обработанных и занесенных в таблицу данных.

проанализированные и занесенные данные

Рис. 21 Проанализированные и занесенные данные.

Сложность заключается в том, что программа для распознавания текста не всегда правильно распознает слова и, соответственно, часть информации может не загрузиться в таблицу. Именно для этого в данной системе была реализована локальная база данных без ограничения на внесение изменений информации.

Четвертый модуль данной программы - это создание акта приема-передачи. Данный модуль также реализован на языке C#. В данном модуле имеется кнопка "Экспорт в Excel", которая становится активной, только после нажатия на кнопку "Анализ и занесение в таблицу". При нажатии на кнопку полученная из БД информация будет выгружена в файл Excel, сделанный в формате акта приема-передачи документов. На рисунке 22 показано, как это выглядит

выгрузка данных из бд в excel для акта приема-передачи

Рис. 22 Выгрузка данных из БД в Excel для акта приема-передачи

В дальнейшем данный акт можно направлять по почте в территориальные офисы банка или в коллекторские агентства с уведомлением о том, что документы направлены в работу.

Похожие статьи




Применение разработанной системы, Описание модулей системы - Обзор проблематики и теоретических основ электронного документооборота

Предыдущая | Следующая