Сравнительный анализ программ для распознавания текста - Обзор проблематики и теоретических основ электронного документооборота

В данной части работы, рассмотрим необходимое программное обеспечение для распознавания и перевода вышеприведенных документов из графического формата в текстовый. Безусловно, лидер программ в распознавании текста является ABBYY FineReader, но, чтобы удостовериться в этом, проведем сравнительный анализ еще нескольких программ для распознавания текста из графического файла. В результате мы сможем, во-первых, оценить рынок доступных ПО для распознавания текста, во-вторых, указать сильные и слабые стороны каждого из них.

ABBYY FineReader 12 - это профессиональное программное обеспечение, с помощью которого можно распознавать текст из графического файла и переводить его в различные редактируемые форматы. Программа точно определяет текст и структурно его переводит в нужный формат. Она позволяет не перепечатывать текст в ручную, а это, в свою очередь, сокращает затраты на обработку. Данное ПО используется в фирмах и организациях, которые постоянно работают с бумажной документацией. ABBYY FineReader конвертирует файлы из форматов PDF, TIFF, JPEG в форматы PDF, DOC, XLSX, TXT и другие. [7]

начальное окно программы abbyy finereader 12

Рис.5 Начальное окно программы ABBYY FineReader 12

Далее проведем анализ на выявление слов с ошибками и качество обрабатываемого документа на примере 10 исполнительных листов:

Таблица 1 Данные, полученные при обработке документов программой ABBYY FineReader 12

Количество слов

Слов с ошибками (нет слов)

Без ошибок

Качество обработки %

1

111

11

100

90,09

2

124

10

114

91,94

3

273

3

270

98,90

4

151

13

138

91,39

5

144

16

128

88,89

6

178

9

169

94,94

7

199

2

197

98,99

8

201

3

198

98,51

9

121

25

96

79,34

10

126

25

101

80,16

Среднее значение

162,8

11,7

151,1

91,32

MIN

111

2

96

79,34

MAX

273

25

270

98,99

соотношение слов без ошибок к общему количеству слов (обработано abbyy finereader 12)

Рис.6 Соотношение слов без ошибок к общему количеству слов (обработано ABBYY FineReader 12)

Как видим из показанной выше диаграммы, программа ABBYY FineReader 12 очень качественно обрабатывает документы, переводя их из графического формата в текстовый формат. В среднем, количество распознанных слов составляет 91,3 %. Данное программное обеспечение показало себя, как качественный продукт. Также стоит отметить, что ключевые поля, по которым в дальнейшем будут выгружаться данные из документа, были распознаны хорошо и без ошибок, а значит, основную задачу оптимизации и автоматизации возможно реализовать.

Плюсы: высокое качество распознавания текстов, широкий выбор входных и выходных форматов документов, простой и понятный пользовательский интерфейс

Минусы: данное ПО платное, не имеется открытого доступа к исходным кодам программы (используя их, можно было бы запускать программу с помощью написанного кода на С#)

FREE ONLINE OCR SERVICE - это бесплатный он-лайн сервис для распознавания текста из различных форматов. Его легко и просто использовать любому пользователю, т. к. нет необходимости загружать и устанавливать программу на компьютер. Данный продукт поддерживает множество языков для распознавания (в том числе и русский).

Форматы выходных файлов в FREE ONLINE OCR SERVICE:

поддерживаемые форматы в free online ocr service

Рис. 7 Поддерживаемые форматы в FREE ONLINE OCR SERVICE

Имеется возможность перевести текст в один из трех форматов: Microsoft Word, Microsoft Excel и Text Plain. В основном, для быстрого распознавания текста этих форматов достаточно. Так как имеется необходимый в данной дипломной работе формат. txt, то сравним качество обработанного документа и вероятность некорректного перевода текста.

Таблица 2. Данные, полученные при обработке документов программой FREE ONLINE OCR SERVICE

Количество слов

Слов с ошибками (нет слов)

Без ошибок

Качество обработки %

1

111

14

97

87,39

2

124

61

63

50,81

3

273

120

153

56,04

4

151

20

131

86,75

5

144

22

122

84,72

6

178

156

22

12,36

7

199

5

194

97,49

8

201

12

189

94,03

9

121

73

48

39,67

10

126

43

83

65,87

Среднее значение

162,8

52,6

110,2

67,51

MIN

111

5

22

12,36

MAX

273

156

194

97,49

соотношение слов без ошибок к общему количеству слов (обработано free online ocr service)

Рис.8 Соотношение слов без ошибок к общему количеству слов (обработано FREE ONLINE OCR SERVICE)

Исходя из полученных результатов, можно сделать вывод, что данный сервис имеет высокий уровень распознавания текста. В среднем, количество распознанных слов составляет 67,5 %. Данный сервис является хорошим способом быстро распознать графический файл и перевести его в текстовый формат, но для оптимизации реального бизнес-процесса данный продукт не подходит из-за узкого спектра функциональных возможностей.

Плюсы: простота в использовании, быстрый доступ с любого устройства с выходом в интернет, множество языков для распознавания.

Минусы: в отличие от загруженных программ для оптического распознавания текста, данный продукт не имеет таких широких функциональных возможностей.

CuneiForm - это программа, используемая для распознавания текста документов и дальнейшего перевода в редактируемый вид. Данный продукт бесплатный и доступный любому пользователю. В результате работы программы можно получить файл в нужном формате с отредактированным текстом.

Форматы выходных файлов в CuneiForm:

поддерживаемые форматы в cuneiform

Рис.9 Поддерживаемые форматы в CuneiForm

Исходя из увиденного выше, делаем вывод, что данное ПО не поддерживает одни из основных форматов файлов, как Microsoft Word (расширение. doc) и Acrobat Reader DC (расширение. pdf). Следовательно, данный продукт будет проигрывать по широте использования тому же ABBYY FineReader 12. Но в этой дипломной работе как раз необходим текст исполнительного листа в формате. txt, поэтому сравним качество обработанного документа и вероятность некорректного перевода текста.

Таблица 3. Данные, полученные при обработке документов программой OCR CuneiForm

Количество слов

Слов с ошибками (нет слов)

Без ошибок

Качество обработки %

1

111

18

93

83,78

2

124

120

4

3,23

3

273

273

0

0,00

4

151

147

4

2,65

5

144

141

3

2,08

6

178

175

3

1,69

7

199

166

33

16,58

8

201

175

26

12,94

9

121

119

2

1,65

10

126

122

4

3,17

Среднее значение

162,8

145,6

17,2

12,78

MIN

111

18

0

0,00

MAX

273

273

93

83,78

OCR CuneiForm является низкокачественным программным продуктов для распознавания оптического текста. Основную часть слов переводит в непонятный набор символов или вообще не распознает. В среднем, количество распознанных слов составляет 12,8 %. Это очень низкое качество.

Плюсы: данная программа бесплатная, русифицированная, имеется доступ к исходным кодам программы (используя их, можно запускать программу для анализа графического документа с помощью написанного кода на С#)

Минусы: низкое качество распознавания

Выводы после проведенного анализа:

Анализ проводился без корректировки активных полей для распознавания, т. е. программы переводили текст только в тех местах графического файла, где они его определили. Суть распознавания без корректировки в том, что мы не тратим время на выбор того или иного поля, соответственно, не затрачиваем время на обработку. В таком виде анализа возможны потери качества, но так как основная цель дипломной работы - оптимизировать бизнес-процесс, значит, будем полагаться на корректную обработку документа программой для оптического распознавания текста.

Ниже представлена диаграмма, сравнивающая количество обработанных слов различными программами:

соотношение слов без ошибок к общему количеству слов для разных программ по распознаванию текста

Рис.10 Соотношение слов без ошибок к общему количеству слов для разных программ по распознаванию текста

качество обработки документов (количество обработанных слов, выраженное в процентах, %)

Рис.11 Качество обработки документов (количество обработанных слов, выраженное в процентах, %)

Исходя из результатов анализа, можно сделать вывод, что программа ABBYY FineReader является наилучшим продуктом для оптического распознавания графического файла. Данная программа имеет широкий спектр возможностей и множество плюсов. Сервис FREE ONLINE OCR SERVICE также неплох для быстрого распознавания текста на картинке, но не подходит для автоматизации бизнес-процесса из-за минимального функционала. Программное обеспечение OCR CuneiForm оказалось низкокачественным продуктом и не будет использовано в качестве программы, используемой в данной дипломной работе.

Также были проанализированы программы для распознавания текстов, такие как TopOCRDemo и Capture Text, но ни одна из них в нашем случае не показала достойных результатов в качественном переводе текста из графического формата в текстовый. В данной дипломной работе будет использована программа ABBYY FineReader 12.

Похожие статьи




Сравнительный анализ программ для распознавания текста - Обзор проблематики и теоретических основ электронного документооборота

Предыдущая | Следующая