OCR сегодня - Технологии и средства сканирования и распознавания графических и текстовых печатных материалов

В настоящее время на рынке систем распознавания существует ряд разработок, ориентированных как на различные сферы деятельности пользователя, так и на разные платформы.

Название

Лицензия

Поддерживаемые ОС

Заметки

FineReaderOnline. ru

Коммерческая

Online

Online OCR сервис, позволяющий распознатьмногоязычный текст из отсканированного документа или фотографии. Конвертирует результат в редактируемые форматы (PDF, PDF/A, DOC, RTF, XLS, TXT).

На данный момент до 10 страниц в день можно распознавать бесплатно.

OnlineOCR. ru

Коммерческая

Online

Online OCR сервис позволяет распознать многоязыковой текст из сканированного документа или фотографии. Конвертирует результат в редактируемые форматы (PDF, DOC, XLS, TXT, HTML)

ExperVision TypeReader &; RTK

Коммерческая

Windows, Mac OS X, Unix, Linux, OS/2

Получала высокие оценки в начале 1990-х.

ABBYY FineReader

Коммерческая и собственническая

Windows; Linux, Mac OS (не для конечного потребителя)

Для работы с различными языками требуется поддержка соответствующего языка.

OmniPage

Коммерческая (Nuance EULA)

Windows, Mac OS

Производство Nuance Communications

Readiris

Коммерческая и собственническая

Windows, Mac OS

Производство бельгийской фирмы - I. R.I. S. Group. Содержит региональные пакеты для распознавания азиатских языков и языков среднего востока.

Persian Reader

Коммерческая и собственническая

Windows

Специализируется на персидском языке (фарси).

Kirtas Technologies Arabic OCR

Коммерческая

Windows

Может распознавать арабские и английские символы на одной странице.

Zonal OCR

Коммерческая и собственническая

Windows

Zonal OCR помогает автоматизировать извлечение данных из компьютерных изображений.

ViewWise компании Computhink

Коммерческая и собственническая

Windows

Система управления документами

GOCR

GPL

Кросс-платформенная

В начальной стадии разработки

CuneiForm

BSD

Windows (с GUI), Linux, Mac OS, FreeBSD (CLI)

Промышленная, многоязычная система, умеет сохранять форматирование текста и распознает запутанные таблицы произвольной структуры

NovoDynamics VERUS

Коммерческая и собственническая

_______

Специализируется на языках среднего востока

Microsoft Office Document Imaging

Коммерческая

Windows, Mac OS X

Современные средства Microsoft Office предоставляют возможности сканирования. Document Scanning - позволяет управлять сканированием документа с применением любого установленного сканера, а Document Imaging - позволяет производить просмотр результатов на экране, осуществлять перекомпоновку многостраничных документов, выделять и обрабатывать распознанный текст, отправлять документы по электронной почте.

Microsoft Office OneNote 2007

Коммерческая

Windows

Brainware

Коммерческая и собственническая

Windows

Извлечение данных из документов и их обработка; например счета, извещения, накладные и платежки

HOCR

GPL

Linux

Распознавание текстов на иврите

OCRopus

Apache

Linux

Расширяемая система распознавания, которая может использовать Tesseract

ReadSoft

Коммерческая и собственническая

Windows

Сканирование, распознавание и классификация деловых бумаг, например договоров, счетов и платежных поручений.

Scantron Cognition

Коммерческая и

Собственническая

Windows

Для работы с различными языками требуется поддержка соответствующего языка.

RelayFax Network Fax Managerкомпании Alt-N Technologies

Коммерческая и собственническая

Windows

Многоязычная система используется для преобразования факсов в доступные для правки форматы документов (doc, pdf, и т. д...).

SILVERCODERS OCR Server

Коммерческая и собственническая

Linux

Серверная многоязыковая система, имеет высокое качество распознавания, может сохранять форматирование текста и распознает запутанные таблицы произвольной структуры

SmartScore

Коммерческая и собственническая

Windows, Mac OS

Для распознавания нотной записи

Tesseract

Apache

Windows, Mac OS X, Linux, OS/2

Разрабатывается компанией Google

WeOCR

MIT/X Consortium

Интерфейс: Браузер; Сервер: POSIX, Unix

Платформа для браузерных систем распознавания символов. Страница проекта: WeOCR

* краткий обзор существующих систем оптического распознавания информации.

Похожие статьи




OCR сегодня - Технологии и средства сканирования и распознавания графических и текстовых печатных материалов

Предыдущая | Следующая