новая версия системы ИИ для распознавания документов

новая версия системы ИИ для распознавания документов

новая версия системы ИИ для распознавания документов

События \\ 21.06.2018 23:03

Вторая версия Smart IDReader с помощью нового ИИ прибавила в скорости и качестве распознавания документов со смартфонов

Smart Engines представляет новую версию системы искусственного интеллекта для распознавания документов Smart IDReader 2.0. Вторая версия, созданная с применением глубоких разреженных дискретных нейронных сетей, может распознавать в видеопотоке и на изображениях сотни видов официальных документов, типовые формы формата А4 и поддерживает произвольные ракурсы съемки, удобные пользователю. Продукт нацелен на рынки РФ и стран бывшего СССР.

«3 года назад мы первыми предложили клиентам распознавать паспорт РФ в мобильных приложениях, показывая документ камере телефона. Это был новый пользовательский опыт, и мы очень рады, что рынок его принял. Вторая версия Smart IDReader — это история про новые стандарты в распознавании документов. Клиентам не нужны системы OCR, которые распознают скан паспорта за 5 секунд на мощном компьютере и не умеют обрабатывать фотографии с легко читаемым текстом просто потому, что система не научена законам перспективы. Пользователи хотят буквально за 1 секунду распознавать наспех сделанные фотографии и выполнять real-time распознавание в видеопотоке», – комментирует генеральный директор Smart Engines к.т.н. Владимир Арлазаров.

Использование в версии Smart IDReader 2.0 вычислительно-эффективных алгоритмов машинного зрения и 8-битной модели вычислений позволило специалистам Smart Engines перейти технологический барьер от распознавания на мобильных телефонах документов размера А5 и В5 (паспорт РФ) до типовых удостоверяющих документов и произвольных анкет, заявлений, договоров формата А4. При распознавании «больших» документов в видеопотоке в мобильном приложении требуются принципиально новые подходы к проведению вычислений, так как в отличие от серверных решений производительность смартфона ограничена и для ускорения распознавания невозможно просто подключить дополнительное «ядро».

Развитие дистанционных каналов обслуживания является одной из основных сфер применения технологий распознавания документов. Зачастую клиенты отправляют при обращении фотографии, на которых документы из-за проективных искажений представляют собой непрямоугольные четырехугольники, а в случае паспорта РФ — так называемую «книжку». OCR-технологии, ориентированные на работу со сканами, при обработке таких фотографий могут давать качество на уровне 5-10% и менее. Smart IDReader 2.0 умеет исправлять проективные искажения как на фотографиях, так и при работе с видеопотоком в мобильных приложениях, предлагая пользователю показывать документ камере как ему удобно. Технологически возможность распознавания при этом обеспечивается практически до того момента, пока документ может прочитать без ошибок человек.

Пример распознавания паспорта РФ на фотографии с помощью Smart IDReader 2.0

Благодаря проведенным алгоритмическим и программным оптимизациям в Smart IDReader 2.0 удалось достигнуть двукратного увеличения точности распознавания. Это означает, что количество ошибок распознавания, которые попадают на верификацию человеку, по сравнению с первым поколением системы сократилось примерно в 2 раза.

В новой версии появилась возможность распознавания паспортов гражданина РФ с рукописным заполнением. И, хотя количество таких документов относительно общего числа невелико, их обработка не только актуальна в различных финансовых сервисах, но и является очередным научным вызовом. Для обработки рукописных паспортов в решении Smart Engines реализованы автоматическая детекция рукописного заполнения и возможность распознавания (помимо номера документа) пола, дат и номера подразделения.

Достигнутые сотрудниками Smart Engines результаты стали возможны благодаря решению целого пласта сложных научно-технических задач в области компьютерного зрения и искусственного интеллекта. Научное подтверждение полученных результатов нашло свое отражение в 2 защищенных кандидатских диссертациях и в более чем 40 статьях, опубликованных в рейтинговых российских и международных журналах.

Помимо распознавания паспорта РФ, СНИЛС, водительских удостоверений, СТС и документов с машиночитаемой зоной, доступного уже в первой версии, Smart IDReader 2.0 умеет распознавать 15 новых видов документов РФ, 20 документов стран бывшего СССР и более 200 документов стран мира на более чем 35 языках. Добавление новых типов документов и языков распознавания реализовано на базе оригинальной разработки Smart Engines в области зрительного интеллекта — технологической платформы HIEROGLYPH.

Документы РФ

  1. Внутренний паспорт гражданина РФ
  2. Заграничный паспорт гражданина РФ (старого и нового образцов)
  3. СНИЛС
  4. Водительское удостоверение
  5. Свидетельство о регистрации ТС
  6. Паспорт ТС
  7. Диагностическая карта
  8. Свидетельство о постановке на учет (ИНН)
  9. Виза РФ
  10. Полис ОМС
  11. Свидетельство о рождении
  12. Свидетельство о смерти
  13. Свидетельство о заключении брака
  14. Свидетельство о расторжении брака
  15. Разрешение на работу РФ
  16. Вид на жительство РФ
  17. Военный билет
  18. Удостоверение сотрудника МВД
  19. Удостоверение военнослужащего

Документы стран бывшего СССР

  1. Азербайджан (Свидетельство о регистрации ТС)
  2. Армения (Паспорт, ID)
  3. Беларусь (Паспорт, Внутренний паспорт, Водительское удостоверение, Свидетельство о регистрации ТС)
  4. Грузия (Паспорт, ID)
  5. Казахстан (Паспорт, ID, Водительское удостоверение, Свидетельство о регистрации ТС)
  6. Киргизия (Паспорт, ID)
  7. Латвия (ID)
  8. Литва (ID)
  9. Молдова (ID, Водительское удостоверение)
  10. Таджикистан (Паспорт)
  11. Узбекистан (Паспорт)
  12. Украина (Паспорт, ID, Водительское удостоверение, Свидетельство о регистрации ТС)
  13. Эстония (ID)

С точки зрения базового (универсального) функционала улучшено качество распознавания эмбоссированных и неэмбоссированных банковских карт, машиночитаемой зоны на любых документах с MRZ и реализовано распознавание штрихкодов с высокой плотностью печати. В видеопотоке, на фотографиях и сканах обеспечена поддержка распознавания одномерных штрихкодов UPC-A, UPC-E, EAN-8, EAN-13, Code 39, Code 93, Code 128 и двумерных QR Code, Data Matrix, Aztec, PDF 417.

Алгоритмическая база Smart IDReader оптимизирована для архитектур «Эльбрус», SPARC, MIPS, ARM, x86 и совместима с операционными системами iOS, Android, Sailfish Mobile OS RUS, «Эльбрус», Linux (включая Astra Linux и «Атликс»), Windows, macOS и Solaris. Решение относится к классу платформонезависимых — качество распознавания не зависит от используемой ОС и аппаратной платформы, а быстродействие определяется доступными вычислительными ресурсами.

Smart IDReader успешно применяется в банках, страховых компаниях, проектах шеринговой экономики, финтехе, в различных сервисах с дистанционным и выездным обслуживанием, где для оказания услуг клиентам требуется предоставление своих данных. Пользователями системы являются Альфа-Банк, Почта Банк, Тинькофф Банк, Совкомбанк, АльфаСтрахование, Ингосстрах, Ренессанс Страхование, СКБ Контур, QIWI и др.

Schneider Electric соберет экспертов электроснабжения всей страны на Energy Days

События \\ 14.06.2018 16:31 \\ Обсудить ()

Компания Schneider Electric, мировой эксперт в управлении энергией и автоматизации, объявляет о старте серии технических конференций для профессионалов в области сетей и систем электроснабжения среднего напряжения Energy Days. Впервые подобное событие проводится во всероссийском масштабе: семинары запланированы в более чем 30 городах страны, в которых примут участие более 1200 специалистов и руководителей.

Российские и польские ветераны почтили память героев Второй Мировой

События \\ 23.05.2018 17:11 \\ Обсудить ()

В рамках Международной патриотической акции "Поезд Дружбы" 22 мая 2018 года в Парке Победы на Поклонной горе прошла торжественная церемония возложения венков и цветов к Вечному Огню. В событии приняли участие ветераны Войска Польского - участники Второй Мировой войны, российские ветераны - члены общественных организаций "Боевое братство", "Офицеры России", "Союз десантников России", студенты МПГУ (Института Истории и Политики, Института Филологии, Факультета педагогики и психологии), кадеты и воспитанники военно-патриотических клубов Москвы и Московской области.

Мобильный центр управления «Визор» компании СТЭП ЛОДЖИК обеспечил мониторинг оперативной обстановки  при проведении акции «Лес Победы»

Мобильный центр управления «Визор» компании СТЭП ЛОДЖИК обеспечил мониторинг оперативной обстановки при проведении акции «Лес Победы»

События \\ 23.05.2018 16:15 \\ Обсудить ()

Разработка СТЭП ЛОДЖИК, мобильный центр управления Визор, обеспечил мониторинг оперативной обстановки в ежегодной масштабной экологической акции – «Лес Победы». Мероприятие состоялось при поддержке Правительства Московской области и Комитета лесного хозяйства Московской области.

Securika Moscow 2018 в отзывах участников

Securika Moscow 2018 в отзывах участников

События \\ 16.05.2018 13:15 \\ Обсудить ()

Больше месяца прошло с момента завершения Международной выставки технических средств охраны и оборудования для обеспечения безопасности и противопожарной защиты Securika Moscow (MIPS), проходившей с 20 по 23 марта 2018 года на территории ЦВК «Экспоцентр». Команда выставки собрала мнения участников ключевого мероприятия в отрасли безопасности.

АСУ ТП Торнадо получила защиту от киберугроз Infowatch ASAP

События \\ 11.05.2018 17:30 \\ Обсудить ()

Новосибирск, 11 мая 2018 - На новосибирской багерной насосной ТЭЦ-5 завершены интеграционные испытания защищённой АСУ ТП от российских производителей.

Защита московского метро

Защита московского метро

События \\ 26.04.2018 17:02 \\ Обсудить ()

Участники ТБ Форума обсудят актуальные задачи по обеспечению безопасности и защищенности Московского метрополитена.

Хакеры Lazarus переключились на Центральную Америку

Хакеры Lazarus переключились на Центральную Америку

События \\ 26.04.2018 16:26 \\ Обсудить ()

Специалисты ESET обнаружили новые следы активности кибергруппы Lazarus. Эксперты установили, что хакеры стоят за атаками на онлайн-казино в Центральной Америке и некоторые другие цели.

Баку второй год подряд принимает самую масштабную русскоговорящую конференцию по информационной безопасности

Баку второй год подряд принимает самую масштабную русскоговорящую конференцию по информационной безопасности

События \\ 26.04.2018 16:00 \\ Обсудить ()

22 мая 2018 в Holiday Inn Баку специалисты из России и Азербайджана обсудят главные вопросы информационной безопасности.

TEGRUS вошел с ТОП-10 ИТ-поставщиков для розницы

TEGRUS вошел с ТОП-10 ИТ-поставщиков для розницы

События \\ 26.04.2018 15:08 \\ Обсудить ()

CNews включило TEGRUS в ТОП-10 ведущих поставщиков ИТ-решений для розницы. В списке «Крупнейших поставщиков ИТ в рознице», составленном CNews по итогам работы известных ИТ-компаний в 2017 году, системный интегратор занял престижную восьмую позицию.

ESET завоевала рекордное число наград конкурса в области сервиса CX WORLD AWARDS 2018

ESET завоевала рекордное число наград конкурса в области сервиса CX WORLD AWARDS 2018

События \\ 20.04.2018 17:02 \\ Обсудить ()

В этом году компания заработала сразу четыре номинации и завоевала престижные награды в каждой из них.

Статьи

Налог с самозанятых граждан: когда его внедрят и как он будет исчисляться?

Налог с самозанятых граждан: когда его внедрят и как он будет исчисляться?

Законодательство по безопасности \\ О том, что министерство финансов хочет внедрить в систему налогообложения налог с замозанятых, мы слышали давно. Но как он будет исчисляться и кого именно затронет нововведение было не ясно. До недавнего времени.

Блокчейн: простыми словами о сложном

Блокчейн: простыми словами о сложном

Программное обеспечение \\ Представьте себе мир без банков, нотариусов, регуляторов… Похоже на фантастику? Нет, это вполне осуществимая идея, помочь воплотить которую может блокчейн.

Тенденции безопасной идентификации

Тенденции безопасной идентификации

Комплексные системы безопасности \\ Мобильный доступ достиг того переломного момента, когда он становится доступным для массового использования, а мобильные устройства все более активно применяются для задач безопасной идентификации.

Как защитить ребенка от вреда в Интернете?

Как защитить ребенка от вреда в Интернете?

Профилактика преступлений \\ Интернет – это информационная платформа, которую сложнее всего контролировать. Он богат, как полезным контентом, так и опасным.

вверх