Дані про техпаспорти можуть знадобитися для оформлення цілого ряду документів в бізнесових та державних структурах. Але щоби внести їх у систему, доводиться заповнювати занадто багато полів вручну: 17 цифр і букв коду, номер техпаспорта, дані клієнта. Це займає багато часу, особливо у клієнтів, які самостійно оформляють електронний поліс.

У кожному полі менеджер, або сам клієнт може допустити банальну помилку, що додасть складнощів при подальшій роботі.

Ціль системи сканування (розпізнавання) документів 

Зробити процес оформлення максимально простим, зручним, швидким і звести до мінімуму можливість помилки. В ідеалі оформлення документа повинно займати лише кілька секунд, і для внесення даних достатньо буде просто зробити фото техпаспорта з обох сторін.

распознавание полей техпаспорта по фото

Кілька слів про технології розробки системи розпізнавання техпаспортів

При створенні системи розпізнавання документів ми використовували унікальні розробки Evergreen у сфері опрацювання зображення, алгоритмів отримання відповіді від бібліотек за допомогою API-ключа, а також загальнодоступні технології.

Оскільки кожен документ має різні значення та кількість полів, універсальних рішень тут немає. Але ми використовували технології навчання нейронних мереж (метод "навчання з учителем", а також принцип графіка градієнтного спуску з контрольними зрізами). А застосування афінних перетворень допомогло зробити розпізнавання кожного документа максимально точним навіть якщо фото зроблене з перспективою.

Тех-стек

Flask      Google OCR       Python      Redis

Як ми навчили систему розпізнавання техпаспортів правильно розпізнавати суперечливі дані

Також при створенні системи ми враховували, що зір людини і комп'ютера працюють по-різному. Наприклад, комп'ютерний зір не сприймає перспективу, а букву «I» при певному нахилі може побачити як точку або цифру «1». А оскільки машина не може усвідомити помилку, вона вносить дані так, як їх побачила.

Щоб уникнути таких помилок, ми навчили систему розпізнавати поля, використовуючи переваги штучного інтелекту. Наприклад, враховувати, що в імені та прізвищі не може бути цифр. Після відповідного навчання система навчилася розпізнавати поля де можливі тільки цифри або тільки букви. Тому якщо в полі з іменем чи прізвищем клієнта система розпізнавання техпаспортів бачить цифру «1», вона автоматично замінює її на «I», а цифру «0», на букву «о».

Також у залежності від типу полів система розпізнає з яким видом техпаспорта вона має справу: нового чи старого зразка.

Етапи верифікації фотографії системою розпізнавання техпаспорта:

• Отримання зображення
• Аналіз його положення в просторі
• Адаптація зображення для розпізнання (система повертає його в потрібне положення)
• Знаходження полів для розпізнавання зображення
• Обробка полів системою
• Процес розпізнавання окремо типу техпаспорта (старий чи новий формат), окремо полів (їх зчитування залежить від типу техпаспорта)
• Множинна обробка зображення для визначення кращого результату
• Обробка результатів розпізнавання (верифікація)
• Підготовка відповіді
• API-відповідь і його робота з довідниками CRM-системи клієнта

Як це виглядатиме для клієнта:

passport recognition

Сканування документів можна інтегрувати з бізнес-системами

Оскільки кожен бізнес працює з власною індивідуально налагодженою системою (CRM, 1С та ін.), інтеграція завжди відбувається індивідуально. При цьому ми враховуємо, що найчастіше в системах клієнта вже налаштовані власні довідники.

Інтеграція сервісу розпізнання техпаспортів в CRM-систему клієнта може виглядати таким чином, що при оформленні необхідного документа просто з'являється кнопка «завантажити зображення». Таким чином і клієнти, і співробітники сервісу отримують інтуїтивне розуміння як користуватися оновленою системою.

Також можлива інтеграція системи з чат-ботами, що дозволить максимально заощадити час співробітників і автоматизувати процес оформлення документа. Чат-бот може спілкуватися з клієнтом як через ваш сайт, так і через вайбер, телеграм, скайп і інші канали комунікації, а система розпізнавання техпаспортів зробить оформлення простим і швидким.

Правила завантаження фотографії для точного розпізнавання техпаспорта

Завантажити фотографію техпаспорта в систему можна двома способами:

А) зробити фото з телефону, планшета, якщо замовлення оформлюється онлайн з мобільного
Б) зробити фото з вебкамери, якщо замовлення оформлюється з ноутбука або стаціонарного комп'ютера в страховій
Керуючись правилом «Чим краще сфотографований техпаспорт, тим краще система його розпізнає», ми розробили рекомендації для кращого результату.

Отже, на фотографії:

1) Повинно бути видно всі 4 кути документа
2) На полях, які розпізнаються, не повинно бути видно відблисків і надмірно засвічених ділянок
3) Бажано, щоб не була завалена перспектива
4) Верхня частина паспорта повинна бути прямо перпендикулярною до лінії горизонту
5) Простий фон і освітлення
6) Техпаспорт повинен займати від 40% до 70% всього розміру фотографії.

При виконанні всіх цих рекомендацій точність розпізнання техпаспорта становить 92-94%. З огляду на ймовірність відхилення користувачами від стандарту, ми створили алгоритми, що дозволяють системі перевертати зображення, якщо воно  зроблене догори ногами або під кутом, що підвищує точність розпізнавання.

Важливо: з огляду на можливість невідповідності фото, зробленого користувачем, вимогам системи, ми завжди рекомендуємо переглянути заповнені поля людським оком. Таким чином клієнт або співробітник підтверджує правильність введених даних.

Обробка зображення після завантаження триває від 2 до 20-ти секунд в залежності від якості фотографії. По закінченню обробки користувач бачить екран із уже заповненими полями його анкети. Щойно правильність розпізнаних даних підтверджена (і за необхідності внесені мінімальні коригування), залишається тільки роздрукувати договір і підписати його.

Кому знадобиться програма для сканування техпаспортів

З використанням системи розпізнавання техпаспортів швидкість оформлення необхідних документів збільшується в кілька разів, підвищується зручність для менеджера і клієнта, знижується фактор людських помилок.

Якщо ж вам необхідне індивідуальне рішення, раді повідомити, що наша система розпізнавання техпаспортів має впроваджений штучний інтелект, відповідно, ми з легкістю можемо доопрацьовувати її під ваші потреби. Зацікавлені? Зв'яжіться з нами та отримаєте систему, яка підвищить ефективність вашого бізнесу в рази.

11.01.2019
Рейтинг: 5 / 5 (1)