Определение размерных таблиц для товаров интернет-магазина Taobao

Описание проекта

Клиент — виртуальная витрина портала Taobao, нацеленная на продажу товаров из Китая на европейский и российский рынки.

Российские покупатели испытывали сложности с определением размера покупаемой вещи. Эта проблема состоит из трёх подпроблем:
• Каждый продавец на Taobao имеет собственную размерную сетку;
• Размерные сетки не соответствовали российской системе размеров;
• Вся информация написана на китайском и зачастую на картинках.

Сложившаяся ситуация приводила к снижению конверсии.
Задача состояла в том, чтобы повысить конверсию веб-сайта путём разработки и введения единого стандарта размерных таблиц и системы распознавания размерных сеток. NTR Lab успешно внедрила систему распознавания размерных таблиц из изображений в описании товара и перевода иероглифов и символов на русский язык. Для выделения таблиц из картинок последовательно использовался целый ряд методик, лучшей из которых оказалась сверточная нейронная сеть.

Была внедрена серия алгоритмов для распознавания китайских иероглифов (цифр и букв размеров) с помощью опенсорсного OCR Tesseract. Создан статический специализированный словарь — с его помощью была реализована система перевода встречающихся в таблицах размеров и терминов.

Внедрение новой технологии привело к следующим экономическим результатам:
• Конверсия интернет-магазина возросла на 23%
• Вложенные в разработку средства окупились за 2 месяца