Принцип работы поиска на Ozon

Поиск на Ozon — это не только система ранжирования товаров в соответствии с текстовыми запросами покупателей.
Это также система распределения трафика и определения актуальности предложения товаров, подсказки в поисковой строке и фильтры на странице с выдачей.
На результаты поисковой выдачи могут повлиять не только покупатели, но и продавцы.
Традиционно первые позиции в поиске имеют более высокие показатели эффективности
Конверсия из показов (на главной, в категориях, поисковой выдаче, рекомендациях и др.) в добавление товара в корзину в зависимости от позиции в выдаче.

Место товара в поиске влияет на коммерческие показатели товара: конверсии из показов в добавление в «Корзину», из «Корзины» — в заказ. Поиск устроен таким образом, что продавцы могут прямо, прозрачно и предсказуемо влиять на позицию своих товаров в поисковой выдаче. Благодаря тому, что качественные предложения от проверенных продавцов находятся в выдаче выше, они получают больше трафика — а значит, и больше продаж.
Ozon определяет, что такое качественное предложение, опираясь на цену, качество товара и скорость доставки. Тем продавцам, кто делает наилучшее предложение, Ozon предлагает бесплатные механизмы продвижения в выдаче. То есть, если вы продаёте хорошие товары с высокой оценкой от покупателей и позитивными отзывами, качественно заполняете карточки товаров, предлагаете быструю доставку и делаете лучшее предложение цены, то ваши товары сами будут продвигаться в поиске, стремясь к верхним позициям.

Как покупатель находит то, что ищет

Каждый из вас был по ту сторону экрана в качестве покупателя. Кто-то искал товары для дома, кто-то — подарки близким, кто-то — подгузники и так далее. Большинство покупок начинается с поискового запроса.

Пример

Покупатель пришёл на Ozon за носками (пусть будут красные). Он делает поисковый запрос на сайте в поисковой строке и пишет: «красные носки». Казалось бы, простое действие, но за ним следует несколько этапов работы поисковой системы.

Как только пользователь делает запрос, система сразу же начинает искать подходящие товары. У каждого товара есть атрибуты: название, цвет, бренд, размер и так далее. Чем больше строчек вы заполнили информацией о товаре, тем проще системе найти и предложить покупателю именно то, что ему нужно.
Чтобы случайно не упустить подходящие позиции в категориях товаров, алгоритм настраивает область поиска и оптимизирует процесс. Добавляются синонимы и похожие товары, например: коктейльное/вечернее платье, очиститель/увлажнитель воздуха, фен/стайлер для волос и так далее.

Все слова сводятся к одному формату. Исключаются союзы, множественные числа, слова без смысловой нагрузки. Дальше система отбирает те товары, в которых есть все слова запроса. Если список слишком короткий, к нему добавляются карточки, в которых есть хотя бы часть запроса. Готовая подборка переходит на второй этап.
Как вы можете это использовать: регулярно изучайте поисковые запросы и дополняйте информацию о товарах, чтобы проанализировать поведение пользователей и уловить тренды. Например, если запрос «пиджак» встречается намного чаще, чем «жакет», стоит пересмотреть название товара в пользу этого наименования.
1
Формирование запроса и отбор кандидатов
Ежедневно покупатели задают поисковой системе Ozon миллионы запросов. Чтобы каждый нашёл среди миллионов товаров нужный, на первом этапе поиск формирует большой список товаров-кандидатов, в названии, характеристиках и описании которых есть слова из поискового запроса. Для каждого запроса в этом списке может оказаться до 500 000 товаров. Такой своеобразный long-list, который будет обрабатываться и сокращаться на следующих этапах, чтобы показать наиболее подходящие предложения аудитории Ozon.
2
Базовый слой ранжирования

Поисковая система сортирует полученных кандидатов (товары, не пользователей), чтобы отобрать 2000 единиц с наибольшей текстовой релевантностью.


Также на данном этапе учитывается рейтинг товара в качестве повышающего коэффициента. Чем выше рейтинг, тем больше коэффициент. В итоге товары получают оценку базовой релевантности как совокупности текстового соответствия и рейтинга.

3
Средний слой ранжирования (машинно обученная модель)
В отношении полученных 2000 товаров система оценивает, с какой вероятностью покупатели приобретут именно их. Ранжирование зависит от того, какие свойства оказались наиболее важными для покупателей в прошлом. Чтобы выяснить это, Ozon сопоставляет свойства товаров с покупательским поведением. Сложная аналитика, объясним на примере ниже.

При прочих равных покупатели предпочитают товары с большим количеством отзывов. Чем больше отзывов, тем выше будет товар в поисковой выдаче. При этом разные свойства товаров имеют свой «вес» и по-разному влияют на вероятность покупки. Обучение модели строится на использовании данных о зависимости между свойствами товаров и итоговыми покупками. То есть покупатели влияют на положение товаров в поисковой выдаче своими действиями. И прежде всего, на выдачу влияет факт покупки товара (чем большее количество раз этот товар приобрели пользователи, тем больше шансов у него оказаться выше в поисковой выдаче).

Главное, что происходит на 3 этапе — формируется оценка каждого товара по шкале от 0 до 1, на основе которой и ранжируются товары.
4
Бустинги
К 2000 товаров, которые после предыдущего шага ранжированы по шкале от 0 до 1, применяются заранее определённые повышающие коэффициенты. Словно, эти товары толкают на лифте вверх. Возвращаясь к примеру с красными носками, можно представить, что если у какого-то предложения была оценка 0,5, то в случае платного продвижения она поднимется до 0,6 (условно). При этом могут сработать и понижающие факторы, например, рост цены на товар. Подробнее работу бустингов разберём далее.
5
Отображение товаров
2000 товаров с финальными оценками отдаются на страницу результатов поиска, словно попадают на первые ряды витрины магазинов. Покупатель видит страницы с товарами в заданном порядке. Когда он просмотрит 2000 товаров, система подгрузит следующую пару тысяч.
Резюмируем
Когда пользователь вводит поисковый запрос, система действует следующим образом:
  • сначала формирует long-list, в который могут войти до 500 000 товаров;
  • затем выбирает 2000 самых лучших, релевантных поисковому запросу;
  • ранжирует их, оценивая товары по шкале от 0 до 1;
  • те товары, которые соответствуют условиям бустинга, двигает дополнительно вверх;
  • показывает первые 2000 товаров в заданном порядке и затем следующие 2000, если пользователь продолжает поиск.
Made on
Tilda