Коллаборативная фильтрация

В нынешнем обществе, пользующимся современными технологиями, нередко употребляются термины, которые понятны далеко не всем. В данной статье разберёмся, что такое коллаборативная фильтрация, говоря простыми словами.

Для начала стоит разобраться в том, что такое коллаборация. В ближайшее время на сайте появится подбробный разбор этого термина, но если кратко, то коллаборация – это совместная деятельность в какой-либо сфере нескольких людей или организаций для достижения общих целей, проще говоря – это сотрудничество.

Говоря простыми словами, коллаборативная фильтрация (или, как её ещё называют, совместная фильтрация) – это метод построения рекомендаций в рекомендательных системах, которые используют предпочтения группы пользователей для того, чтобы спрогнозировать предпочтения для другого пользователя.

Работает коллаборативная фильтрация по следующему принципу… Пользователи выражают своё мнение о неких продуктах или услугах на сайте – дают им свою оценку, оставляют отзывы. В итоге можно сформировать группу пользователей с одинаковыми интересами – им нравятся одни товары или услуги, но совершенно не нравятся другие. Проще говоря, у этой группы пользователей будут одни и те же вкусы. Например, если брать музыку, то некоторых пользователям нравится попса, и они не ненавидят тяжёлый рок. Им нравится зарубежная попса, но они не любят отечественных исполнителей. Если солидная часть этой группы пользователей также высоко ценит другие товары, например, подстиль Прогрессив-транс, то и остальным членам этой группы будет предлагаться оценить такую музыку.



Пример, с которым многие пользователи уже сталкивались самостоятельно: подбор фильмов на Яндексе. Достаточно вбить в поиске название жанра (и зайти в свою почту на Яндексе), и Вы получите рекомендации, которые изначально обусловлены лишь рейтингом фильмов в целом. Если же Вы оцените несколько фильмов, то Вам будут предложены улучшенные рекомендации – на основе Ваших интересов.

Если сделать требуемое системой количество оценок (для нашего примера — 10), то система сможет предложить более точные рекомендации именно для Вас на основе того, что нравится людям, которые поставили оценённым Вами фильмам примерно такие же оценки.

Это и есть коллаборативная фильтрация. Система находит людей, которые разделяют оценочные суждения пользователя, а затем использует оценки этих людей, чтобы спрогнозировать то, что понравится и пользователю.

Такая же система работает и в другом сервисе Яндекс под названием «Яндекс.Музыка». Вы оцениваете музыкальные произведения, и на основе Ваших интересов составляются плейлисты.

У коллаборативной фильтрации есть немало проблем:

  • Холодный старт (новые пользователи, которым нечего порекомендовать без их собственных оценок и новые предметы для рекомендации, которые ещё не были оценены).
  • Неадекватные оценки (накрутка положительных или отрицательных отзывов, необъективный подход по одному из факторов, например, пользователь ненавидит Apple или Роберта Паттинсона и всегда ставит низкие оценки продуктам, связанным с ними).
  • Белые вороны (пользователи, мнение которых редко совпадает с мнение других людей – рекомендации на основе чужих интересов редко им помогают).
  • Разнообразие (Множество систем, связанных с коммерцией, рекомендует одни и те же товары от одних и тех же производителей, не давая шанса малоизвестным брендам получить свои «крохи»).
  • И т.п.

Коллаборативная фильтрация – не идеальный метод построения рекомендаций для пользователя, но он работает, и работает хорошо. По крайней мере, для большинства пользователей и в большинстве случаев.

2 КОММЕНТАРИИ

  1. Вот так по-тихоньку, то оттуда, то отсюда, да и собираются все данные о человеке. А потом система скажет, что с вероятностью 96% этот человек совершит преступление, его нужно посадить)

ОСТАВЬТЕ ОТВЕТ

Please enter your comment!
Please enter your name here