Пользовательское соглашение

Правила применения рекомендательных технологий

На информационном ресурсе при применении информационных технологий предоставления информации осуществляется сбор, систематизация и анализ сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации.

Настоящие правила регулируют применение рекомендательных технологий на ресурсе (сервисе) «Амедиатека», размещенном в сети Интернет по адресу: https://amediateka.ru и также доступном для его пользователей в различных приложениях для устройств после установки специального программного обеспечения.

Настоящие правила разработаны Обществом с ограниченной ответственностью «А сериал», зарегистрированным по адресу: 115088, Российская Федерация, г. Москва, ул. Новоостаповская, дом 5, стр. 3, комн. В2-22 (ОГРН 1117746215201, ИНН 7722742614), в соответствии с Федеральным законом от 27 июля 2006 г. № 149-ФЗ «Об информации, информационных технологиях и о защите информации» (со всеми актуальными изменениями и дополнениями) и дополняют действующие пользовательское соглашение, размещенное по адресу: https://www.amediateka.ru/info/tos, и иные правовые документы сервиса «Амедиатека».

Настоящие правила определяют описание процессов и методов сбора, систематизации, анализа сведений, относящихся к предпочтениям пользователей аудиовизуального сервиса «Амедиатека», предоставления информации на основе этих сведений, способов осуществления таких процессов и методов, а также виды сведений, относящихся к предпочтениям пользователей аудиовизуального сервиса «Амедиатека», которые используются для предоставления информации с применением рекомендательных технологий, источники получения таких сведений.

Указанные в настоящих правилах рекомендательные технологии применяются только к контенту, доступному на сервисе «Амедиатека», и не применяются для предоставления пользователям контента, нарушающего права и законные интересы граждан и организаций, либо для распространения информации с нарушением законодательства Российской Федерации.

Настоящие правила размещены с беспрепятственным и безвозмездным доступом для всех пользователей сервиса «Амедиатека». Оставаясь на сервисе «Амедиатека», пользователь подтверждает, что ознакомлен и согласен с настоящими правилами.

Общество с ограниченной ответственностью «А сериал» вправе в любое время в одностороннем порядке изменять и/или дополнять условия настоящих правил. Такие изменения и/или дополнения вступают в силу с момента размещения новой версии правил применения рекомендательных технологий на сервисе «Амедиатека». При несогласии пользователя с внесенными изменениями он обязан отказаться от использования и доступа к сервису «Амедиатека», прекратить использование функционала, материалов, аудиовизуальных произведений и иных составляющих указанного сервиса. Продолжение использования сервиса «Амедиатека» пользователем означает принятие внесенных в настоящие правила изменений и/или дополнений.

Пользователь обязуется самостоятельно ознакомиться с условиями настоящих правил и отслеживать их изменения/дополнения путем регулярного, не реже 1 (одного) раза в 14 (четырнадцать) календарных дней, ознакомления с содержанием настоящих правил.

Что такое рекомендательные технологии

Представьте, что вы ведёте в кинотеатре записи о том, какие фильмы и сериалы смотрят посетители. Вы записываете, кто что смотрел, когда смотрел, смотрел ли до конца и сколько раз возвращался к просмотру. Это всё как бы ведёте в большой таблице. Когда новый фильм или сериал появляется, вы хотите порекомендовать его тем, кому он может понравиться. Как это сделать? Здесь на помощь приходят рекомендательные системы. Это как умные помощники, которые анализируют всю вашу таблицу и находят закономерности. Они смотрят на то, какие фильмы и сериалы любит зритель, и находят схожести между ними. Например, если кому-то нравится «Звёздные войны», то ему, скорее всего, понравится и «Звёздный путь». Рекомендательная система это и делает - она учится понимать, какие фильмы и сериалы похожи друг на друга. Таким образом, когда появляется новый фильм или сериал, система может порекомендовать его тем, кто любит похожие. Это и есть основная задача рекомендательной системы для пользователя - помочь зрителям найти фильм или сериал, которым им понравится.

Данные

Для обеспечения работы рекомендательной системы мы собираем полностью анонимизированные имеющиеся в рамках сервиса данные об истории просмотров пользователя, представляющие из себя простую таблицу из следующих колонок:

идентификатор пользователя;
дата и время просмотра;
идентификатор фильма или сериала.

Никакие другие демографические данные о пользователе не собираются - текущих данных достаточно для того, чтобы предположить какой другой фильм может посмотреть пользователь после текущего.

Сбор и систематизация

Основной формат данных, который используется для обучения рекомендательных систем - матрица взаимодействия пользователей и товаров (в нашем случае товары представляют собой фильмы и сериалы). Обозначим общее количество пользователей за N и общее количество предметов за M, тогда данные представляются матрицей R размера N × M, где элемент Rij описывает взаимодействие соответствующего пользователя и предмета - оно может быть бинарным или представлять собой реальную оценку, например, рейтинг.

Для более точного результата также можно добавлять дополнительные признаки в данные для обучения. Например, жанры фильмов и сериалов, год выпуска, длительность и так далее.

Для пользователей, для которых невозможно обучить модель, например, для новых пользователей или для зрителей, которые смотрели только фильмы/сериалы, которых больше нет в каталоге, рекомендации создаются на основе самых популярных фильмов и сериалов.

Анализ

Для каждого взаимодействия мы присваиваем балл, который приблизительно отражает насколько сильно пользователю нравится данный сериал или фильм. В качестве оценки мы рассматриваем процент фильма или сериала, который посмотрел пользователь. Идея заключается в том, что если пользователю понравился сериал, он посмотрит большую его часть или досмотрит его до конца. В тех случаях, когда пользователь пересматривает фильм или сериал несколько раз, мы также присваиваем максимальное значение.

В рамках рекомендательных систем на сервисе используется SASRec Модель. SASRec - одна из самых передовых и эффективных моделей глубокого обучения для последовательных рекомендаций. В этом сценарии временные данные присутствуют в обучающем наборе данных, что позволяет более точно моделировать поведение пользователей. В основе метода лежит механизм attention (рус. – внимание), который произвел революцию в современном глубоком обучении. Основная идея последовательного обучения заключается в том, чтобы предсказать следующий элемент по последовательности предыдущих элементов. Это может быть предсказание следующего слова, имея начало предложения. В системах последовательных рекомендаций целью является предсказание следующего элемента (например, фильма или сериала) на основе истории просмотренных фильмов и сериалов конкретного пользователя. Attention, по своей сути, рассматривает последовательность предыдущих элементов и оценивает «значимость» каждого элемента. Модель SASRec является обобщением простой языковой модели, основанной на методе attention, на область рекомендательных систем. В этой модели гиперпараметрами являются размерность пространства для вложений и максимальная длина последовательности.

Генерация рекомендаций

Процесс генерации персонализированных рекомендаций для пользователей включает использование модели понимания сходства элементов. Во время обучения модель изучает попарное сходство между элементами и создает матрицу сходства для количественной оценки этих отношений. Эта матрица является важной для определения того, насколько похожи пары элементов. Комбинируя эту информацию с изученными предпочтениями пользователей, модель может назначать баллы каждому элементу, указывая их относительную значимость для интересов пользователя. Для генерации персонализированных рекомендаций, используя матрицу сходства, алгоритм следует определенной процедуре. Он принимает список элементов, их соответствующие баллы и два этапа. Сначала алгоритм выбирает в рамках первого этапа определенное количество последовательных элементов с наивысшими баллами, фокусируясь на исторических моделях и предпочтениях пользователя. Эти элементы с наивысшими баллами служат отправной точкой. Затем для каждого выбранного элемента алгоритм идентифицирует во втором этапе определенное количество наиболее похожих элементов, используя матрицу сходства. Рассматривая отношения между элементами, он уточняет выбор, чтобы включить элементы, близкие к предпочтениям пользователя. Этот двухэтапный подход позволяет системе рекомендаций эффективно генерировать разнообразный набор рекомендаций. Он начинается с идентификации набора элементов с высокими баллами, а затем уточняет список на основе сходства 3 элементов, обеспечивая всесторонний диапазон рекомендаций.

Для пользователей без исторических данных алгоритм полагается на информацию, хранящуюся в матрице сходства. Он ранжирует элементы на основе их сходства с элементом, который пользователь в настоящее время просматривает, и соответствующим образом выбирает лучшие рекомендации. Используя баллы и сходство элементов, система рекомендаций может предоставлять персонализированные предложения даже для пользователей без известной истории. Рекомендации основаны на сходстве между различными элементами, что позволяет универсальный подход в предоставлении рекомендаций.

Представление данных на основе рекомендательных технологий

На текущий момент рекомендации используются в блоке «Вам понравится» на странице отдельных сериалов и фильмов на сайте Амедиатеки в браузерной версии для персонального компьютера.