Благодаря приложению Яндекс-Метрика, знаю количество посетителей сайта, какие страницы они посещают, когда, как часто и т.д и т.п. Но очень давно терзал вопрос — «А сколько самогонщиков «живет» в сети?». И вот недавно наткнулся на сервис Яндекс, который позволяет на основании данных о посетителях моего сайта, оценить — сколько похожих на меня пользователей интернета интересуются самогоноварением. Сервис называется Яндекс-Аудитории и работает по технологии Крипта . Крипта основана на методе машинного обучения Матрикснет. Она учится определять аудиторию, исследуя поведение в интернете её типичных представителей. Для успешного обучения ей нужно проанализировать поведение как минимум 30 тысяч пользователей. Как показывают эксперименты, этого количества уже достаточно для получения надёжного результата. Крипта изучает, как ведут себя типичные представители группы в сети: какие слова используют в запросах, сколько запросов задают за сессию, какие сайты посещают, в какое время суток выходят в интернет и т.д. Она анализирует около 300 факторов, характеризующих поведение пользователей, и рассчитывает значимость каждого из них для конкретной аудитории. В итоге получается формула, по которой Крипта определяет, относится человек к данной группе или нет. Потом формула проверяется на новой порции данных и, если нужно, корректируется. Для каждого пользователя интернета Крипта рассчитывает, какова вероятность его принадлежности к данной группе. Эти данные пересчитываются каждый день, чтобы успевать реагировать на изменения в интересах людей. Например, если переход в другую возрастную группу требует времени, то стать автолюбителем можно очень быстро).
После запуска сервиса, примерно через 2,5 часа, появились данные. Согласно данным Яндекса, похожих на меня посетителей сайта около 600 000 человек (выбрал параметр максимальная схожесть).