Боты атакуют. Кто накручивает зрителей на Twitch.tv
Добрый день!
Не так давно в «твиттерах» известных личностей бурно выражалось недовольство бустерами и людьми, которые накручивают себе зрителей на Twitch.tv. Там же было отмечено, что очень хочется узнать реальные цифры просмотров и вообще узнать, кто жульничает, а кто нет. Да, есть твиттер BotDetectorBot, но его легко обойти. Ниже я расскажу вам результаты своего небольшого расследования.
Моя стартовая идея была проста. У каждого стрима есть количество зрителей, которые отображаются внизу рядом с красным человечком. Там учитываются вообще все смотрящие стрим. Понятно, что не все из них имеют аккаунт на Twitch, а только какая-то часть. Список залогиненных зрителей канала можно посмотреть, если нажать на Viewer list. Так вот, кажется логичным, что доля таких людей не должна сильно зависеть от канала. Собственно, я решил проверить это, а заодно понять, чему примерно равно ее значение. Есть очень удобный способ узнать количество залогиненных зрителей: вбиваем в адресную строку tmi.twitch.tv/group/user/»имя»/chatters, и там в конце строки «chatter_count» написано количество зрителей.
И вот, однажды, я засел и два дня мониторил Twitch, собирая информацию о количестве зрителей. Сразу скажу, что я брал только русскоговорящих стримеров, у которых хотя бы 1000 зрителей, но брал их всех. Плюс взял парочку известных англоговорящих для сравнения. Каждого стримера я проверял не один раз и в разные дни, чтобы какой-нибудь глюк Twitch.tv все не испортил. В итоге получилась вот такая табличка (на последний столбик пока не смотрите, к нему мы вернемся позже):
Видите это место, отмеченное красной стрелкой? Очень подозрительный разрыв, не правда ли? А знаете, что еще более подозрительно? Все сверху этого разрыва – известные стримеры (я только плохо знаю, кто такой qsnake_, и вообще не знаю, кто такой morganartem). А вот снизу хорошо известных личностей особо не наблюдается.
Какой вывод можно сделать из всего этого? Если отношения количества залогиненных зрителей к общему количеству зрителей больше 0.6, то накрутки, почти наверняка, нет. Если это отношение около 0.3 или ниже, то это очень подозрительно. Если значение где-то посредине, то непонятно.
Уже неплохой результат. Но на этом я не остановился. Давайте посидим на стриме gaben_007. Твич говорит, что у него около 2000 зрителей, из которых 600 – залогиненные.
Обратите внимание на время. За 30 минут в чате появилось всего четыре сообщения, из которых два – это реклама, а еще одно – сомнение в честности стримера. Очень подозрительно для 600 реальных зрителей, не правда ли? Чтобы понять причину, давайте посмотрим на залогиненных зрителей канала. Если тыкнуть в несколько произвольных зрителей, то можно заметить странную особенность: у почти всех либо 0, либо 400+ подписок. Вот у вас много подписок? Уверен, что меньше 100. Я не поленился и посмотрел количество подписчиков у первых 200 зрителей. Вот что получилось:
У 147 зрителей количество подписок больше 400, у 47 – 0 подписок и всего у 6 человек меньше 400. Также видны 4 четких уровня сгущения – 0, чуть больше 400, около 700 и около 900. Думаю, даже люди, не знакомые со статистикой от слова «совсем», понимают, что это ненормально. Для сравнения я посмотрел 50 зрителей Дреда и не нашел там НИ ОДНОГО человека, более чем со 100 подписками. Вывод может быть только один: можно накручивать зарегистрированных ботов.
Я проверил стримеров на подозрительных зрителей (с 400+ подписками). Каким образом? Посмотрел 10 произвольных залогиненных зрителей. Если среди них большинство с 400+ подписками, то стример накручивает. Теперь можно вернуться выше и снова посмотреть табличку. В последнем столбце стоит «+» напротив тех, кто накручивает залогиненных ботов, «-» напротив тех, кто жульничает, а ничего не стоит у тех, у кого я еще не успел посмотреть. То есть в реальности получается, что доля настоящих зрителей еще меньше, этих стримеров вообще почти не смотрят.
Далее я решил проверить свои догадки, а конкретно, узнать что и как можно накручивать. Оказалось, что сделать себе лишних зрителей очень легко. По одной из первых ссылок в гугле я смог найти бесплатную программу, которая накручивает зрителей. Я проверил – она действительно работает (не буду ее называть, чтобы не делать из блога пособие для начинающих накрутчиков). Но дальше еще веселей. Я наткнулся на вот эту контору:
Перемотайте на 1:30 и послушайте полторы минуты. Для тех, кому лень это делать, парень говорит о том, что количество залогиненных зрителей составляет не менее 30% от общего количества, поэтому он рекомендует своим клиентам накручивать залогиненных ботов примерно на этом уровне. Помните, какую долю мы определили, как подозрительную? Правильно, именно 0.3 (тут должен вылезти Киселев!) Сложно представить лучшее подтверждение моих выводов.
Если посмотреть все видео целиком, то можно узнать, какие услуги предоставлют накрутчики. Можно накрутить подписчиков, можно накрутить просмотры канала, можно накрутить сколько угодно зрителей (в рамках разумного парень предлагает до 5000), можно сделать сколько угодно чат-ботов, которые будут писать заранее заготовленные фразы (там фирма предоставляет 1000 стандартных, плюс можно вписывать свои), можно выставить скорость, с которой эти боты будут писать. То есть мимикрировать под порядочного стримера сложно, но можно. Такие дела.
Перед тем, как перейти к инструкции по распознаванию накручивающего канала, давайте поговорим, как должен выглядеть нормальный стрим. На картинке ниже приведены столбцы изменения количества зрителей в процессе стрима Бульдога и Нексуса.
- Количество зрителей у них растет постепенно. Это не как girlstorule, у которой как только стрим включается, так сразу 2500 зрителей.
- Вначале доля залогиненных зрителей очень большая. Это и понятно: первыми на стрим врываются в основном те, кто получает уведомления Twitch.tv.
- В перерывах между играми, если не происходит ничего интересного, то количество зрителей существенно уменьшается, причем в основном за счет тех, кто не зарегистрирован на Twitch (то есть доля возрастает). На картинке как раз такие моменты отмечены стрелочкой. Это, опять же, не как girlstorule, у которой колебаний почти нет.
Итак, теперь настало время изложить инструкцию по выведению на чистую воду нечестного стримера.
- С помощью ссылки tmi.twitch.tv/group/user/»имя»/chatters узнаем количество залогиненных зрителей, делим на общее число зрителей. Если результат в районе 0.3 или меньше, то это повод насторожиться.
- Следим за чатом. Если он неактивный, а зрителей много, то это повод насторожиться. Даже если он активный, то следим за тем, что пишут. Например, одному довольно непримечательном стримеру в чате было задано подряд два вопроса «ты служил в армии?» и «сколько у тебя было девушек?» от разных пользователей, на которые он с удовольствием долго отвечал. Это очень подозрительно, учитывая наше знание о возможностях чат-ботов.
- Открываем список залогиненных зрителей, тыкаем в 10 произвольных. Если среди них несколько с более чем 400 подписками, то стример, наверняка, крутит.
- Открываем подписчиков и тыкаем в 50 произвольных. Если среди них несколько с более чем 400 подписками, то стример, наверняка, накрутил их себе.
- Следите за тем, чтобы выполнялись три правила нормальных стримов, которые я выше описал.
- Показателем того, что стримера смотрят много людей, могут быть донаты. Если донатов много, то, скорее всего, все честно. Именно поэтому, в свое время, я сделал вывод, что Картман не накручивает зрителей.
Еще пара замечаний. Во-первых, к стримам турниров мои размышления не относятся. Логично, что на них незалогиненных зрителей больше, поэтому значение доли залогиненных зрителей будет существенно меньше. Например, во время матча Na’Vi на WePlay доля составляла чуть меньше 0.5. Во-вторых, к стримам, у которых меньше 1000 зрителей, мои выводы надо применять аккуратно. Кажется логичным, что у честного стримера со 100 зрителями большая часть этих зрителей будет залогиненными (общение в чатике), но со стопроцентной уверенностью я не могу этого утверждать. Например, у приятеля Дреда – Vovapain – доля близка к 1. Но поскольку я абсолютно уверен, что большая часть стримеров меньше, чем с 1000 зрителей, накручивает (в силу того, что это очень просто), то проверять я это не хочу.
Увы, Twitch вряд ли будет что-то делать с этими людьми. Проблема в том, что невозможно вычислить, накручивает стример сам, или это кто-то другой постарался. Если банить все такие каналы, то накрутка зрителей превратится в оружие. Не нравится стример? Накручу-ка я ему зрителей, пусть его забанят! Радует только, что большую часть этого сброда смотрят единицы.
Во всей этой ситуации я вижу большую проблему. Какие-то непонятные люди без капли харизмы получают незаслуженную популярность. А стримерам, которые желают развиваться в этом деле, которым действительно нужны зрители, в которых есть изюминка, в какой-то момент надоедает болтаться внизу Twitch.tv, и они стримы забрасывают. Так мы, обычные зрители, потенциально лишаемся годного развлечения. А непонятных людей, которые только умеют прикольно смеяться, приглашают анализировать WePlay, где они читают с листочка (извините, не удержался, на самом деле, как было сказано выше, Картман, почти наверняка, не крутит).
Ну и на последок у меня есть просьба. Дело в том, что я не силен в программировании, а собирать данные вручную слишком лень. Если кто-то сможет автоматически собрать данные о количестве подписок у зрителей и передать их мне, то я буду безмерно благодарен. Спасибо за внимание!
Upd: повилась вторая часть.
Фото на главной: Business Insider.