Трудно быть Блогом
Блог

Боты атакуют. Кто накручивает зрителей на Twitch.tv

Добрый день!

Не так давно в «твиттерах» известных личностей бурно выражалось недовольство бустерами и людьми, которые накручивают себе зрителей на Twitch.tv. Там же было отмечено, что очень хочется узнать реальные цифры просмотров и вообще узнать, кто жульничает, а кто нет. Да, есть твиттер BotDetectorBot, но его легко обойти. Ниже я расскажу вам результаты своего небольшого расследования.

Моя стартовая идея была проста. У каждого стрима есть количество зрителей, которые отображаются внизу рядом с красным человечком. Там учитываются вообще все смотрящие стрим. Понятно, что не все из них имеют аккаунт на Twitch, а только какая-то часть. Список залогиненных зрителей канала можно посмотреть, если нажать на Viewer list. Так вот, кажется логичным, что доля таких людей не должна сильно зависеть от канала. Собственно, я решил проверить это, а заодно понять, чему примерно равно ее значение. Есть очень удобный способ узнать количество залогиненных зрителей: вбиваем в адресную строку tmi.twitch.tv/group/user/»имя»/chatters, и там в конце строки «chatter_count» написано количество зрителей.

И вот, однажды, я засел и два дня мониторил Twitch, собирая информацию о количестве зрителей. Сразу скажу, что я брал только русскоговорящих стримеров, у которых хотя бы 1000 зрителей, но брал их всех. Плюс взял парочку известных англоговорящих для сравнения. Каждого стримера я проверял не один раз и в разные дни, чтобы какой-нибудь глюк Twitch.tv все не испортил. В итоге получилась вот такая табличка (на последний столбик пока не смотрите, к нему мы вернемся позже):

На последний столбец пока что не смотрите.

Видите это место, отмеченное красной стрелкой? Очень подозрительный разрыв, не правда ли? А знаете, что еще более подозрительно? Все сверху этого разрыва – известные стримеры (я только плохо знаю, кто такой qsnake_, и вообще не знаю, кто такой morganartem). А вот снизу хорошо известных личностей особо не наблюдается.

Какой вывод можно сделать из всего этого? Если отношения количества залогиненных зрителей к общему количеству зрителей больше 0.6, то накрутки, почти наверняка, нет. Если это отношение около 0.3 или ниже, то это очень подозрительно. Если значение где-то посредине, то непонятно.

Уже неплохой результат. Но на этом я не остановился. Давайте посидим на стриме gaben_007. Твич говорит, что у него около 2000 зрителей, из которых 600 – залогиненные.

gaben_007

Обратите внимание на время. За 30 минут в чате появилось всего четыре сообщения, из которых два – это реклама, а еще одно – сомнение в честности стримера. Очень подозрительно для 600 реальных зрителей, не правда ли? Чтобы понять причину, давайте посмотрим на залогиненных зрителей канала. Если тыкнуть в несколько произвольных зрителей, то можно заметить странную особенность: у почти всех либо 0, либо 400+ подписок. Вот у вас много подписок? Уверен, что меньше 100. Я не поленился и посмотрел количество подписчиков у первых 200 зрителей. Вот что получилось:

Зрители gaben_007

У 147 зрителей количество подписок больше 400, у 47 – 0 подписок и всего у 6 человек меньше 400. Также видны 4 четких уровня сгущения – 0, чуть больше 400, около 700 и около 900. Думаю, даже люди, не знакомые со статистикой от слова «совсем», понимают, что это ненормально. Для сравнения я посмотрел 50 зрителей Дреда и не нашел там НИ ОДНОГО человека, более чем со 100 подписками. Вывод может быть только один: можно накручивать зарегистрированных ботов.

Я проверил стримеров на подозрительных зрителей (с 400+ подписками). Каким образом? Посмотрел 10 произвольных залогиненных зрителей. Если среди них большинство с 400+ подписками, то стример накручивает. Теперь можно вернуться выше и снова посмотреть табличку. В последнем столбце стоит «+» напротив тех, кто накручивает залогиненных ботов, «-» напротив тех, кто жульничает, а ничего не стоит у тех, у кого я еще не успел посмотреть. То есть в реальности получается, что доля настоящих зрителей еще меньше, этих стримеров вообще почти не смотрят.

Далее я решил проверить свои догадки, а конкретно, узнать что и как можно накручивать. Оказалось, что сделать себе лишних зрителей очень легко. По одной из первых ссылок в гугле я смог найти бесплатную программу, которая накручивает зрителей. Я проверил – она действительно работает (не буду ее называть, чтобы не делать из блога пособие для начинающих накрутчиков). Но дальше еще веселей. Я наткнулся на вот эту контору:

Перемотайте на 1:30 и послушайте полторы минуты. Для тех, кому лень это делать, парень говорит о том, что количество залогиненных зрителей составляет не менее 30% от общего количества, поэтому он рекомендует своим клиентам накручивать залогиненных ботов примерно на этом уровне. Помните, какую долю мы определили, как подозрительную? Правильно, именно 0.3 (тут должен вылезти Киселев!) Сложно представить лучшее подтверждение моих выводов.

Если посмотреть все видео целиком, то можно узнать, какие услуги предоставлют накрутчики. Можно накрутить подписчиков, можно накрутить просмотры канала, можно накрутить сколько угодно зрителей (в рамках разумного парень предлагает до 5000), можно сделать сколько угодно чат-ботов, которые будут писать заранее заготовленные фразы (там фирма предоставляет 1000 стандартных, плюс можно вписывать свои), можно выставить скорость, с которой эти боты будут писать. То есть мимикрировать под порядочного стримера сложно, но можно. Такие дела.

Перед тем, как перейти к инструкции по распознаванию накручивающего канала, давайте поговорим, как должен выглядеть нормальный стрим. На картинке ниже приведены столбцы изменения количества зрителей в процессе стрима Бульдога и Нексуса.

Хорошие стримы

  1. Количество зрителей у них растет постепенно. Это не как girlstorule, у которой как только стрим включается, так сразу 2500 зрителей. 
  2. Вначале доля залогиненных зрителей очень большая. Это и понятно: первыми на стрим врываются в основном те, кто получает уведомления Twitch.tv. 
  3. В перерывах между играми, если не происходит ничего интересного, то количество зрителей существенно уменьшается, причем в основном за счет тех, кто не зарегистрирован на Twitch (то есть доля возрастает). На картинке как раз такие моменты отмечены стрелочкой. Это, опять же, не как girlstorule, у которой колебаний почти нет.

Итак, теперь настало время изложить инструкцию по выведению на чистую воду нечестного стримера.

  1. С помощью ссылки tmi.twitch.tv/group/user/»имя»/chatters узнаем количество залогиненных зрителей, делим на общее число зрителей. Если результат в районе 0.3 или меньше, то это повод насторожиться.
  2. Следим за чатом. Если он неактивный, а зрителей много, то это повод насторожиться. Даже если он активный, то следим за тем, что пишут. Например, одному довольно непримечательном стримеру в чате было задано подряд два вопроса «ты служил в армии?» и «сколько у тебя было девушек?» от разных пользователей, на которые он с удовольствием долго отвечал. Это очень подозрительно, учитывая наше знание о возможностях чат-ботов.
  3. Открываем список залогиненных зрителей, тыкаем в 10 произвольных. Если среди них несколько с более чем 400 подписками, то стример, наверняка, крутит.
  4. Открываем подписчиков и тыкаем в 50 произвольных. Если среди них несколько с более чем 400 подписками, то стример, наверняка, накрутил их себе.
  5. Следите за тем, чтобы выполнялись три правила нормальных стримов, которые я выше описал.
  6. Показателем того, что стримера смотрят много людей, могут быть донаты. Если донатов много, то, скорее всего, все честно. Именно поэтому, в свое время, я сделал вывод, что Картман не накручивает зрителей.

Еще пара замечаний. Во-первых, к стримам турниров мои размышления не относятся. Логично, что на них незалогиненных зрителей больше, поэтому значение доли залогиненных зрителей будет существенно меньше. Например, во время матча Na’Vi на WePlay доля составляла чуть меньше 0.5. Во-вторых, к стримам, у которых меньше 1000 зрителей, мои выводы надо применять аккуратно. Кажется логичным, что у честного стримера со 100 зрителями большая часть этих зрителей будет залогиненными (общение в чатике), но со стопроцентной уверенностью я не могу этого утверждать. Например, у приятеля Дреда – Vovapain – доля близка к 1. Но поскольку я абсолютно уверен, что большая часть стримеров меньше, чем с 1000 зрителей, накручивает (в силу того, что это очень просто), то проверять я это не хочу.

Увы, Twitch вряд ли будет что-то делать с этими людьми. Проблема в том, что невозможно вычислить, накручивает стример сам, или это кто-то другой постарался. Если банить все такие каналы, то накрутка зрителей превратится в оружие. Не нравится стример? Накручу-ка я ему зрителей, пусть его забанят! Радует только, что большую часть этого сброда смотрят единицы.

Во всей этой ситуации я вижу большую проблему. Какие-то непонятные люди без капли харизмы получают незаслуженную популярность. А стримерам, которые желают развиваться в этом деле, которым действительно нужны зрители, в которых есть изюминка, в какой-то момент надоедает болтаться внизу Twitch.tv, и они стримы забрасывают. Так мы, обычные зрители, потенциально лишаемся годного развлечения. А непонятных людей, которые только умеют прикольно смеяться, приглашают анализировать WePlay, где они читают с листочка (извините, не удержался, на самом деле, как было сказано выше, Картман, почти наверняка, не крутит).

Ну и на последок у меня есть просьба. Дело в том, что я не силен в программировании, а собирать данные вручную слишком лень. Если кто-то сможет автоматически собрать данные о количестве подписок у зрителей и передать их мне, то я буду безмерно благодарен. Спасибо за внимание!

Upd: повилась вторая часть.

Фото на главной: Business Insider.

69 комментариев
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Пишите корректно и дружелюбно. Принципы нашей модерации
Впервые пишу комментарий на Sports.ru . Очень годный, актуальный и нужный материал ;)
+15
0
+15
Ответ Cweny
что-то мне очень сильно напоминает http://dota2.ru/blogs/post/3236-kto-na-tviche-nakruchivaet-zritelej/ http://dota2.ru/blogs/post/3239-nakrutka-zritelej-na-tviche-chast-2/ статья то годня, но надо указывать ссылки на источники
Да, это мои блоги. Я сначала выложил их там, а только сегодня - здесь. Так что в ссылках на те записи не вижу смысла.
+14
-1
+13
На твиче крутить почти каждый с большим количеством зрителей ,кто из-за качество,другие из желания ворваться в мейнстримовое направления стриминга .На этом делается деньги и это всех устраивает.А топ действует как эффект рекламы,стадо заходит и смотрит,это же модно.С таким количеством однотипных стримеров,больше никак не выделиться.Кому это не интересно ,имеют свою аудиторию 20-50 (в лучшем случае,в редких случаях более 100).

Если кому лень считать ,то можете посмотреть твиттер бот-детектора https://twitter.com/BotDetectorBot.
+3
0
+3
Ответ mathlover
Да, это мои блоги. Я сначала выложил их там, а только сегодня - здесь. Так что в ссылках на те записи не вижу смысла.
Интересная статья. Если еще нужна помощь в сборе материала, то написал небольшую программу (Интерфейс выглядит так - http://www.imgzilla.ru/image.uploads/2016-04-29/default-70b749091c1eef6497dc704203135cdb.png) под это дело. Если интересно могу скинуть рабочий вариант.
+3
0
+3
Отвечу сразу всем спросившим. Какие данные хочется? Во-первых, хочется по каналу узнать, сколько у него подписчиков имеют 400+ подписок. Это поможет выявить людей, накрутивших подписчиков. Данные хочется в форме "канал, общее число подписчиков, количество людей с 0 подпискок, с 1-100 подписками, 100-200, 200-300,..., 800-900, 900+". Желательно в форме таблицы в Excel, можно просто в блокноте.

Во-вторых, хочется по идущему в данный момент стриму уметь получать массив чисел, каждый элемент равен количеству подписчиков у залогиненного зрителя этого стрима. Это поможет понять, какое распределение должно быть, и выявить тех, у кого распределение неправильное. Данные очень хочется получать в виде столбца таблицы в Excel. Можно просто в блокноте, но это менее желательно. Очень хочется, чтобы я мог получать эти данные сам, то есть чтобы я сам мог запускать программу в любое время.

В-третьих, хочется по двум идущим в данный момент стримам уметь получать число, равное общему количеству зрителей этих стримов. Также очень хочется, чтобы я мог получать эти данные сам.

Если вы сможете предоставит мне хотя бы одну из этих прог, я буду вам очень признателен!
+2
0
+2
Какое совпадение, только вчера наткнулся на какого-то ноунейма стримера в CS:GO с пятью тысячами зрителей, который упорно доказывал, что "Вы не правы", это настоящие зрители, просто 10% людей только нормальные, остальные 90% - это хейтеры, которых он просто забанил, а они продолжают смотреть его стрим молча)) Такая нелепость конечно, ещё и сайт с открытием кейсов за деньги пиарил, для таких подготовлен отдельный котёл...
+2
0
+2
Комментарий удален
А можно чуть отойти от темы и спросить, а зачем вам оно надо было вообще, проводить такое расследование ?)

Материал безусловно хороший, был бы я руководителем какой нить орги в СНГ я бы вас привлёк на какую нить статистическую работу, но у нас этим разве что Галицкий только занимается)

А касаемо накруток в твиче, честно говоря я на количество просмотров никогда не смотрю, у меня есть человек 10-15 которые мне нравятся и которых я хоть и не регулярно, но периодически смотрю, если же среди них нету никого онлайн, дальше иду рандомно тыкать, при этом, если это относится к дота разделу, то на девочек я вообще не тыкаю, потому что это пустая трата времени
+2
0
+2
Ответ afscheid
не знать куснейка в 2076 про всех, кто накручивает, админы твича знают ботов банят по айпи но новые появляются
А откуда такая информация? Если админы твича знают тех, кто накручивает, то почему ничего не делают?

А откуда информация про то, что ботов банят?
+1
0
+1
Ответ заблокированному пользователю
Комментарий удален
Спасибо за комментарий! Действительно, об этом я совсем не подумал. Мне кажется, на результат это не сильно повлияет, но да, другие порталы надо попытаться учесть.
+1
0
+1
Укажите причину бана
  • Оскорбление
  • Мат
  • Спам
  • Расизм
  • Провокации
  • Угрозы
  • Систематический оффтоп
  • Мульти-аккаунтинг
  • Прочее
Пожаловаться
  • Спам
  • Оскорбления
  • Расизм
  • Мат
  • Угрозы
  • Прочее
  • Мультиаккаунтинг
  • Систематический оффтоп
  • Провокации
Комментарий отправлен, но без доната
При попытке оплаты произошла ошибка
  • Повторить попытку оплаты
  • Оставить комментарий без доната
  • Изменить комментарий
  • Удалить комментарий