Похождения фэнтези задрота
Блог

Первое издание рейтингов команд в Dota 2

Этот пост написан пользователем Sports.ru, начать писать может каждый болельщик (сделать это можно здесь).

Относительно недавно я решил создать очередной самый лучший рейтинг команд в соревновательной Dota 2. Рейтинг будет основан полностью на статистических данных. В этом посте я расскажу о своей первоначальной идее, покажу немного формул и сделаю пару предсказаний на матчи завтрашнего дня на Manila Major (завтра мы посмеемся, когда увидим, что это не сработает)

 

Теория, Эло рейтинг, немного математики

 

Начнем с теории. За основу рейтинга будет взят видоизмененный рейтинг Эло, который успешно применяется в шахматах, баскетболе, футболе и подобных видах спорта.

С помощью рейтинга Эло можно делать предсказание о математическом ожидании предстоящего матча и сделать какое то предсказание какая из команд более вероятно победит.

Немного формул - если известны рейтинги двух команд А и Б, то математическое ожидание будет следующим:

 

alt

 

где Ra - Эло рейтинг команды А, Rb - Эло рейтинг команды Б. Посмотрим на примере.

Если рейтинг команд равен, то очевидно верояность победы будет одинаковой 50% для каждой из команд. Если рейтинг команда А - 1600, а команды Б - 1500, то вероятность победы команды А - 64%, а команды Б - 36%.

Вроде все просто на первый взгляд, поглядим как же обновить рейтинг после матча между командами.

alt

здесь R'a - обновленный рейтинг после матча, Ra - Эло рейтинг перед матчем, K - коэффициент (о нем поговорим чуть позже), Sa - количество баллов набранное командой (в случае с Дотой, это 1 - за победу и 0 - за поражение), Ea - см. формулу 1.

Правила рейтинга довольны просты, тем не менее есть небольшие хитрости, от которых будет зависеть качество построенной модели, одним из этих секретов является значение коэффициента K. Теоретические изыскания говорят что K должены быть большим для крупных и самых значимых соревнований, и небольшим для товарищеских матчей или малозначимых турниров. Я постараюсь выбрать идеальное значение K основываясь на исторической выборке, но об этом позднее, да и сейчас нет ресурсов чтобы за ночь сделать эту оптимизацию.

 

Практика, источник данных

Один из лучших ресурсов для получения статистических данных остается Dotabuff поэтому я решил использовать его. Я взял список лучших/популярных команд за последнее время - в него очевидно вошли все команды которые участвуют на Manila Major, а так же большая часть команд игравших закрытые квалификации на этот турнир. Получился список из 40 команд, после этого я взял выборку из некоторого количества последних матчей каждой команды, отфильтровав только мачти где встречаются любые две из сорока команд. Таких матчей набралось 1747. После этого отсортировав их от прошлого к настоящему, я перебрал каждый матч и на основе результатов матча обновил Эло рейтинг каждой из команд. 

Весь процесс сбора информации занял около 6 часов.

 

Топ-10 команд по Эло рейтингу:

  1. Newbee - 3062.31336910029
  2. Team Liquid - 2430.23840970335
  3. OG - 2158.01091491729
  4. Empire - 1993.85851370039
  5. Fnatic - 1979.31306689834
  6. EG - 1939.13769042842
  7. VG.R - 1928.64859971276
  8. DC - 1704.6195263982
  9. Na'Vi - 1675.20541355319
  10. Alliance - 1634.62810387468

К слову, все вылетевшие сегодня команды за исключением EG имеют довольно низкий рейтинг, и их вылет статистические не удивляет. Проход EG сегодняшнего раунда с Empire оценивался в 42%

Честно говоря результаты немного странные, но давайте доверять статистике (плюс никто не отменял что модель нужно натренировать - не забываем про параметр K)

 

Предсказания, 322, ставки

Предупреждение - ставками я не занимаюсь, ставить никого не заставляю и вообще не рекомендую, но во имя науки можно делать хотя бы предсказания. 

На завтра планируются следующие матчи:

 

Newbee - DC. Вероятность победы Newbee равна 99%

LGD - Fnatic. Вероятность победы Fnatic равна 97%

Liquid - CoL. Вероятность победы Liquid равна 99%

Na'Vi - Alliance. Вероятность победы Na'Vi равна 56%

Да, признаться результаты меня смущают, что значит что впереди предстоит очень много работы по тюнингу этой модели. 

Уже через несколько часов стартует очередной игровой день турнира и совсем скоро мы сможем вдоволь посмеяться над моими предсказаниями, ведь как говорит Nahaz - Stats don't Lie!

 

 Вдохновение было получено здесь - http://projects.fivethirtyeight.com/2016-nba-picks/ и здесь - https://www.youtube.com/channel/UCHgkSS3Vc-TIH1Wd64Hq_dQ 

 

17 комментариев
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Пишите корректно и дружелюбно. Принципы нашей модерации
Эло рейтинг сегодня зарулил!
+2
0
+2
Ответ ingyshetia
Выиграть-то выиграли, я и без мат. вычислений ставил на эти команды, по-моему это было очевидно. Точно так же как и победа Ликвидов.
Ну да :) Если честно мне куда интереснее как сыграют Нави и Алики. Там и проценты ближе, хотя кажется что Нави сильнее, но насколько сильнее.
+2
0
+2
Как-то жёстко с лгд, всего 3% на их победу
+1
0
+1
Ответ andreyror
Как-то жёстко с лгд, всего 3% на их победу
С учётом того, что они уже 1-0 ведут.
+1
0
+1
Ответ ingyshetia
С учётом того, что они уже 1-0 ведут.
Постарайтесь отнестись к этому чуть более дружелюбно, модель новая, мало опробованная. Повторюсь меня не меньше вашего удивляет гигантская разница в вероятностях
+1
0
+1
Ну да :) Если честно мне куда интереснее как сыграют Нави и Алики. Там и проценты ближе, хотя кажется что Нави сильнее, но насколько сильнее.
Насчёт Нави согласен, предсказывать что-то нереально, но мне тоже кажется что Нави сильнее выглядят.

Если они загнобят бульдога, то победят.
+1
0
+1
Ответ Sega_00
Сложность: Сложно . :-)
Вы о чем?:)
0
0
0
Интересно было бы по этой формуле сопоставить результаты уже прошедших матчей
0
0
0
Сложность: Сложно . :-)
0
0
0
Эло рейтинг сегодня зарулил!
Я сам удивлен ))) Сейчас сделаю апдейт именно этой модели, на завтрашние матчи, поглядим как дальше все идет
0
0
0
Ответ andreyror
Как-то жёстко с лгд, всего 3% на их победу
Да, у них получился оооочень низкий рейтинг, то ли ошибка модели, то ли правда так и есть. Не знаю.
0
0
0
Ответ FCRSM1930
1747 игр это за все время? Если это за все время стоит сделать что-то подобное за год, потому что те же OG имеют хороший винрейт на меньшей дистанции, то же у ВГР. И еще интересно учитывает ли рейтинг историю игры той же другой команды под другим тегам. И количество цифр после точки можно уменьшить))
Нет, не за все время,это N последних игр каждой команды (около 200) . У меня и так ушло около 6 часов на 1747 игр, на большее я даже представить не могу сколько уйдет времени. В идеале когда модель будет натренирована можно сделать за все время.

Нет, я не знаю легкого способа пока отследить результаты той же команды под другим тегом.
0
0
0
1747 игр это за все время? Если это за все время стоит сделать что-то подобное за год, потому что те же OG имеют хороший винрейт на меньшей дистанции, то же у ВГР. И еще интересно учитывает ли рейтинг историю игры той же другой команды под другим тегам.

И количество цифр после точки можно уменьшить))
0
0
0
C учетом того что они проиграли :)))
Выиграть-то выиграли, я и без мат. вычислений ставил на эти команды, по-моему это было очевидно.

Точно так же как и победа Ликвидов.
0
0
0
Ответ ingyshetia
С учётом того, что они уже 1-0 ведут.
C учетом того что они проиграли :)))
0
0
0
Ответ andreyror
Как-то жёстко с лгд, всего 3% на их победу
Да, у ЛГД вышел очень низкий рейтинг. В целом возникает ощущение, что в модели допущены неточности, из за которых рейтинг немного застревает и реагирует только на череду удачных выступлений. Это кажется одной из причин невероятно выского рейтинга у Ньюби. В течении 29-0 их рейтинг взлетел до небес, и теперь очень медленно пытается упасть
0
0
0
Интересно было бы по этой формуле сопоставить результаты уже прошедших матчей
Да, это один из планов на следующий пост.
0
0
0
Укажите причину бана
  • Оскорбление
  • Мат
  • Спам
  • Расизм
  • Провокации
  • Угрозы
  • Систематический оффтоп
  • Мульти-аккаунтинг
  • Прочее
Пожаловаться
  • Спам
  • Оскорбления
  • Расизм
  • Мат
  • Угрозы
  • Прочее
  • Мультиаккаунтинг
  • Систематический оффтоп
  • Провокации
Комментарий отправлен, но без доната
При попытке оплаты произошла ошибка
  • Повторить попытку оплаты
  • Оставить комментарий без доната
  • Изменить комментарий
  • Удалить комментарий