Первое издание рейтингов команд в Dota 2
Этот пост написан пользователем Sports.ru, начать писать может каждый болельщик (сделать это можно здесь).
Относительно недавно я решил создать очередной самый лучший рейтинг команд в соревновательной Dota 2. Рейтинг будет основан полностью на статистических данных. В этом посте я расскажу о своей первоначальной идее, покажу немного формул и сделаю пару предсказаний на матчи завтрашнего дня на Manila Major (завтра мы посмеемся, когда увидим, что это не сработает)
Теория, Эло рейтинг, немного математики
Начнем с теории. За основу рейтинга будет взят видоизмененный рейтинг Эло, который успешно применяется в шахматах, баскетболе, футболе и подобных видах спорта.
С помощью рейтинга Эло можно делать предсказание о математическом ожидании предстоящего матча и сделать какое то предсказание какая из команд более вероятно победит.
Немного формул - если известны рейтинги двух команд А и Б, то математическое ожидание будет следующим:
где Ra - Эло рейтинг команды А, Rb - Эло рейтинг команды Б. Посмотрим на примере.
Если рейтинг команд равен, то очевидно верояность победы будет одинаковой 50% для каждой из команд. Если рейтинг команда А - 1600, а команды Б - 1500, то вероятность победы команды А - 64%, а команды Б - 36%.
Вроде все просто на первый взгляд, поглядим как же обновить рейтинг после матча между командами.
здесь R'a - обновленный рейтинг после матча, Ra - Эло рейтинг перед матчем, K - коэффициент (о нем поговорим чуть позже), Sa - количество баллов набранное командой (в случае с Дотой, это 1 - за победу и 0 - за поражение), Ea - см. формулу 1.
Правила рейтинга довольны просты, тем не менее есть небольшие хитрости, от которых будет зависеть качество построенной модели, одним из этих секретов является значение коэффициента K. Теоретические изыскания говорят что K должены быть большим для крупных и самых значимых соревнований, и небольшим для товарищеских матчей или малозначимых турниров. Я постараюсь выбрать идеальное значение K основываясь на исторической выборке, но об этом позднее, да и сейчас нет ресурсов чтобы за ночь сделать эту оптимизацию.
Практика, источник данных
Один из лучших ресурсов для получения статистических данных остается Dotabuff поэтому я решил использовать его. Я взял список лучших/популярных команд за последнее время - в него очевидно вошли все команды которые участвуют на Manila Major, а так же большая часть команд игравших закрытые квалификации на этот турнир. Получился список из 40 команд, после этого я взял выборку из некоторого количества последних матчей каждой команды, отфильтровав только мачти где встречаются любые две из сорока команд. Таких матчей набралось 1747. После этого отсортировав их от прошлого к настоящему, я перебрал каждый матч и на основе результатов матча обновил Эло рейтинг каждой из команд.
Весь процесс сбора информации занял около 6 часов.
Топ-10 команд по Эло рейтингу:
- Newbee - 3062.31336910029
- Team Liquid - 2430.23840970335
- OG - 2158.01091491729
- Empire - 1993.85851370039
- Fnatic - 1979.31306689834
- EG - 1939.13769042842
- VG.R - 1928.64859971276
- DC - 1704.6195263982
- Na'Vi - 1675.20541355319
- Alliance - 1634.62810387468
К слову, все вылетевшие сегодня команды за исключением EG имеют довольно низкий рейтинг, и их вылет статистические не удивляет. Проход EG сегодняшнего раунда с Empire оценивался в 42%
Честно говоря результаты немного странные, но давайте доверять статистике (плюс никто не отменял что модель нужно натренировать - не забываем про параметр K)
Предсказания, 322, ставки
Предупреждение - ставками я не занимаюсь, ставить никого не заставляю и вообще не рекомендую, но во имя науки можно делать хотя бы предсказания.
На завтра планируются следующие матчи:
Newbee - DC. Вероятность победы Newbee равна 99%
LGD - Fnatic. Вероятность победы Fnatic равна 97%
Liquid - CoL. Вероятность победы Liquid равна 99%
Na'Vi - Alliance. Вероятность победы Na'Vi равна 56%
Да, признаться результаты меня смущают, что значит что впереди предстоит очень много работы по тюнингу этой модели.
Уже через несколько часов стартует очередной игровой день турнира и совсем скоро мы сможем вдоволь посмеяться над моими предсказаниями, ведь как говорит Nahaz - Stats don't Lie!
Вдохновение было получено здесь - http://projects.fivethirtyeight.com/2016-nba-picks/ и здесь - https://www.youtube.com/channel/UCHgkSS3Vc-TIH1Wd64Hq_dQ
Если они загнобят бульдога, то победят.