Как мы прыгнули в огромный стог сена и случайно напоролись на иголку, которая может изменить рынок киберспорта

Этот пост написан пользователем Sports.ru, начать писать может каждый болельщик (сделать это можно здесь).

ИИ в CS:GO.

Стог сена — рынок киберспортивных данных, а иголка — это искусственный интеллект DataLouna, прогнозирующий результаты CS:GO-матчей. Создать искусственный интеллект — нетривиальная задача, но разработка алгоритма для прогнозов матчей начинается не тогда, когда разработчик открывает редактор и пишет первую строчку кода.

Первым делом нужно определиться с тем, что влияет на исход матчей, как правильно собирать эту информацию, после чего постоянно тестировать и дорабатывать модель. В DataLouna.ru этим занимаются аналитики с огромным опытом на соревновательной сцене CS:GO.

Эрик «AKIMOV» Акимов играет в CS с нулевых и прошел путь от игрока в любительских лигах до работы профессиональным тренером и аналитиком. Проанализировал тысячи часов демок, помог десяткам игроков найти себя, а сейчас работает со всеми накопленными знаниями и делится опытом с остальной частью команды.

Второй аналитик DataLouna — Святослав «svyat» Довбах. За свою карьеру Svyat попал в топ-20 HLTV, дважды отбирался на мейджоры (на один из которых не получилось попасть из-за ковидных ограничений) и крупные международные LAN-турниры. В своих командах всегда был капитаном и частично совмещал тренерские обязанности.

Вдвоем Эрик и Святослав помогают программистам создавать искусственный интеллект, предсказывающий матчи с точностью выше букмекеров.

Статистика в CS:GO, или почему на данных HLTV не построить эффективный искусственный интеллект

Краткое (и очень простое!) объяснение принципа работы нейросетей: машина обучается на тысячах матчей, находит закономерности в статистике и самостоятельно учится прогнозировать исходы матчей.

Понятно, что обучаться нужно на каких-то статистических данных, и самый очевидный вариант — пойти на HLTV (главный сайт со статистикой и новостями CS:GO) или в саму CS и взять все данные оттуда: киллы, ассисты, смерти, процент хедшотов, ADR, KAST и много других разных интересных аббревиатур. Так?

Не так.

Обычная статистика вроде количества фрагов не объяснит, почему одна или другая команда выиграла матч. Это итоговый результат, ты не узнаешь за счет чего он получился из сухих цифр. И это мы еще не поднимали тему качества таких данных.

Казалось бы, что сложного посчитать понятные всем вещи, например, экономику? Но даже тут есть куча проблем, которые приходится решать аналитикам DataLouna.

Например, на HLTV используется только 4 типа закупа, когда на про-сцене их около 7, и их нельзя определить, просто подсчитав сумму потраченных денег.

Экономика, которая используется на сайтах вроде HLTV, и на про-сцене или в ДатаЛуне — это небо и земля. Количество денег недостаточно определяет, какой бай сейчас у команды, какая у нее огневая мощь.

Просто количества денег мало.

"Экономика влияет на игру очень сильно, это один из ключевых факторов на шансы в раунде. С хорошей экономикой у команды появляется преимущество, дополнительная возможность. Воспользуется ли команда этой возможностью — другое дело", — считает Svyat

Есть ли предел в количестве собираемой ДатаЛуной статистикой, и когда надо остановиться?

Сейчас аналитики разработали более 400 ивентов (статистических событий), которые уже учитываются в модели или находятся в разработке у программистов. И это не только экономика, вот несколько фундаментальных примеров, которые будут завязаны с другой статистикой:

Деление карт из соревновательного пула на зоны — на каждой карте есть ключевые области, которые важно занимать, перезанимать и отбивать, потому что они дают те или иные преимущества командам. Такое сейчас нигде не учитывается
Работа с геометрией карты. Если мы можем понимать не только, что делает игрок, но и где именно на карте — это открывает кучу новых возможностей

Тепловые карты рисуются игроками-гиками и компаниями, но это скорее красивая игрушка, а не широко применяемый инструмент аналитики

“Сколько ивентов будет реально эффективных, я сказать точно не могу. Но будет какой-то предел — это точно.

В некоторых ивентах я уверен, буду топить за них при разработке, потому что знаю по своему опыту, что эта вещь не может не влиять. Это может быть субъективная оценка, но она выработана опытом и не одним годом потраченного времени”, — рассказал о планах Эрик Акимов.

Вот пара примеров статистики, которая собирается в связке с геометрией карты и не только:

Работа в паре или тройке, отрабатывание ролей в команде
Эффективность гранат — и речь не просто о времени ослепления или нанесенном уроне, но и том, куда и откуда они бросаются. Например, эффективность использования "моменталок" - ослепления с помощью флешки, которая находилась в поле зрения соперника всего лишь доли секунды и поэтому у него не было возможности среагировать и отвернуться
Скорость наведения прицела на модельку соперника (без учета прошивов и случайных выстрелов) или в дефолтные места для чека соперника
Частота и эффективность прошивов
Использование механик игры: стрельба сидя, стоя или в движении и ее точность; эффективность спрея

"Можно придумывать все, на что хватит фантазии", — говорит AKIMOV.

В чем проблема текущей модели DataLouna, и как она будет улучшена

Несмотря на то, что средняя точность предсказаний DataLouna.ru чуть больше 70%, в прогнозах есть один большой вызов.

Сейчас искусственный интеллект анализирует данные и делает прогноз на основе команды как единого целого. То есть все данные о сильных и слабых сторонах игроков собираются в одно целое, условно мы называем такую модель “команда - карта”.

И если команда решафлится, то модель первое время работает хуже — она работает только со статистикой на уровне команды, не видит отдельных игроков. Поэтому в первый день турнира, перед которым прошло много решафлов, результат может быть плохим . Но из-за того, что модель обучается на свежих данных, второй турнирный день будет лучше. А следующий — еще лучше.

Мы учли эти недочеты и уже тестируем новую модель “игрок - раунд”, и она показывает лучшие результаты. Теперь искусственному интеллекту не понадобится день на “разогрев” — модель с самого начала начнет выдавать лучшие результаты, и при этом продолжит дообучаться по ходу соревнования.

“Если мы начнем смотреть от раунда и игрока, у нас будут более точные данные, и мы сможем лучше прогнозировать тот или иной исход.

Это то, что было нужно сделать сразу, но на тот момент это было долго и сложно, даже невозможно. Сейчас же это наши ближайшие планы”, — рассказал AKIMOV.

Чего уже добилась DataLouna и где следить за ее успехами

Любой может зарегистрироваться на DataLouna.ru, на сайте есть все исторические данные — 427 проанализированных матчей топ-турниров с начала 2022 года.

Мы не скрываем неудачи (полная статистика прогнозов доступна на сайте бесплатно после регистрации), но одновременно гордимся своими успехами — после месячного перерыва в соревновательном сезоне наша модель смогла правильно спрогнозировать результаты 70% матчей BLAST Premier Fall Groups 2022.

Статистика BLAST Premier Fall Groups 2022

Модель прогнозирует некоторые вещи, про которые я бы никогда не подумал. И она это уверенно делает.

Было несколько матчей, например Vitality против G2 на BLAST Fall Groups. Там DataLouna смогла правильно спрогнозировать победу андердога (G2), при этом модель предсказала поражение G2 на своем пике карты и победу на пике соперника — это встречается в матчах такого высокого уровня не так часто.

"То, что ИИ еще не сделан до конца, а уже находит такие важные кейсы, очень вдохновляет", — делится AKIMOV.

Тот самый прогноз на матч G2 — Vitality

Следить за успехами ИИ можете и вы — подписывайтесь на наш блог или регистрируйтесь на DataLouna.ru, чтобы посмотреть на результаты работы команды аналитиков и программистов.

Обратную связь и вопросы можно присылать на CEO@datalouna.ru

В следующем посте мы расскажем о взгляде на проект программистов — это будет продолжением серии постов о DataLouna