2 мин.

Как система наград и миллионов параметров лишают ботов свободы выбора

Разработчиками не позавидуешь, они не смогли создать модель, обучающуюся всему сама с нуля, поэтому пришлось заходить на территорию математики. Сначала задачи были лёгкими: встань на колёса, пни мяч туда, подержи на крыше, сделай двойной прыжок. Но создатели идут дальше, боты же должны делать флип-ресет, должны дабл-тачить, уклоняться от взрыва, самим таранить, всё отбивать, забивать и быстро возвращаться, поэтому со временем набор из некоторого количества правил перерос в целую науку. Бесконечные коэффициенты (в связи с этим нескончаемые правки на +0,0007% к очередному параметру), всевозможные графики от количества касаний в минуту и физической высоты этих самых касаний до временного интервала между голами и средней скорости мяча. Мудрить можно сколько угодно, и я не представляю, как у них кипят головы, чтобы на языке закономерностей в конце концов прописать ботам например креативную игру в пас и слаженность на поле. И это первый минус - дальнейшее развитие требует титанических усилий и затрат по времени, и не факт, что в итоге выйдет то, что задумывалось. Второй момент, даже более значимый, чем тяжёлый труд разработчиков, ведь результат какой-никакой через годы да будет. Это ограничение свободы этими самыми правилами. Риппла захотели научить флип-ресету, так он при подлёте всегда переворачивался и касался дном мяча, Опти всегда проезжает точку сотки буста, даже если нитро там точно не появится ближайшее время, Сир всегда подбивает или заводит и работает через воздух, Нэксто традиционно фликает, а 95% атак идёт с выездом вперёд мяча и взрывом защитника, и где же тут выбор и вольность действий? Его можно сделать, опять прописывая строки, но я больше к тому, что всё не продумаешь, не пропишешь. Всегда будут ситуации при таком раскладе, когда бот решит действовать как сказали, а не по лучшему возможному варианту, сколько бы он не тренировался, ведь именно в предписании изначально заложена для большинства случаев может и прекрасная мысль, но ошибка/недочёт конкретно для выбивающегося из череды серых будней момента. Ауф. Свободу ботам! Ахах. Не, если серьёзно, чтобы сделать лучше, нужно менять всю концепцию создания, но пока это невозможно. Разработчики на прошедшем турнире сказали про это следующее: если поставить цель перед машиной только забивать, то она будет ездить по кругу и ничего не сделает никогда. Логически продолжив данную мысль выясняем, что нужно добавлять к движению повороты, а дальше? А дальше нужно добавлять навык использования буста, а дальше? Флип-ресеты, взрывы, дабл-тачи и пошло-поехало... Ограничение свободы - да, плохо, но по-другому никак пока что.