20
Lokofan is LO

Трансфермаркт и математика для начинающих

После вчерашней дискуссии про то, за ско
После вчерашней дискуссии про то, за сколько же все-таки можно отпустить Тикнизяна в Европу, я задумался: вот есть Трансфермаркт. Кто-то думает что цифры там взяты чуть ли не с потолка, другие привыкли полагаться на рассчитанную ТМ трансферную стоимость игрока практически вслепую (я, пожалуй, ближе ко второму лагерю).

А как обстоят дела на самом деле? Насколько вообще цифры, которые нам рисует ТМ, имеют отношение к реальности? Я решил немного поисследовать этот вопрос подручными средствами.

Для начала я собрал с сайта ТМ данные о трансферах этого лета — сколько игрок стоил на момент продажи по версии ТМ, и сколько за него реально заплатили (опять-таки по версии ТМ правда, но тут уж, думаю, более-менее на них положиться можно). Плюс я еще собрал возраст игроков, просто чтобы был.

Я брал только трансферы, в которых:

— указана расчетная трансферная стоимость игрока на момент перехода
— указана цена трансфера
— происходил именно полноценный трансфер, то есть игрок переходил не свободным агентом и не в аренду.

Получилось 312 трансферов. Что теперь с ними делать?
Трансфермаркт и математика для начинающих
Для начала просто построим график зависимости между расчетной и реальной ценой игрока. Черная линия на графике показывает отношение 1:1, то есть отражает идеальное состояние, когда Трансфермаркт абсолютно точно угадывает стоимость игроков. Красная и зеленя линии — это 0.67:1 и 1.5:1 то есть случаи когда цена трансфера в полтора раза меньше/больше расчитанной. Как видно на графике, большинство точек (то есть, собственно реальных трансферов) попадают между красной и зеленой линиями, то есть можно в целом считать, что указанная на ТМ стоимость игрока обычно близка к тем деньгам, за которые его в итоге продадут (для Тикнизяна такая оценка дает интервал от 1.67 до 3.75 миллионов).

Здесь, однако, стоит уточнить: Трансфермаркт судя по всему гораздо точнее угадывает цены дорогих футболистов (посмотрите, сколько точек вылезает за линии в левом нижнем углу графика). Что по-своему логично: про звезд больше информации, плюс для ТМ наверно важнее правильно угадывать их стоимость, чем стоимость менее известных игроков.

Затем я решил воспользоваться алгоритмом K-means. Грубо говоря, он разделяет данные на несколько групп (в данном случае я взял K=5, поскольку именно такое значение получилось оптимальным), каждую из которых представляет некий «усредненный по больнице» представитель.

В качестве параметров для модели я взял:

— расчетную трансферную стоимость
— процент «прибыли», то есть на сколько процентов больше (или меньше) ТС реально выручили на продаже этого игрока
— возраст игрока
Получилось интересно (на первом графике, кстати, точки тоже обозначены цветами в соответствии с этими кластерами. На втором графике размер точек зависит от трансферной стоимости игрока на момент продажи)
Итак, программа разделила все трансферы этого лета на пять групп. Попробую дать этому логическое объяснение:

Первый кластер: «Сбитые летчики» (красный)
Средний возраст — 26.4 года, хотя встречаются игроки и намного моложе
Средняя трансферная стоимость 8.5 миллионов, но даже ее они отбивают в среднем только на две трети. Видимо, это игроки, которые в какой-то момент выстрелили, но в итоге так и остались всю жизнь «подающими надежды», памятью о которых остался завышенный ценник на Трансфермаркте.

135 из 312 трансферов попали именно в эту, самую многочисленную, категорию.

Второй кластер: «Звезды» (зеленый)
Хотя можно и без кавычек, пожалуй. В среднем, трансфер игроков из этой группы обходится почти в 50 миллионов каждый, и Трансфермаркт практически идеально угадывает эти суммы, по крайней мере в среднем. В этой категории 31 трансфер, и практически все громкие переходы этого лета попали именно сюда.

Третий кластер: «Новые Месси» (синий)
Таких всего пятеро, но они настолько выделяются на фоне остальных, что ни в какой другой кластер машина их впихнуть не смогла. Даже когда я уменьшил количество кластеров до двух, получились вот они и все остальные. За этих молодых (старшему 20 лет) игроков переплачивали в 4-8 (!) раз против ценника с Трансфермаркта... Что, впрочем, все равно не такие большие деньги, с учетом невысокого значения этого самого ценника (миллион с четвертью в среднем). Двое из пяти сразу отправились по арендам, третий за первые два матча в новом клубе на поле провел 14 минут... Как-то там Жалолиддинов поживает, интересно?

Четвертый кластер: «Восходящие звезды» (циан)
По сути, более вменяемая вариация предыдущего кластера: игроки постарше (средний возраст 22.4 года), их самих побольше (36), переплачивают за них «всего лишь» вдвое... Но и цены уже начинают кусаться, средняя трансферная стоимость 5.9 миллионов евро — это уже ощутимо, по меркам РПЛ так точно.

Ну и пятый кластер: «Нормальные люди» (мажента)
Средний возраст 23 года, средняя трансферная стоимость около 10 миллионов евро, покупают их за эту самую стоимость, ну может с небольшой наценкой. Наверно, самые типичные европейские/латиноамериканские футболисты. Также это второй самый многочисленный кластер после «Сбитых летчиков», 105 трансферов из 312.

Как вы думаете, насколько такие кластеры действительно описывают картину трансферного рынка?

Но это все лирика, вернемся к основному вопросу: насколько точно ТМ предсказывает стоимость игроков?

На втором графике черная прямая линия — это ноль процентов «прибыли», то есть соответствие расчетной и реальной цены игрока. Ломаная черная линия — это средний процент «прибыли» по возрастам. Интересно, что где-то до 25 лет она выше нуля, а потом опускается ниже. То есть видимо ТМ ставит слишком низкие цены на молодых игроков и слишком высокие — на ветеранов, хотя и не сильно.

Красная прямая линия показывает расчитанное простенькой математической моделью (линейная регрессия, по сути мы пытаемся показать, что одна величина более-менее прямо или обратно пропорциональна другой) направление этого отклонения. Тут результат получился довольно близким — линия уходит ниже нуля в 26 лет.

То есть, если подвести итоги:

— Трансфермаркт сравнительно точен в своих прогнозах, обычно реальная цена футболиста отличается от предсказанной не больше чем в полтора раза
— Для более дешевых футболистов качество предсказания хуже
— Для футболистов моложе 25 лет стоит ожидать, что их продадут скорее дороже указанной цены, для футболистов старше 25 — наоборот, что их продадут дешевле
Как-то так. Не знаю, зачем я угробил на это столько времени, но было забавно
Новости по теме
Комментарии20
Я бы еще отметил, что на тм стоимость игрока не меняется в режиме реального времени, то есть эти 2,5 млн за Тики результат его игры под немецким руководством. И на тот момент 2,5 за Наира были вполне объективны
9
t
Согласен, в ближайшее время с учётом игр за сборную стоимость Наира на ТМ вырастет раза в 2 как минимум, если он продолжит в том же духе играть.
2
Если попадёт на Евро (Что возможно), цена вообще может до 7-8 лямов скакануть
1
когда уже закроется трансферное окно Тикнизяна tolya
4
К
Если мы продолжим выигрывать то никогда .... Придумают ещё что нибудь, кто будет выделяться... Слухи пойдут что Дзюба материл всех и падал на колени на невском. Баринова впсихушку кладут ИТП итд
1
По-моему самый большой фактор, который оказывает влияние на цену трансфера, но слабо учитывается трансфермаркетом это срок, оставшийся по контракту. На цифры трансфермаркета можно ориентироваться, особенно с коэффициентами 0.67-1.5. Это адекватная, рыночная цена, но на рынке ещё есть торг в обе стороны. Ну и очень сложно учесть позицию продающего клуба, тот же Наполи не торопится продавать своих лидеров и ломит цену намного выше рыночной.
2
L
я думаю, ТМ-то срок до конца контракта как раз учитывает в своей оценке, только вот не показывают они его, заразы. На страничке игрока есть только информация уже по новому контракту, а сколько оставалось до конца старого на момент перехода - не показывается
любопытный анализ)
1
Отличная проделанная работа, браво.
Правда я бы учитывал всякого рода политические факторы и искуственные задержки в обновлении данных.
Я более чем уверен, что их оценки ни разу не независимые.
Но могу ошибаться.
1
L
Чтобы их учитывать, нужна уже не пара скриптов, написанных забавы ради, это уже нужна команда профессионалов и неслабый сервак, на котором будет крутиться нейросетка (а модель, которая пытается учесть настолько сложные вещи, - это только нейросетка, ну или что-то не менее сложное)
2
Если брать нашу лига то много абсурда. Чалов 12, Фомин, Глебов по 8, Караваев 6, Сильянов 5,5.
1
Анализ подтверждает, что Наиру можно и нужно подождать!
Во-первых, цена его действительно должна вырасти;
Во-вторых, перейдя за низкую цену во второстный клуб, он может просто закинуть на лавке, Лёша не даст соврать, хоть Аталанта хороший клуб.
Реально же проявив себя в кЛубе на протяжении длительного времени, а ещё лучше получив какой-нибудь титул, он не только получит более высокий ганорар, но и изначально более лояльное отношение к себе, бонусом позволит заработать кЛубу на трансфере.
R
Ему уже 24 года, плюс заканчиваются контракт не способствует увеличению цены
1
a
Так у него контракт до 2026 вроде
1
R
Человек пишет, про "взяв какой-нибудь титул". Даже при самом оптимистичном раскладе у него останется два года контракта
1
Посмотреть еще 2 ответа
Хороший анализ 👍. Как раз сейчас заканчиваю изучать аналитику.
p
Есть ещё фактор "нужности" конкретного игрока. Он может реально стОит свои 5 млн, но новому клубу очень сильно нужен именно они именно сейчас и это не вопрос цены. Старый клуб это понимает и накручивает ценник, продав его за 10-15 млн.
Ничего не понял, но очень интересно...
Только зарегистрированные пользователи могут оставлять и читать комментарии, войдите или зарегистрируйтесь