2018年7月10日火曜日

【小ネタ】zone 1 と zone 2 の分布(ロシアワールドカップ)


マニア向けの記事です


数試合について、Activity time spent の zone 1 と zone 2 をプロットしたら、綺麗な線形になりました。

図1、複数の試合における zone 1 と zone 2 の分布図。

サンプルは、以前の記事(下記リンク)で紹介した、ロシア対サウジアラビア、ポルトガル対スペイン、メキシコ対ドイツ、日本対コロンビア、セネガル対ポーランド、日本対ポーランド、です。

(私にとっては)zone 1, zone 2 ともに、このワールドカップで初めて見たパラメーターなので、このような関係が当然のものかよく分かりませんが、この分布の意味について考えてみます。






参考記事


・参考記事1、「【小ネタ】ワールドカップの公開データ紹介

・参考記事2、「【小ネタ】Activity Time Spent とは

・参考記事3、「【日本代表】 日本ロシアドイツなどの「Activity time spent」の平均値



動機


前回の記事(【小ネタ】 ワールドカップのデータから,,,)で、私の印象の典型値として「(zone 1, zone 2) = (0.7, 0.2) と (0.6, 0.3) 」を挙げたので、検証のために zone 1 と zone 2 の散布図を作ってみました。

表中の数字を見た予想としては、(zone 1, zone 2) = (0.7, 0.2) と (0.6, 0.3) の二山構造だったのですが、思ったよりも線形性の強い分布となりました。


データは、参考記事3に挙げた試合について、途中交代の選手も全て含めてプロットしています。

途中出場の選手は、なかには極端な数字を残している選手もいるのですが、そういった数字は図1のプロット範囲には出てきません。




分布の解釈


図1の解釈を考えてみます。

図1の分布の特徴は、その線形性、位置です。

線形である事の意味は、サッカーにおける選手たちの動きの相互作用と、フィールド上の役割(動き)の違い、だと思われます。

戦術によっては、敵味方のトップの選手とセンターバックの選手達はあまり動きません。一方で、MFの選手達はボールをつなぐために潰すために激しく動きます。

特に動きの良い選手、ダイナモと呼ばれるような目立つ動きをする選手がいると、線形性は強くなるでしょう。

そのような選手がいなければ、線形性は弱まります。(この事は、チーム全体の良い動き悪い動きとは無関係です。)

動きの良い選手がいると、味方と相手の両チームの選手達は、その動きに引っ張られて、激しい動きをする必要が出てきます。(サッカーは選手たちの動きが相互作用するスポーツ。zone 1 が減少して、 zone 2 が増加する。)


zone 1 - zone 2 におけるこの分布の位置づけの意味は、トレーニング理論とサッカー戦術の発展の結果だと思われます。

この分布が、時代によってその位置を変えてきた事は十分に考えられます。


これだけ見た目の線形性が高いと、相関係数も高い値が出て、線形フィッティングの誤差幅も小さくなるだろう事は容易に想像できます。

線形フィッティングから出てくる傾きの意味は、つまり、あまり動かない守備陣と動き回る攻撃陣の落差です。

従って傾きの意味する所は、現在のトレーニング理論、チームのコンディショニングの到達地点だろうと思います。

zone 1 と zone 2 が速度パラメータなので、コンディショニングが分布の位置傾き線形性に関わるのは当たり前なのですが…、もうちょっと良い解釈があるかもしれません。



度数分布


公開されている zone 1 と zone 2 は整数値なので、プロットでは多くのシンボルが重なってしまいます。

そのため度数分布もプロットしました。

ビンサイズ(度数をカウントするための横幅)は3%としました。

図2、zone 1 の度数分布。65%あたり?にピーク。

図3、zone 2 の度数分布。25%から30%?あたりにピーク。

これらの図を見ると、サンプルの密集具合がよく分かります。

zone 1 はそこそこ対称分布ですが、zone 2 はちょっと非対称です。

zone 2 の分布は25%あたりが平均値だろうと思います。

私の二山分布の予想は完全に外れてしまいました。(コロンビア戦の日本の数値に引っ張られたか)



各チームの分布図


次に、各代表チームの分布図を見ていきましょう。

図4、ドイツ対メキシコ、ドイツの分布図。

(zone 1, zone 2) = (50%, 40%) はクロースです。

凄い動きですが、ただ他の選手達と差があり、孤立しているように見えます。

このように突出した選手がいると、分布の線形性は高くなります。

他の選手達がついていけなかったと見るべきですが、その近くの3人の選手達は (zone 1, zone 2) = (60%, 30%) と十分に良い動きをしており、「クロースが突出してしまった(クロースを突出させてしまった)」というのが最も適切な表現でしょうか。

(2人の選手達の数値が同じため、 (zone 1, zone 2) = (60%, 30%) の近辺でシンボルは2つ)

全体的に気になるのは、クロースがこの「3人」から離れており、さらにその後ろに多くの選手達がいる事です。

この「後ろの選手達」がもっと動いてクロースについていけたら、試合結果はちがったのかもしれません。

あるいは、クロースの動きを抑える事も、試合とグループステージ全体を考えての監督のとるべき選択肢だったかもしれません。


図5、ドイツ対メキシコ、メキシコの分布図。

一見して、ドイツの分布とはずいぶん違う事が分かります。

多くの選手達が (zone 1, zone 2) = (60%, 30%) に近い位置にいます。

この試合でのメキシコの守備の良さにも、納得です。


図6、ポルトガル対スペイン、スペインの分布図。

分布についてはポルトガルも似たような感じで、zone 1 で60%から70%、zone 2 で20%から30%です。

チーム全体のまとまりの良い動きとは、これらの数値幅でのほどよい分布で説明されるのかもしれません。


図7、日本対コロンビア、日本の分布図。

分布の右端、 (zone 1, zone 2) = (75%, 20%) あたりに位置するのは吉田と昌子です。

分布の左端、 (zone 1, zone 2) = (60%, 30%) あたりには、6人位固まっているように見えますが、半分の3人は途中交代の選手達(山口、本田、岡崎)です。(zone 2 のトップは岡崎)

他の3人は、香川、柴崎、長友で、この3人が日本を引っ張っていたと言えるでしょう。

この日本の分布は、スペインに比べて、バラツキが弱く、線形性が高いように見えます。

このバラツキの大小もちょっと気になりますが、解釈のアイデアはありません。



どう使うか?


今回の zone 1 zone 2 の数値は、チームパフォーマンスを客観視するのに使えるでしょう。

分かりやすいスプリントとは、また違う指標です。

監督やサッカー選手達は、試合中の選手たちの動きを見れば、その動きの良し悪しは感覚として分かる訳ですが、このような数値を提示すれば、チーム全体の動き、動きの良くない選手、突出している選手が客観的に分かります。

試合に出ている選手達にも分かります。


しかし、これらの数字が試合を作る訳ではありません。

前提として監督とチームの目指す戦術・試合運びがあって、そのどこが機能しているか機能していないかを知るために、練習段階からのスタッツの数字があるはずです。

どこまで数値を細かく使うかは、監督の好み次第ではあるでしょうが、Jリーグや各国の実情はどうなんでしょうね?



今回、限られた試合の数値を使いましたが、グループステージの全試合の数値を使っても、まぁ似たような傾向になるでしょう。(楽観視)

ノックアウトステージになると、延長戦に加えてPK戦まで実施される事がありますから、90分の数値とはちょっとずれた傾向が出てくるでしょう。


時間をかけてデータをいじくればまだ何か出てくるかもしれませんが、とりあえずここまでです。

後日、線形フィッティングの結果を追加するかも。



にほんブログ村 サッカーブログへ
にほんブログ村

0 件のコメント:

コメントを投稿

Related Posts Plugin for WordPress, Blogger...