とりあえず以下の図を作るまでの手順を公開。
使用環境、Google Colaboratory(以下、colab)
使用言語、python
背景はサッカーフィールド。ある選手の1ハーフのトラッキングデータ。 |
データの出典はこちら。(以下にリンクあり)
"Soccer video and player position dataset": S. A. Pettersen, D. Johansen, H. Johansen, V. Berg-Johansen, V. R. Gaddam, A. Mortensen, R. Langseth, C. Griwodz, H. K. Stensland, and P. Halvorsen, in Proceedings of the International Conference on Multimedia Systems (MMSys), Singapore, March 2014, pp. 18-23
解析、データ
元ネタはこちらの記事。
サッカーのヒートマップをQGISで作ってみる(Qiita)
ここでオープンになっているトラッキングデータを見つけた。
データと、このデータについての論文は、こちらのページからどうぞ。
CSVデータで公開されているので、これを読み込んでの解析となる。
解析環境は色々あるが、ここでは、python環境をブラウザだけで使えるcolabを選択した。
(もちろん手慣れた環境があればそちらでどうぞ)
colabについては、以下の記事をどうぞ。
・Google Colabの知っておくべき使い方 – Google Colaboratoryのメリット・デメリットや基本操作のまとめ(codexa)
・Google Colabを導入(Qiita)
上の図を作成に使った、colabで読み込めるプログラム(ノートブック)はこちら。
googleへの登録や、google drive へのデータのコピーなどは手間だが、pythonを安定に使えるのは魅力。(ほんとはGPUと機械学習が魅力)
pythonは慣れてないので、プログラムが汚いのはご勘弁を。
初心者の人達は、このプログラムを無闇に信用しないように。(もっと良い方法があるかも)
あと当然ながら、使用は自己責任で。
pythonでのCSVの読み込みについては、こちらの記事を参考にした。
pythonでのcsvファイルの読み込み(Qiita)
注意点
まずは上記の論文を読んで、データの諸々のご確認を。
定量解析をしたあげく、それには適さないデータだったというのもよくある事です。
さらに、The data may only be used for non-commercial research purposes. です。
このトラッキングデータは、動画とGPSセンサーから測定されていて、1mほどの誤差はあるとのこと。
このデータセットについての問題の一つは、その測定方法から、ボールの位置についてのデータが常備されていない事です。
ボールの位置については、トットナムとの対戦データだけあります。なぜテキストデータなのか…
サッカーマティクスの237ページに載っている、The DEBS 2013 Grand Challenge でもデータが公開されていますが、データ量は2.6GBとの事。
にほんブログ村
[記事一覧]トラッキングデータとスプリント回数について
0 件のコメント:
コメントを投稿