2018年7月26日木曜日

オープントラッキングデータの解析 その1 読み込み


とりあえず以下の図を作るまでの手順を公開。

使用環境、Google Colaboratory(以下、colab)
使用言語、python

背景はサッカーフィールド。ある選手の1ハーフのトラッキングデータ。

データの出典はこちら。(以下にリンクあり)

"Soccer video and player position dataset": S. A. Pettersen, D. Johansen, H. Johansen, V. Berg-Johansen, V. R. Gaddam, A. Mortensen, R. Langseth, C. Griwodz, H. K. Stensland, and P. Halvorsen, in Proceedings of the International Conference on Multimedia Systems (MMSys), Singapore, March 2014, pp. 18-23 







解析、データ


元ネタはこちらの記事。

サッカーのヒートマップをQGISで作ってみる(Qiita)

ここでオープンになっているトラッキングデータを見つけた。

データと、このデータについての論文は、こちらのページからどうぞ。



CSVデータで公開されているので、これを読み込んでの解析となる。

解析環境は色々あるが、ここでは、python環境をブラウザだけで使えるcolabを選択した。

(もちろん手慣れた環境があればそちらでどうぞ)

colabについては、以下の記事をどうぞ。

Google Colabの知っておくべき使い方 – Google Colaboratoryのメリット・デメリットや基本操作のまとめ(codexa)

Google Colabを導入(Qiita)


上の図を作成に使った、colabで読み込めるプログラム(ノートブック)はこちら


googleへの登録や、google drive へのデータのコピーなどは手間だが、pythonを安定に使えるのは魅力。(ほんとはGPUと機械学習が魅力)

pythonは慣れてないので、プログラムが汚いのはご勘弁を。

初心者の人達は、このプログラムを無闇に信用しないように。(もっと良い方法があるかも)

あと当然ながら、使用は自己責任で。



pythonでのCSVの読み込みについては、こちらの記事を参考にした。

pythonでのcsvファイルの読み込み(Qiita)





注意点


まずは上記の論文を読んで、データの諸々のご確認を。

定量解析をしたあげく、それには適さないデータだったというのもよくある事です。

さらに、The data may only be used for non-commercial research purposes. です。

このトラッキングデータは、動画とGPSセンサーから測定されていて、1mほどの誤差はあるとのこと。

このデータセットについての問題の一つは、その測定方法から、ボールの位置についてのデータが常備されていない事です。

ボールの位置については、トットナムとの対戦データだけあります。なぜテキストデータなのか…



サッカーマティクスの237ページに載っている、The DEBS 2013 Grand Challenge でもデータが公開されていますが、データ量は2.6GBとの事。





にほんブログ村 サッカーブログへ
にほんブログ村


[記事一覧]トラッキングデータとスプリント回数について

0 件のコメント:

コメントを投稿

注目の投稿

サッカーにおけるボロノイ図使用の制限、ボロノイ図とは?

本記事の主張は、「 サッカーではボロノイ図を無制限に信頼しないでね 」、です。 特に私が危惧しているのは、盲目的な信頼によって、ボロノイ図が選手批判に使用される事です。 事実として、選手たちが動いてない時(動きが悪い時)ほど、ボロノイ図は各人がカバーできる領域に近くなり...