축구 월드컵대회 공식기록을 통한 경기력의 군집화
이 연구는 세계축구연맹(FIFA: Fédération Internationale de Football Association)에서 개최하는 축구 월드컵대회(2002 한일 월드컵, 2006 독일 월드컵, 2010 남아프리카공화국 월드컵, 2014 브라질 월드컵, 2018 러시아 월드컵)의 공식기록을 토대로 나타나는 경기력의 군집을 알아보는 데 목적을 두었다. 이 연구의 목적을 달성하기 위하여 각 축구 월드컵 대회의 64경기를 통해 기록된 공식기록을 홈팀과 어웨이팀에 대한 기록으로 구분하여 자료를 수집하였으며, 전체적으로 수집된 자료의...
Saved in:
Published in | 한국체육측정평가학회지 Vol. 20; no. 4; pp. 165 - 174 |
---|---|
Main Authors | , |
Format | Journal Article |
Language | Korean |
Published |
한국체육측정평가학회
01.12.2018
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | 이 연구는 세계축구연맹(FIFA: Fédération Internationale de Football Association)에서 개최하는 축구 월드컵대회(2002 한일 월드컵, 2006 독일 월드컵, 2010 남아프리카공화국 월드컵, 2014 브라질 월드컵, 2018 러시아 월드컵)의 공식기록을 토대로 나타나는 경기력의 군집을 알아보는 데 목적을 두었다. 이 연구의 목적을 달성하기 위하여 각 축구 월드컵 대회의 64경기를 통해 기록된 공식기록을 홈팀과 어웨이팀에 대한 기록으로 구분하여 자료를 수집하였으며, 전체적으로 수집된 자료의 수는 640개의 공식기록을 수집하였다. 자료의 수집과정에 있어서 축구 월드컵별로 자료의 수집이 곤란하거나 자료의 오류가 발견된 항목에 대해서는 제외토록 하였으며, 최종적으로 자료 수집과정에서 선정한 변수의 수는 총 23개였다. 독립변수로 선정된 공식기록은 득점, 실점, 슈팅시도, 유효슈팅수, 유효슈팅율, 패스수, 패스성공수, 패스성공율, 숏패스수, 숏패스성공수, 숏패스성공율, 롱패스수, 롱패스성공수, 롱패스성공율, 코너킥수, 파울한수, 파울당한수, 오프사이드, 볼점유율로써 총 19개였으며, 종속변수는 승패 및 비김, 랭킹차이, 대륙, 리그/토너먼트로써 총 4개를 선정하였다. 자료의 처리를 위하여 통계 스크립트 기반의 R 3.3.3 버전 소프트웨어를 R studio 1.0.136 버전 소프트웨어와 함께 사용하였으며, 자료의 군집화를 위하여 인공지능 기법의 하나인 자기구성지도(Self-Organizing Map)의 적용을 위하여 Kohonen 패키지를 함께 사용하였다. 이때 종속변수에 대한 일치 여부를 판단하기 위하여 전체 640개의 자료 중에서 320개의 자료는 자기구성지도를 학습하는 데 사용하였으며, 나머지 320개의 자료를 예측한 후, 실제의 값과 비교하여 결과를 도출하였다. 이 연구를 통하여 승패 및 비김은 90.31%의 적중률을 나타냈으며, 리그/토너먼트 89.06%의 적중률을 나타냈다. 또한, 대륙 변수는 70%의 적중률을 보였으며, 랭킹차이는 68.44%의 적중률을 나타냈다. The purpose of this study was to cluster the performance within the FIFA worldcup (2002, 2006, 2010, 2014, 2018 Soccer Worldcup) based on the official data. In order to approach the purpose of this study, 64 matches in each Worldcup was collected with the categories of home & away team. Totally, 640 data set was collected. In the data collection, the data which was a lack of variables or missing data existed was excepted within a whole data set. Thus, total variables considered were 23. 19 independent variables were selected that goal scored, goal conceded, shot attempts, shot on target, % of shot on goal, passes, passes completed, % of passes completed, short passes, short passes completed, % of short passes completed, long passes, long passes completed, % of long passes completed, corner kicks, foul committed, foul suffered, offsides and ball possession % were selected. 4 dependent variables were also selected that won/lost & draw, ranking differences, regions, and league/tournament types were considered. Statistical software called, R 3.3.3 version was used with R studio 1.0.136. Also, Kohonen package which could calculate the self-organizing map was utilized within the R software. Finally, 320 data set among the 640 data set was used for the training of the Self-Organizing Map and the rest of data (320 data set) was used for the prediction. As the result of this study, 90.31% of agreement was found in the use of won/lost & draw, 89.06% of agreement was shown in the league/tournament. Additionally, 70% of agreement was shown in region and 68.44% of agreement was found within the ranking differences. KCI Citation Count: 4 |
---|---|
ISSN: | 1229-4225 2671-9134 |
DOI: | 10.21797/ksme.2018.20.4.012 |