9-2. Python으로 상관분석하기 (ANOVA검정)
·
스포츠 AI·빅데이터(2024~)/빅데이터기반 스포츠경기분석
*검정 주제: 프로야구에서 장타율에 따른 승률 분석 1. 데이터 불러오기(경기데이터.xlsx)import pandas as pd#데이터불러오기data = pd.read_excel("경기데이터.xlsx", sheet_name = "프로야구")data.head() 2. 장타율 범주화* 장타율 데이터를 범주화 시키는 이유는, ANOVA 검정 자체가 연속형 변수와 범주형 변수 사이의 관계를 분석하기 위한 방법인데장타율(연속형) 승률(연속형) 두 변수 모두 연속형이기 때문에 장타율을 범주형 변수로 바꿔주기 위함!** ANOVA 분석예시) 1,2,3반의 수학 점수 비교 / 귀무가설: 세 반의 평균점수가 같다.import numpy as np#장타율을 범주화 시키기data['장타율_zscore'] =..