이제 데이터 공부 안하는 블로그

[Numpy 넘파이 기초] 최대값, 최소값, 중앙값, 평균값, 분산, 표준편차 구하기 본문

Numpy

[Numpy 넘파이 기초] 최대값, 최소값, 중앙값, 평균값, 분산, 표준편차 구하기

공사노비 2021. 9. 17. 14:36

 

최댓값, 최솟값 구하기

max() 메소드와 min() 메소드를 사용하면 numpy array의 최댓값과 최솟값을 구할 수 있다.

[in]:
import numpy as np

array1 = np.array([1, 2, 3, 4, 5, 6, 7]

print(array1.max()) # 최댓값 구하기 
print(array1.min()) # 최솟값 구하기

[Out]:
7
1

 

평균값 구하기

mean() 메소드를 사용하면 numpy array의 평균값을 구할 수 있다.

[in]:
import numpy as np

array1 = np.array([1, 2, 3]

print(array1.mean()) # 평균값 구하기 

[Out]:
2

 

중앙값 구하기

median() 메소드를 사용하면 중간값을 구할 수 있다. (median은 numpy array의 메소드가 아니라 numpy의 메소드다.)

[in]:
import numpy as np

array1 = np.array([1, 2, 3, 4, 5])

print(np.median(array1)) # 중앙값 구하기 

[Out]:
3.0

 

 

분산 구하기

var() 메소드를 사용한다. 분산(variance)은 편차 제곱의 평균이다. 편차에는 음수와 양수가 다 섞여있는데 편차의 값의 순수한 크기만 알기 위해서는 부호를 없애야 하니까 제곱을 해준다고 생각하면 된다. 

[in]:
import numpy as np

array1 = np.array([1, 2, 3, 4, 5]

print(array1.var()) # 분산 구하기 

[Out]:
2.0

 

표준편차 구하기

std() 메소드를 사용한다. 표준 편차(standard deviation)는 분산을 제곱근한 것이다. 분산은 제곱한 수라서 값이 너무 커질 수 있으니까 제곱하기 전으로 돌려주기 위해서 다시 제곱근 해주는 거라고 생각하면 된다.

[in]:
import numpy as np

array1 = np.array([1, 2, 3, 4, 5]

print(array1.std()) # 표준편차 구하기 

[Out]:
1.4142135623730951