1/
📦 데이터가 많을 땐 전부 들여다보는 건 무리!
그래서 핵심만 쏙 뽑은 요약이 필요합니다.
가장 많이 쓰이는 요약 방식?
→ 바로 ‘5가지 요약 수치’ (five-number summary)
2/
이 다섯 가지는 이거예요 👇
최소값 (min)
제1사분위수 (Q1)
중앙값 (Q2, median)
제3사분위수 (Q3)
최대값 (max)
Q1~Q3는 중심에 몰려 있는 값들 요약,
min/max는 양쪽 극단값을 보여줘요.
3/
📌 왜 중요한가요?
평균은 극단값에 흔들리지만,
중앙값(Q2)은 흔들림이 적어요 = 강건함(robust)
또한 Q1~Q3 사이 간격(IQR)은
데이터가 얼마나 퍼져 있는지를 말해줘요!
4/
요약하자면:
데이터의 중심은 Q2
퍼짐 정도는 Q3 - Q1 (IQR)
극단값은 min/max
👉 5가지 수치로 데이터 한눈에 파악 가능!
통계 초입에선 이거 하나로도 충분해요.