📊 HW 1 Review
통계학: 불완전한 데이터로부터 구조를 추론하는 사고법
통계학은 완전한 정보를 다루지 않는다.
우리는 언제나 불완전한 표본 데이터로부터 세상의 구조를 추론한다.
통계를 공부하면서 느낀 점은,
discrete한 관측값을 통해 continuous한 세계를 연결해 나가는 과정이라는 것이다.
통계적 사고란
- 무엇이 일반적인지
- 무엇이 이상한지
- 그리고 얼마나 확신할 수 있는지
를 판단하는 사고 체계다.
🎯 AIM
표본으로부터 전체를 추론하라
1️⃣ 기술통계는 “숫자 요약”이 아니라 “해석의 출발점”
💬 면접 질문
평균과 중앙값이 다른 경우는 언제 발생하며, 그 차이는 무엇을 의미하나요?
✅ Best Answer
평균과 중앙값의 차이는 분포가 대칭적이지 않다는 신호다.
특히 일부 **극단값(outlier)**이 존재할 경우, 평균은 크게 영향을 받지만 중앙값은 상대적으로 안정적이다.
- 평균은 모든 값의 크기를 반영하므로 극단값에 민감하고
- 중앙값은 순서 기반 지표이기 때문에 분포의 중심 위치를 더 안정적으로 보여준다.
따라서 평균과 중앙값이 다르다는 것은
👉 데이터에 비대칭성이나 왜곡 요인이 존재할 가능성을 시사한다.
2️⃣ 평균 하나로는 데이터의 성격을 알 수 없다
💬 면접 질문
표준편차는 무엇을 의미하며, 왜 평균과 함께 봐야 하나요?
✅ Best Answer
표준편차는 관측값들이 평균 주변에 얼마나 흩어져 있는지를 나타내는 지표다.
평균은 데이터의 중심만 요약할 뿐, 변동성이나 분포 형태를 설명하지 못한다.
같은 평균을 가진 데이터라도
- 값들이 촘촘히 모여 있을 수도 있고
- 매우 넓게 퍼져 있을 수도 있다.
따라서 평균은 표준편차 및 분포 시각화와 함께 해석될 때 의미를 가진다.
3️⃣ 표본 평균은 왜 매번 달라질까?
💬 면접 질문
표본 평균은 왜 매번 다르게 나오며, 그럼에도 불구하고 왜 신뢰할 수 있나요?
✅ Best Answer
표본 평균은 무작위 추출에 의해 계산되므로, 표본이 달라질 때마다 값이 달라진다.
이는 오류가 아니라 자연스러운 변동성이다.
다만 동일한 방법으로 표본을 반복 추출하면
- 개별 표본 평균은 달라도
- 그 평균은 모집단 평균에 수렴한다.
이 때문에 표본 평균은 **불편추정량(unbiased estimator)**이라 불린다.
즉, 평균적으로는 참값을 맞추지만 항상 오차는 존재한다.
📌 불편추정량이란?
모수를 평균적으로 정확히 맞추는 추정량
- 不(아닐 불) : 아니다
- 偏(치우칠 편) : 편향
👉 반복했을 때 특정 방향으로 치우치지 않는다는 의미다.
4️⃣ 왜 표본 크기가 중요할까?
💬 면접 질문
표본 수가 많아질수록 추정이 안정적이라고 말하는 이유는 무엇인가요?
✅ Best Answer
표본 평균의 변동성은 **표준오차(Standard Error)**로 표현된다.
표본 수 (n)이 증가할수록 분모가 커지므로
👉 표본값의 변동성은 감소한다.
이는 표본 수가 많아질수록

- 우연(운)의 영향이 줄고
- 모집단 평균에 대한 추정이 더 안정적이고 신뢰 가능해진다는 의미다.
5️⃣ 통계적 사고와 계산의 차이
💬 면접 질문
왜 우리는 전체가 아닌 표본으로 판단할 수밖에 없나요?
✅ Best Answer
현실적으로 모집단 전체를 관측하는 것은 불가능하다.
따라서 표본을 통해 전체를 추론하는 것은 선택이 아니라 필연이다.
통계학은 이 과정에서 발생하는
- 오차
- 불확실성
을 정량화하여 판단의 신뢰도를 설명하는 도구를 제공한다.
💬 면접 질문
평균 하나만 보고 결론을 내리면 왜 위험한가요?
✅ Best Answer
평균은 데이터의 중심만 요약할 뿐
- 분포 형태
- 변동성
- 극단값의 영향
을 반영하지 못한다.
같은 평균이라도 데이터의 구조는 완전히 다를 수 있기 때문에
👉 평균은 반드시 분산·분포 정보와 함께 해석되어야 한다.
💬 면접 질문
“통계학은 확률의 학문이 아니라 불확실성 관리의 학문”이라는 말의 의미는?
✅ Best Answer
통계학의 목적은 확실한 답을 주는 것이 아니라,
우리가 내린 판단이 얼마나 책임질 수 있는지를 수치로 설명하는 것이다.
- 신뢰구간
- 표준오차
- 가설검정
은 모두 판단의 불확실성을 관리하기 위한 장치다.
👉 통계학은
정답을 보장하지 않지만, 근거 있는 판단을 가능하게 한다.
'BDAI FinDA 금융 데이터 분석 심화 과정' 카테고리의 다른 글
| 부동산이 아니라, 현금흐름 (1) | 2026.01.24 |
|---|---|
| 금융 데이터에는 정답이 없다 (0) | 2026.01.24 |
| 통계와 머신러닝을 구분해서 이해해야 하는 이유 (0) | 2026.01.23 |
| 금융 시스템 아키텍처/데이터 파이프라인 정리 (1) | 2026.01.19 |
| 금융 데이터는 무엇을 측정해야 하는가 (0) | 2026.01.19 |