통계분포에 대해 알아보자
1. 분포란 무엇인가
통계에서 분포(distribution)란 어떤 변수의 모든 가능한 값들과 그 값들이 나타나는 빈도나 확률에 관한 정보를 제공하는 것을 의미합니다. 다시 말해, 분포는 데이터가 어떻게 퍼져 있는지, 중심은 어디에 있는지, 그리고 어떠한 모양을 가지는지를 나타냅니다. 분포는 셀수있는 이산확률분포(Discrete distribution)와 모든 값을 하나씩 셀 수 없는 연속확률분포(Continuous distribution)으로 크게 두개로 나뉜다.
2. 분포의 종류 및 예시
분포는 여러 가지 종류가 있습니다. 주요 분포의 종류와 각각의 예시에 대해 알아보겠습니다.
- 균등 분포 (Uniform Distribution)
- 모든 사건이 동일한 확률로 발생하는 이산 확률 분포입니다.
- 예시: 주사위를 던졌을 때, 1부터 6까지의 숫자가 나오는 확률은 모두 동일합니다.
- 정규 분포 (Normal Distribution)
- 정규분포는 가우스 분포 (Gaussian distribution) 라고도 불립니다.
- 가장 널리 알려진 연속 확률 분포로, 종모양의 그래프로 나타납니다.
- 중심극한정리에 의하여 독립적인 확률변수들의 평균은 정규분포에 가까워지는 성질이 있습니다.
- 그러므로 수집된 데이터의 분포를 근사하는데 자주 사용됩니다.
- 평균과 표준편차에 따라 그 모양이 결정됩니다.
- 예시: 인구의 키, 시험 점수 등 대부분의 자연 현상에서 관측되는 데이터 분포입니다.
- 이항 분포 (Binomial Distribution)
- 연속된 n번의 독립적 시행에서 각 시행에서이 확률 p를 가질 때를 표현하는 이산 확률 분포입니다.
- n이 1일 때 이항 분포는 베르누이 분포라 불립니다.
- 예시: 동전을 10번 던져서 앞면이 5번 나올 확률을 이항 분포로 설명할 수 있습니다.
- 포아송 분포 (Poisson Distribution)
- 단위 시간 안에 발생하는 어떤 사건이 몇번 발생할지 표현하는 이산 확률 분포입니다.
- 예시: 한 시간 동안 특정 지점을 지나는 차량 수를 포아송 분포로 설명할 수 있습니다.
- 지수 분포 (Exponential Distribution)
- 포아송 과정에서 사건 간의 대기 시간 분포를 나타내며 연속 확률 분포입니다.
- 예시: 고장난 기계가 다시 고장나기까지의 시간.
이외에도 여러 가지 특별한 상황에 적용되는 분포들이 있습니다.
'Excel, Python, 리액트' 카테고리의 다른 글
맥북 프로 13인치 스펙, 가격 정보 (0) | 2023.08.22 |
---|---|
인공지능(Artificial Intelligence), 머신러닝(Machine Learning), 딥러닝(Deep Learning) (0) | 2023.08.21 |
[클라우드 컴퓨팅 서비스] 아마존(aws), 마이크로소프트(azure) (0) | 2023.08.21 |
[파이썬 #1] 변수 (variable) 란? (0) | 2023.08.15 |
[파이썬] 클래스, 추상클래스, 절대경로, 상대경로, Import (59초컷) (0) | 2022.09.02 |