분포를 보고 선택하기
선택의 기준으로서의 분포
분포의 큼과 작음이 선택의 기준이 될 수 있을까?
대표값과 분포
예를 들어, 다음의 가정을 가지고, 두 다른 품종의 딸기를 비교해서 하나를 선택한다고 해보겠습니다.
당도가 높은 딸기를 좋아합니다.
당도가 아주 높은 딸기와 아주 낮은 딸기가 섞여 있으면, 오히려 실망스럽습니다.
따라서, 당도가 높으면서도 일관된 딸기를 좋아합니다.
두 품종의 딸기의 당도의 대표값과 분포를 보도록 하겠습니다.
당도 데이터 정리
딸기의 당도 데이터를 수집해서, 비교하기 쉽게 정리합니다.




당도의 분포를 시각화
딸기의 20알의 당도 데이터를 도수분포표와 막대그래프를 이용해서 시각화해보았습니다.
막대그래프의 X축은 당도 구간의 중앙값이고, Y축의 해당 구간의 딸기의 개수입니다. 중요한 것은 당도 구간이 우리 인간이 당도를 느끼는 정도를 얼마나 잘 반영하는가입니다.

12월 25일 출하한 두 품종의 당도 분포
12월 25일에 두 품종의 딸기 당도 데이터로 도수분포 막대그래프를 그려보았습니다. 당연히 오른쪽에 위치한 딸기 품종을 선택할 것입니다.

3월 25일 출하된 두 품종의 당도 분포
이번에는 3월 25일에 두 품종의 딸기 당도 데이터로 도수분포 막대그래프를 그려보았습니다.

3월 25일 출하한 딸기중에서는 어떤 품종을 선택할까요?
지금까지, 9월 첫째주 Open Question입니다. 다음 주에 뵙겠습니다.