데이터셋 : 2
Open Access
DOI

[ DATASET ]

가상 딸기 데이터셋

데이터셋

가상 딸기 데이터셋
가상 한우 데이터셋
초등학생의 수학적창의력 데이터셋
블렌디드 러닝 환경에서 수집된 초등학생 수학 학습 데이터셋
딸기 ID 품종 출하월 저온숙성 당도 저온숙성 후 당도 과중 등급 저온숙성 후 등급
1 1 12 1 12.13 12.32 24.51 1 1
2 2 1 1 10.13 10.25 19.76 3 3
3 1 2 1 10.48 10.62 21.69 3 3
4 2 3 1 7.89 8.06 17.30 6 5
5 1 4 1 9.81 10.03 18.87 4 3
딸기 ID 품종 출하월 저온숙성 당도 저온숙성 후 당도 과중 등급 저온숙성 후 등급
1 1 12 1 12.13 12.32 24.51 1 1
2 2 1 1 10.13 10.25 19.76 3 3
3 1 2 1 10.48 10.62 21.69 3 3
4 2 3 1 7.89 8.06 17.30 6 5
5 1 4 1 9.81 10.03 18.87 4 3
딸기 ID 품종 출하월 저온숙성 당도 저온숙성 후 당도 과중 등급 저온숙성 후 등급
개체 고유번호 설, 1; 아키, 2 12, 1, …, 4월 무, 0; 유, 1 Brix Brix g 1, 2, …, 7 1, 2, …, 7
1 1 12 1 12.13 12.32 24.51 1 1
2 2 1 1 10.13 10.25 19.76 3 3
3 1 2 1 10.48 10.62 21.69 3 3
4 2 3 1 7.89 8.06 17.30 6 5
5 1 4 1 9.81 10.03 18.87 4 3
딸기 ID 품종 출하월 저온숙성 당도 저온숙성 후 당도 과중 등급 저온숙성 후 등급
개체 고유번호 설, 1; 아키, 2 12, 1, …, 4월 무, 0; 유, 1 Brix Brix g 1, 2, …, 7 1, 2, …, 7
명목 내부원인변수 외부원인변수 외부원인변수 결과변수 결과변수 결과변수 결과변수 결과변수
1 1 12 1 12.13 12.32 24.51 1 1
2 2 1 1 10.13 10.25 19.76 3 3
3 1 2 1 10.48 10.62 21.69 3 3
4 2 3 1 7.89 8.06 17.30 6 5
5 1 4 1 9.81 10.03 18.87 4 3
딸기 ID 품종 출하월 저온숙성 당도 저온숙성 후 당도 과중 등급 저온숙성 후 등급
개체 고유번호 설, 1; 아키, 2 12, 1, …, 4월 무, 0; 유, 1 Brix Brix g 1, 2, …, 7 1, 2, …, 7
명목 내부원인변수 외부원인변수 외부원인변수 결과변수 결과변수 결과변수 결과변수 결과변수
명목형 명목형 명목형 이분형 연속형 연속형 연속형 이산형 이산형
1 1 12 1 12.13 12.32 24.51 1 1
2 2 1 1 10.13 10.25 19.76 3 3
3 1 2 1 10.48 10.62 21.69 3 3
4 2 3 1 7.89 8.06 17.30 6 5
5 1 4 1 9.81 10.03 18.87 4 3
딸기 ID 품종 출하월 저온숙성 당도 저온숙성 후 당도 과중 등급 저온숙성 후 등급
1 1 12 1 12.13 12.32 24.51 1 1
2 2 1 1 10.13 10.25 19.76 3 3
3 1 2 1 10.48 10.62 21.69 3 3
4 2 3 1 7.89 8.06 17.30 6 5
5 1 4 1 9.81 10.03 18.87 4 3
딸기 ID 품종 출하월 저온숙성 당도 저온숙성 후 당도 과중 등급 저온숙성 후 등급
1 1 12 1 12.13 12.32 24.51 1 1
2 2 1 1 10.13 10.25 19.76 3 3
3 1 2 1 10.48 10.62 21.69 3 3
4 2 3 1 7.89 8.06 17.30 6 5
5 1 4 1 9.81 10.03 18.87 4 3

요약영상

1 Videos

A synthetic strawberry dataset

박근철, 양윤원

제1저자: Geun Cheol Park, ORCID 0000-0002-3121-1113, DocuHut Co. Ltd., Seoul, Republic of Korea
Received Date: 2023-03-31, Revised Date: 2023-04-30, Accepted Date: 2023-05-30, Published Date: 2023-06-15
10.12972/DataLink.2024.a1
Park GC, Yang YW. 2024. A strawberry product value dataset generated using a normal distribution for effective data science learning. DataLink Forum 2024:a1
Print
구글문서

요약

본 데이터는 딸기의 품종, 과중, 당도, 숙성 후 품질 등 주요 품질 특성을 포함하며, 총 200개의 샘플과 8개의 변수로 구성되어 있습니다. 데이터 분석, 머신러닝 예측 모델링, 식품 품질 연구 등에 활용할 수 있도록 설계되었습니다.

데이터 파일 다운로드

데이터 설명

변수명 변수정의 설명 관측도구 데이터유형 척도유형 척도 단위 수체계
딸기 ID 개체 식별자 딸기 데이터를 구분하는 고유 ID 데이터 시스템 명목형 명목척도 식별번호 ℕ (자연수)
품종 딸기 품종명 딸기의 품종 구분 관찰 기록 명목형 명목척도 딸기 품종
출하월 출하된 월 딸기가 수확되어 출하된 시점의 월 출하 기록 이산형 순서척도 ℤ (정수)
저온속성 저온 처리 여부 저온 자극에 의한 숙성 촉진 처리 재배 관리 기록 이산형 명목척도 처리 유무 0 또는 1
당도 생과 당도 딸기 생과 상태의 당도 측정값 당도계(Brix) 연속형 비율척도 Brix °Brix ℝ (실수)
저온속성 후 당도 숙성 후 당도 저온속성 처리 후의 당도 측정값 당도계(Brix) 연속형 비율척도 Brix °Brix ℝ (실수)
과중 딸기 무게 한 개체당 평균 무게 전자저울 연속형 비율척도 무게 g ℝ (실수)
등급 품질 등급 외관, 당도 등을 종합 평가한 등급 전문가 판정 이산형 순서척도 등급 ℤ (정수)
저온속성 후 등급 숙성 후 품질 등급 저온속성 처리 후의 최종 평가 등급 전문가 판정 이산형 순서척도 등급 ℤ (정수)

기술 검증 (Technical Validation)

데이터는 딸기 품종의 특성을 반영하여 시뮬레이션으로 생성되었으며, 다음과 같은 품질 검토를 거쳤습니다:

  • 모든 변수에서 결측치 없음 (200/200 complete cases)
  • 품종에 따른 당도 평균 차이가 명확히 반영됨
  • 숙성 전후 당도 차이의 평균은 약 +0.7 Brix
  • 등급은 전체적으로 1~7 범위에 균등하게 분포됨

라이센스

이 데이터셋은 CC BY 4.0 라이선스로 공개되며, 누구나 자유롭게 사용할 수 있습니다. 단, 사용 시 반드시 출처를 명시해야 합니다.

문답

딸기의 상품가치를 가장 잘 나타내는 변수는?
등급입니다. 등급은 딸기의 상품가치를 나타내기 위한 목적으로 만든 변수입니다.
아티클