윤제로의 제로베이스

커스텀 데이터셋 (Custom Dataset) 본문

Background/Pytorch 기초

커스텀 데이터셋 (Custom Dataset)

윤_제로 2022. 1. 16. 00:57

1. 커스텀 데이터셋 (Custom Dataset)

torch.utils.data.Dataset을 상속받아 직접 커스텀 데이터셋을 만드는 경우도 있다.

torch.utils.data.Dataset은 파이토치에서 데이터셋을 제공하는 추상 클래스이다.

 

커스텀 데이터셋을 만들 때 가장 기본적인 뼈대는 아래와 같다.

class CustomDataset(torch.utils.data.Dataset):
	def __init__(self):
    # 데이터셋의 전처리를 해주는 부분
    def __len__(self):
    # 데이터셋의 길이. 즉 총 샘플의 수를 적어주는 부분 
    def __getitem__(self, idx):
    # 데이터셋에서 특정 1개의 샘플을 가져오는 함수