CNN으로 MNIST 분류하기

Notice

Recent Posts

Recent Comments

Link

« 2025/11 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

Tags more

Archives

Today

Total

관리 메뉴

윤제로의 제로베이스

CNN으로 MNIST 분류하기 본문

Background/Pytorch 기초

CNN으로 MNIST 분류하기

윤_제로 2022. 1. 19. 16:56

https://wikidocs.net/63565

02. CNN으로 MNIST 분류하기

이번 챕터에서는 CNN으로 MNIST를 분류해보겠습니다. ##**1. 모델 이해하기** 우리가 만들 모델의 아키텍처를 이해해봅시다. 합성곱 신경망은 출처에 따라서 합성곱 ...

wikidocs.net

1. 모델 이해하기

1) 첫번째 표기 방법

합성곱(nn.Conv2d) + 활성화 함수(nn.ReLU)를 하나의 합성곱 층으로 보고, 맥스풀링(nn.MaxPool2d)은 풀링층으로 명명한다.

2) 두번째 표기 방법

합성곱(nn.Conv2d) + 활성화 함수(nn.ReLU) + 맥스풀링(nn.MaxPool2d)을 하나의 합성곱 층으로 본다.

# 1번 레이어 : 합성곱층(Convolutional layer)
합성곱(in_channel = 1, out_channel = 32, kernel_size=3, stride=1, padding=1) + 활성화 함수 ReLU
맥스풀링(kernel_size=2, stride=2))

# 2번 레이어 : 합성곱층(Convolutional layer)
합성곱(in_channel = 32, out_channel = 64, kernel_size=3, stride=1, padding=1) + 활성화 함수 ReLU
맥스풀링(kernel_size=2, stride=2))

# 3번 레이어 : 전결합층(Fully-Connected layer)
특성맵을 펼친다. # batch_size × 7 × 7 × 64 → batch_size × 3136
전결합층(뉴런 10개) + 활성화 함수 Softmax

2. 모델 구현하기

1. 필요한 도구 임포트와 입력 정의

import torch
import torch.nn as nn

# 배치 크기 × 채널 × 높이(height) × 너비(widht)의 크기의 텐서를 선언
inputs = torch.Tensor(1, 1, 28, 28)

2. 합성곱층과 풀링 선언

# 1 채널을 입력으로 받아서 32채널을 뽑아내는데, 커널사이즈느 3이고 패딩은 1이다.
conv1 = nn.Conv2d(1, 32, 3, padding=1)

# 32 채널을 입력으로 받아서 54 채널을 뽑아내는데, 커널 사이즈는 3이고 패딩은 1이다.
conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)

pool = nn.MaxPool2d(2) # 정수 하나를 인자로 넣으면 커널 사이즈와 스트라이드 둘다 해당값으로 지정된다.

3. 구현체를 연결하여 모델 만들기

지금까지는 선언만 했으므로 이를 연결시켜 모델을 완성시킨다.

out = conv1(inputs) # [1, 32, 28, 28]
out = pool(out) # [1, 32, 14, 14]
out = conv2(out) # [1, 64, 14, 14]
out = pool(out) # [1, 64, 7, 7]
out = out.view(out.size(0), -1) # [1, 3136]

fc = nn.Linear(3136, 10) # input_dim = 3,136, output_dim = 10
out = fc(out) # [1, 10]

3. CNN으로 MNIST 분류하기

import torch
import torchvision.datasets as dsets
import torchvision.transforms as transforms
import torch.nn.init

device = 'cuda' if torch.cuda.is_available() else 'cpu'

# 랜덤 시드 고정
torch.manual_seed(777)

# GPU 사용 가능일 경우 랜덤 시드 고정
if device == 'cuda':
    torch.cuda.manual_seed_all(777)
    
learning_rate = 0.001
training_epochs = 15
batch_size = 100

mnist_train = dsets.MNIST(root='MNIST_data/', # 다운로드 경로 지정
                          train=True, # True를 지정하면 훈련 데이터로 다운로드
                          transform=transforms.ToTensor(), # 텐서로 변환
                          download=True)

mnist_test = dsets.MNIST(root='MNIST_data/', # 다운로드 경로 지정
                         train=False, # False를 지정하면 테스트 데이터로 다운로드
                         transform=transforms.ToTensor(), # 텐서로 변환
                         download=True)
                         
data_loader = torch.utils.data.DataLoader(dataset=mnist_train,
                                          batch_size=batch_size,
                                          shuffle=True,
                                          drop_last=True)
                                          
class CNN(torch.nn.Module):

    def __init__(self):
        super(CNN, self).__init__()
        # 첫번째층
        # ImgIn shape=(?, 28, 28, 1)
        #    Conv     -> (?, 28, 28, 32)
        #    Pool     -> (?, 14, 14, 32)
        self.layer1 = torch.nn.Sequential(
            torch.nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1),
            torch.nn.ReLU(),
            torch.nn.MaxPool2d(kernel_size=2, stride=2))

        # 두번째층
        # ImgIn shape=(?, 14, 14, 32)
        #    Conv      ->(?, 14, 14, 64)
        #    Pool      ->(?, 7, 7, 64)
        self.layer2 = torch.nn.Sequential(
            torch.nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1),
            torch.nn.ReLU(),
            torch.nn.MaxPool2d(kernel_size=2, stride=2))

        # 전결합층 7x7x64 inputs -> 10 outputs
        self.fc = torch.nn.Linear(7 * 7 * 64, 10, bias=True)

        # 전결합층 한정으로 가중치 초기화
        torch.nn.init.xavier_uniform_(self.fc.weight)

    def forward(self, x):
        out = self.layer1(x)
        out = self.layer2(out)
        out = out.view(out.size(0), -1)   # 전결합층을 위해서 Flatten
        out = self.fc(out)
        return out
        
# CNN 모델 정의
model = CNN().to(device)

criterion = torch.nn.CrossEntropyLoss().to(device)    # 비용 함수에 소프트맥스 함수 포함되어져 있음.
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

# train
for epoch in range(training_epochs):
    avg_cost = 0

    for X, Y in data_loader: # 미니 배치 단위로 꺼내온다. X는 미니 배치, Y느 ㄴ레이블.
        # image is already size of (28x28), no reshape
        # label is not one-hot encoded
        X = X.to(device)
        Y = Y.to(device)

        optimizer.zero_grad()
        hypothesis = model(X)
        cost = criterion(hypothesis, Y)
        cost.backward()
        optimizer.step()

        avg_cost += cost / total_batch

    print('[Epoch: {:>4}] cost = {:>.9}'.format(epoch + 1, avg_cost))
    
# test
# 학습을 진행하지 않을 것이므로 torch.no_grad()
with torch.no_grad():
    X_test = mnist_test.test_data.view(len(mnist_test), 1, 28, 28).float().to(device)
    Y_test = mnist_test.test_labels.to(device)

    prediction = model(X_test)
    correct_prediction = torch.argmax(prediction, 1) == Y_test
    accuracy = correct_prediction.float().mean()
    print('Accuracy:', accuracy.item())

'Background > Pytorch 기초' 카테고리의 다른 글

자연어 처리 전처리 이해하기 (0)	2022.01.19
깊은 CNN으로 MNIST분로하기 (0)	2022.01.19
합성곱과 풀링(Convolution and Pooling) (0)	2022.01.19
기울기 소실(Gradient Vanishing)과 폭주(Exploding) (0)	2022.01.19
과적합(Overfitting)을 막는 방법들 (0)	2022.01.17

'Background/Pytorch 기초' Related Articles

윤제로의 제로베이스

CNN으로 MNIST 분류하기 본문

CNN으로 MNIST 분류하기

1. 모델 이해하기

1) 첫번째 표기 방법

2) 두번째 표기 방법

2. 모델 구현하기

1. 필요한 도구 임포트와 입력 정의

2. 합성곱층과 풀링 선언

3. 구현체를 연결하여 모델 만들기

3. CNN으로 MNIST 분류하기

'Background > Pytorch 기초' 카테고리의 다른 글

티스토리툴바