재바기
JaeTech
재바기
전체 방문자
오늘
어제
  • 분류 전체보기 (77)
    • Computer Vision (2)
    • 선형대수학 (9)
    • Papers (1)
    • 알쓸신잡 (7)
    • 삽질 기록 (0)
    • 3D\Multiview Geometry (10)
      • CS231A (10)
    • Computer Science (46)
      • Algorithm (14)
      • JavaScript (3)
      • C || C++ (5)
      • Git || Github (3)
      • Linux (2)
      • DL || ML (5)
      • Operating System (8)
      • Computer Network (0)
      • Database (1)
      • Effective Python (5)
      • Data Communication (0)
    • 회고 (0)
    • Latex (1)

블로그 메뉴

  • 홈
  • 태그

Github

공지사항

  • 주인장에 대해

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
재바기

JaeTech

알쓸신잡

학습 시 두 개 이상의 데이터셋에서 batch 뽑아내는 법

2023. 4. 8. 18:52
728x90

종종 model의 input으로 두 개의 데이터가 들어갈 때가 있다.

따라서, dataloader도 각각 따로 필요할 수가 있고, 그로 인해 enumerate 함수의 인자를 어떻게 전달해야 할 지 헷갈릴 때가 있다.

 

그럴 때는 다음과 같이 enumerate안에 zip으로 두 dataloader를 묶어서 사용해보자.

    model.train()
    for epoch in range(num_epoch):
        print('EPOCH {}:'.format(epoch + 1))
        training_loss = 0.0
        for i, data in enumerate(zip(train_dataloader1, train_dataloader2)):
            # get the inputs; data is a list of [inputs, labels]
            data1, data2 = data
            input1, labels1 = data1
            input2, labels2 = data2

이렇게 enumerate안에서 두 dataloader를 zip하면 enumerate가 각각의 dataloader에서 batch를 잘 stack해서 전달해준다.

 

다만, 주의할 점은 이 때 enumerate의 리턴값으로 나오는 출력값이 조금 차이가 있다.

i 와 같이 index의 경우는 그대로 0부터 시작하지만, data는 두 dataloader에서 나오는 data가 합쳐져 있다.

따라서 data를 data1과 data2로 나눠주고, 이를 다시 input과 label로 나눠주면 된다.

728x90
저작자표시 비영리

'알쓸신잡' 카테고리의 다른 글

Ubuntu에서 Filezilla3 설치  (0) 2024.08.11
dlopen(): error loading libfuse.so.2 에러 해결  (0) 2024.08.11
MeshLab 설치 및 에러 해결  (1) 2024.05.09
두 개의 dataloader에서 에서 tqdm 쓰는 법  (0) 2023.04.08
티스토리(tistory) 모바일에서 LaTex 수식 깨짐 해결  (4) 2023.03.26
    '알쓸신잡' 카테고리의 다른 글
    • dlopen(): error loading libfuse.so.2 에러 해결
    • MeshLab 설치 및 에러 해결
    • 두 개의 dataloader에서 에서 tqdm 쓰는 법
    • 티스토리(tistory) 모바일에서 LaTex 수식 깨짐 해결
    재바기
    재바기
    재박이의 테크블로그

    티스토리툴바