3-3. GT 데이터셋 생성

GT 데이터셋 생성 / GT 데이터셋 수정

GT 데이터셋(Ground Truth Dataset, GT Dataset)은 인공지능 모델이 학습할 때 정답(참값)으로 사용하는 데이터를 의미합니다. 라벨링이 완료된 데이터를 학습에 사용할 수 있도록 GT로 등록하여 GT 데이터셋을 구성합니다.


GT 데이터 생성

  1. GT 데이터셋을 생성하고자 하는 프로젝트에 들어간 후, 좌측 메뉴에서 컬렉션 탭을 선택하고 GT 데이터셋 탭으로 이동합니다.

  2. 우측 상단의 GT추가 버튼을 클릭한 뒤, GT 데이터 추가 팝업창에서 원하는 옵션을 선택하고 추가 버튼을 누릅니다.

    1. 프로젝트에서 추가하기 팝업창에서 원하는 GT데이터를 선택하여 GT추가버튼을 클릭합니다.

      • 프로젝트에서 추가하기 : 해당 프로젝트의 컬렉션에 있는 GT데이터를 불러옵니다.

      • 이전 GT데이터셋 버전에서 추가하기 : 이전에 생성한 GT 데이터셋 버전이 있다면, 해당 버전의 데이터를 불러올 수 있습니다. GT 데이터셋을 한 번도 생성한 적이 없다면 선택할 수 없습니다.

      GT 데이터셋GT 데이터셋(Ground Dataset, GT Dataset)은 인공지능 모델이 학습할 때 정답(참값)으로 사용하는 데이터들의 모음
      작업 ID작업에 부여가 된 고유의 값
      데이터 유닛 ID각각의 데이터 유닛에 부여하는 고유의 값을 의미하며, 특정 데이터 유닛을 찾을 때 용이함
      학습구성(Train, Validation, Test)머신러닝 모델 학습 시 데이터를 훈련(Train), 검증(Validation), 테스트(Test)셋을 일정한 비율로 나누어 배정하는 것을 의미. 일반적인 학습 구성은 8:1:1 정도로 구성됨
  3. 선택한 GT 데이터가 목록에 추가된 것을 확인합니다. 데이터 유닛**체크박스**를 선택 후 나타나는 액션바에서 데이터 구성비 변경버튼을 클릭하면 비율 설정 창이 열립니다. 기본 구성비는 8:1:1로 설정되어 있으나, 원하는 비율로 수정할 수 있습니다. 구성비를 변경한 후, 적용버튼을 클릭하면, 해당 비율에 따라 GT데이터의 학습 구성이 자동 선택된 것을 확인 할 수 있습니다.

  4. 변경이 필요한 GT데이터가 있을 경우, 해당 항목의 **체크박스**를 선택한 후 나타나는 액션바에서, GT업테이트버튼을 클릭합니다.데이터를 가져올 위치를 선택하고 업데이트버튼을 눌러 변경을 완료합니다.

  1. 데이터와 학습 구성이 설정이 완료되면, 우측 상단의 버전 저장버튼을 클릭하여 해당 GT버전을 저장합니다. GT 데이터셋 버전은 총 3가지 방식으로 저장할 수 있으며, 기본값은 Minor설정이 되어 있습니다. 모든 옵션 보기를 활성화하면 다음과 같은 버전 유형을 선택할 수 있습니다.

  • Major : 학습 구조 변경이나 전체 데이터 교체 등 중요한 변경 사항이 있을 때 선택합니다. 버전 저장 시, 버전 번호의 첫 번째 자리가 변경됩니다. 예) 1.0.0
  • Minor : 데이터 수정이나 일부 항목 업데이트 등 일반적인 변경 사항이 있을 때 선택합니다. 버전 저장 시, 두 번째 자리가 변경됩니다. 예) 0.1.0
  • Patch : 일부 데이터 값 변경이나 경미한 라벨 수정 등 소규모 변경 사항이 있을 때 선택합니다. 버전 저장 시, 세 번째 자리가 변경됩니다. 예) 0.0.1
  1. GT 버전을 저장하면, 해당 GT 데이터셋의 학습 구성 비율을 바 그래프로 확인할 수 있으며, GT 데이터셋 이름 옆에는 버전 유형에 따른 번호가 붙는 것을 확인할 수 있습니다.


GT 데이터 수정

  1. 버전을 저장한 GT 데이터셋을 수정하려면, GT 데이터셋 이름 우측 끝의 **아래 화살표**를 클릭한 후, 나타나는 드롭다운 목록에서 GT수정버튼을 클릭합니다.

  2. GT수정 버튼을 클릭하면, 우측 상단에 GT추가 버튼버전 저장버튼이 활성화된 것을 확인할 수 있습니다. GT 데이터 목록에서 데이터를 추가, 수정, 삭제하거나 학습 구성을 변경한 뒤 버전 저장을 클릭해 새로운 GT 데이터셋을 생성합니다. (GT업테이트. 데이터 구성비 변경, 삭제)

  3. 생성한 GT 데이터셋은, GT 데이터셋 이름 우측 끝의 아래 화살표를 클릭하면 나타나는 드롭다운 목록에서 확인할 수 있습니다.