3-1. 프로젝트 생성

프로젝트 정의 / 프로젝트 생성 방법

프로젝트(Project)의 정의

특정 목표를 달성하기 위해 데이터셋의 가공 방식 및 라벨링 운영 방식을 결정하고, 라벨링, 자원/품질 관리 등을 실행하는 단위를 말합니다.

예) 자동차 바운딩 박스 프로젝트, 얼굴 특징 추출 프로젝트 등

프로젝트를 생성하여 라벨링 작업 및 품질, 사용자(작업자/검수자/관리자) 관리 등, 라벨링 과정 전반에 대한 관리를 진행합니다.


지원 데이터 가공 유형

데이터 유형

데이터 가공(어노테이션) 유형

이미지

바운딩 박스, 폴리곤, 폴리라인, 키포인트, 시멘틱 세그멘테이션, 관계 등의 라벨링 방법을 제공합니다.

비디오

영상 분류, 구간 정제, 객체 태깅 등의 라벨링 방법을 제공합니다. 이미지 분할 방식이 아닌 영상 자체에 라벨링을 진행합니다.

텍스트

분류(감정 및 의도 분석), 개체명 인식, 관계 등의 라벨링 방법을 제공합니다.

포인트클라우드(PCD)

객체 인식, 인스턴스 분할을 위한 3차원 바운딩 박스, 3차원 세그멘테이션, 관계 등의 라벨링 방법을 제공합니다.

프롬프트

프롬프트와 LLM의 답변으로 이뤄진 대화셋 생성을 할 수 있으며 이를 기반으로 질문-답변 요약, 질문-답변 교정, 질문-답변 분석, LLM 답변 평가, LLM 모델 비교 등의 라벨링 방법을 제공합니다.


프로젝트 생성 방법

프로젝트를 생성하여 라벨링 작업 및 품질, 사용자(작업자/검수자/관리자) 관리 등, 라벨링 과정 전반에 대한 관리를 진행합니다.


  1. 상단 메뉴에서 프로젝트 탭을 클릭한 후, 프로젝트 생성버튼을 클릭합니다.

  2. 프로젝트 생성 팝업창에서 해당 프로젝트에서 사용할 어노테이터 종류를 선택한 후 다음 단계버튼을 클릭합니다. 프로젝트 생성 후에는 어노테이터 변경이 불가합니다. (*어노테이터는 데이터 라벨링 작업을 수행하는 도구이며, 이미지/비디오/PCD/텍스트/프롬프트 어노테이터가 있음)

💡

종류별 어노테이터의 구성과 활용방법이 궁금한 경우 7-1. 어노테이터 종류


기본정보

기본정보를 입력하고 다음 단계버튼을 클릭합니다.

  • 프로젝트 명 : 프로젝트의 이름을 입력합니다. 프로젝트명은 데이터랩에 노출됩니다. (최대 50자 입력 가능)
  • 설명 : 프로젝트에 대한 설명을 입력합니다. (최대 200자 입력 가능)
  • 썸네일 이미지 : 프로젝트 목록에서 썸네일로 보인 이미지를 첨부합니다. 첨부하지 않는다면 기본 이미지가 노출됩니다.
  • 컨텐츠 제한 : 민감한 데이터 포함 여부를 설정하는 기능으로, 이를 체크하면 프로젝트 썸네일이 직접 노출되지 않고 보호된 상태로 표시됩니다. 프로젝트 썸네일의 우측 상단에 있는 보기버튼을 클릭하면 원본 이미지를 확인할 수 있습니다.
  • 공개 여부 : 생성한 프로젝트의 공개여부를 설정합니다.
    • 전체공개 : 워크스페이스의 모든 사용자가 목록에서 확인이 가능하며 상세내용을 볼 수 있습니다.
    • 참가제한 : 워크스페이스에 포함된 모든 사용자에게 목록에는 노출되지만, 초대받은 사용자만 프로젝트에 진입이 가능합니다.
    • 비공개 : 초대받은 사용자만 목록에서 확인이 가능하며 진입이 가능합니다. 초대받지 못한 사용자에겐 목록에서 노출되지 않습니다.

컬렉션

컬렉션을 선택하고 다음 단계버튼을 클릭합니다.

  • 컬렉션 선택- 해당 프로젝트에 사용될 컬렉션을 선택해주세요. 상단의 드롭다운 메뉴를 통하거나 검색 기능을 이용하여 원하는 컬렉션을 선택할 수 있습니다.

    ※ 프로젝트 생성하려면 미리 컬렉션을 만들어두어야 합니다.
    ※ 또한, 어노테이터 별로 선택할 수 있는 컬렉션이 한정되어 있습니다. ex. 이미지 어노테이터 - 이미지 데이터가 메인인 컬렉션 / 비디오 어노테이터 - 비디오 데이터가 메인인 컬렉션 /컬렉션 프롬프트 어노테이터 - 텍스트 데이터가 메인인 컬렉션 등

🖐️

이전 단계로 돌아가고 싶어요!

지나온 단계의 입력한 정보를 수정하고 싶은 경우에는, 상단의 단계 제목을 클릭하여 이전 단계로 돌아갈 수 있습니다. 이전 단계의 정보 수정을 완료하면 반드시 '다음 단계>' 버튼을 클릭해주세요!

라벨링 설정

  1. 프로젝트에 사용할 라벨링 유형을 선택하세요. 여러 개를 추가할 수 있으며, 적용하려면 선택한 라벨링 추가 버튼을 클릭합니다.

    ※ 프로젝트 생성 시 선택한 어노테이터에 따른 어노테이션 타입만 보여집니다. (어노테이션 타입은 라벨링 방법을 지칭하는 것으로, 단독 또는 복합으로 선택, 세팅하여 라벨링 작업을 진행할 수 있음)

    • 이미지 라벨링 유형 : 어노테이션 그룹, 분류, 바운딩박스, 폴리곤, 폴리라인, 키포인트, 관계, 큐보이드
      • 어노테이션 그룹 : 서로 다른 두 개 이상의 어노테이션을 그룹화하는 기능
      • 분류 : 데이터를 기준에 따라 분류하는 방법
      • 바운딩박스 : 객체의 범위를 사각형의 박스로 지정하는 라벨링 방법
      • 폴리곤 : 객체의 범위를 다각형으로 지정하는 라벨링 방법
      • 폴리라인 : 선형 객체를 연속선으로 지정하는 라벨링 방법
      • 키포인트 : 객체의 특정 부위를 점으로 지정하는 라벨링 방법
      • 큐보이드 :
      • 시멘틱 세그멘테이션 : 이미지의 모든 픽셀에 클래스를 부여하여 물체, 배경 등을 의미적으로 분할하는 라벨링 방법
      • 관계 : 두 어노테이션 간의 관계를 생성

    • 비디오 라벨링 유형 : 어노테이션 그룹, 분류, 구간분리
      • 어노테이션 그룹 : 서로 다른 두 개 이상의 어노테이션을 그룹화하는 기능
      • 분류 : 데이터를 기준에 따라 분류하는 방법
      • 바운딩박스 : 객체의 범위를 사각형의 박스로 지정하는 방법
      • 폴리곤 : 객체의 범위를 다각형으로 지정하는 라벨링 방법
      • 폴리라인 : 선형 객체를 연속선으로 지정하는 라벨링 방법
      • 키포인트 : 객체의 특정 부위를 점으로 지정하는 라벨링 방법
      • 세그멘테이션 : 구간 분리 기능으로, 특정 구간을 분리하는 라벨링 방법

    • PCD 라벨링 유형 : 어노테이션 그룹, 3D 바운딩박스, 3D 세그멘테이션
      • 어노테이션 그룹
      • 3D 바운딩박스
      • 3D 세그멘테이션

    • 텍스트 프로젝트 생성 : 어노테이션 그룹, 분류, 개체명 인식, 관계
      • 어노테이션 그룹 : 서로 다른 두 개 이상의 어노테이션을 그룹화하는 기능
      • 분류 : 데이터를 기준에 따라 분류하는 방법
      • 개체명 인식(세그멘테이션) : 기준에 따라 전체 텍스트 중 일부분을 어노테이션으로 생성하는 라벨링 방법
      • 관계 : 두 어노테이션 간의 관계를 생성

    • 프롬프트 프로젝트 생성 : 분류, 질문, 답변
      • 분류 : 데이터를 기준에 따라 분류하는 방법
      • 질문 : 질문 데이터에 어노테이션 추가
      • 답변 : 답변 데이터에 어노테이션 추가

    👍

    프롬프트 어노테이터의 라벨링 설정 「대형 언어모델 API 설정」

    ① 대형 언어 모델 API 사용을 켜주세요. (Off → On).

    +대형 언어모델 추가버튼을 클릭하여 원하는 언어 모델을 선택하여 추가합니다. (Gemini, Mistral, ChatGPT)

    • 추가한 언어모델을 클릭하여 ***이름 /API key / * Model / temperature* 을 입력합니다. (* → 필수 입력값)

    ③ API key : 연동하고자 하는 생성형 서비스에서 API키를 발급받아 API키 번호를 입력합니다.

    사전 맥락 기능을 사용하고자 하는 경우 우측 버튼을 활성화하여 (Off → On) 사전 맥락 프롬프트를 작성해주세요. 해당 기능은 언어모델이 대화를 이해하고 적절히 응답할 수 있도록, 배경 지식이나 역할, 제약 등을 미리 설정해주는 기능입니다. (ex, 답변을 한국어와 일본어로 대답해주세요.)

    ⑤ 답변 생성에 토픽 내용을 활용하고자 하는 경우 우측 버튼을 활성화하여 (Off → On) 메타정보 토픽 키를 입력해주세요. 해당 기능은 LLM에게 답변을 생성시킬 때 단순히 프롬프트 문장만 던지는 게 아니라, ‘메타정보에 넣은 대화의 주제(=토픽)의 설명이나 배경 정보’를 함께 넣어주는 옵션입니다.


  2. 라벨링 유형을 추가한 후, 어노테이션의 클래스속성 구조를 설정합니다. 클래스 구성 방식은 기본 형식커스텀 JSON 스키마 두 가지가 있으며, 기본 형식은 클래스(1 Depth) - 속성(2 Depth) 구조로 구성되며, 커스텀 JSON 스키마는 원하는 대로 설계할 수 있습니다.

  • 클래스 추가버튼을 클릭해 클래스 항목을 추가합니다. (클래스는 개체명 인식, 관계, 분류 등 라벨링할 대상을 카테고리화하는 개념으로, 어노테이션 생성 시 클래스 값이 자동으로 선택되거나 상단에 고정될 수 있음)

    • 색상 : 색상 박스를 눌러 표시할 색상을 선택합니다. 컬러 팔레트에서 선택/스포이드로 색 추출/RGB 값 입력으로 색상 선택이 가능합니다.

    • 코드 : 데이터베이스에 저장되는 클래스 명칭입니다. 라벨링 진행 후 수정하면 오류가 발생할 수 있으므로 신중하게 설계 후 저장해주세요.※ 영문(시작은 영소문자만 가능), 숫자,지정된 특수기호(’-’ or ’_’)만 가능, 한글, 띄어쓰기 금지

    • 이름 : 어노테이터에 노출할 클래스 이름입니다. 띄어쓰기를 허용합니다.

    • 기본 여부 : 기본값 지정 여부를 선택합니다. 어노테이션 생성 시 클래스 값이 자동으로 기본 여부 활성화된 클래스로 선택됩니다.

    • 더보기 아이콘 (세 개 점 아이콘) : 클래스를 삭제합니다.

  • 속성 추가버튼을 클릭해 항목을 추가합니다. (속성은 클래스의 하위 항목으로 추가 여부는 선택 사항임.  단일/다중 선택 위젯 형식인 경우 속성 하위의 옵션 항목을 설정해야 함)

    • 코드 : 데이터베이스에 저장되는 속성 명칭입니다. 라벨링 진행 후 수정하면 오류가 발생할 수 있으므로 신중하게 설계 후 저장해주세요.※ 영문(시작은 영소문자만 가능), 숫자,지정된 특수기호(’-’ or ’_’)만 가능, 한글 띄어쓰기 금지
    • 이름 : 어노테이터에 노출할 속성 이름입니다. 띄어쓰기를 허용합니다.
    • 필수 여부 : 필수 여부를 활성화하면 해당 속성값을 설정해야 작업 제출이 가능합니다. 필수 입력인 속성 항목을 선택하지 않고 작업 제출을 시도할 경우 오류 메시지가 뜨며 제출되지 않습니다.
    • 위젯 : 속성 입력 유형을 아래와 같이 설정할 수 있습니다.
      • 단일 선택(Select box) : 속성 중 한 가지 선택

      • 단일 선택(Radio) : 속성 중 한 가지 선택

      • 다중 선택 : 한 개 이상의 속성 선택

      • 텍스트 : 텍스트 입력(옵션 항목 추가 불가)

  • 속성내 추가 버튼을 클릭하여, 속성 하위의 옵션 값을 추가합니다.

    • 색상 : 색상 박스를 눌러 표시할 색상을 선택합니다. 컬러 팔레트에서 선택/스포이드로 색 추출/RGB 값 입력으로 색상 선택이 가능합니다.

    • 코드 : 데이터베이스에 저장되는 옵션 명칭입니다. 라벨링 진행 후 수정하면 오류가 발생할 수 있으므로 신중하게 설계 후 저장해주세요.※ 영문(시작은 영소문자만 가능), 숫자,지정된 특수기호(’-’ or ’_’)만 가능, 한글, 띄어쓰기 금지

    • 이름 : 어노테이터에 노출할 옵션 이름입니다. 띄어쓰기를 허용합니다.

    • 기본 여부 : 기본값 지정 여부를 선택합니다. 어노테이션 생성 시 옵션 값이 자동으로 기본 여부 활성화된 옵션 항목으로 선택됩니다.

    • 더보기 아이콘 (세 개 점 아이콘) : 속성을 삭제합니다.

    • 대표 속성 설정: 어노테이터에서 사용되는 기능으로 , 어노테이션의 색상/모양/라벨을 표시할 때 기준이 되는 속성입니다. 라벨링 작업 시, 다른 속성보다 우선적으로 적용될 대표 속성을 선택하세요.라벨링 유형을 설정을 완료한 후, 다음 단계버튼을 클릭합니다.


작업 설정

다음과 같이 작업 설정을 입력한 후, 다음 단계버튼을 클릭합니다.

  • 작업별 최대 할당 수 설정 : 한 라벨에 할당될 수 있는 최대 작업 수입니다. 다수의 인원이 동일 라벨을 작업할 수 있도록 합니다. (기본값 : 1)

    • 할당 수 제한 여부 : 1개의 작업에서 생성되는 할당 작업의 개수를 설정합니다. 제한을 해제하면 무제한으로 할당됩니다.
    • 작업별 할당 수: 작업별 할당 제한 설정을 끄면 무제한으로 할당할 수 있습니다.

  • 불량 설정 여부 : 할당 작업을 불량 데이터로 처리할 수 있도록 허용합니다. 작업자/검수자의 어노테이터에 불량 버튼이 생성됩니다. (기본값 : 불가능)

  • 스마트 툴 설정 (오토 라벨링) : 데이터메이커 시냅스가 지원하는 AI 기반 오토 라벨링 도구를 적용하거나 사용자가 보유하고 있는 오토 라벨링 도구(AI 모델)를 등록하여 사용할 수 있도록 지원합니다.

    지원 오토 라벨링 도구는, 프로젝트 생성의 세 번째 단계인 ‘라벨링 설정’에서 라벨링 유형으로 폴리곤/키포인트 어노테이션 타입을 선택하면, ‘작업 설정’ 단계에서 스마트 툴 설정 카드가(오토 라벨링) 하단에 자동 생성됩니다. 원하는 플러그인, 모델, 에이전트 등을 선택한 후, 활성화 버튼 클릭합니다.

    • 수정 허용(프롬프트 어노테이터의 경우에 한 함) : 프롬프트 어노테이터에서 작성한 질문 및 언어모델이 생성해낸 답변을 수정할 수 있는 기능입니다.
    • 질문 수정 허용 활성화 버튼 (On ↔ Off) : 사용자가 질문했던 데이터를 수정할 수 있으며, 수정한 질문으로 재답변을 불러올 수 있습니다.
    • 답변 수정 허용 활성화 버튼 (On ↔ Off) : 언어모델이 답변한 데이터를 수정할 수 있습니다.

사용자 및 역할

사용자 초대 및 역할 설정 후, 생성버튼을 클릭하여 컬렉션 생성을 완료합니다.

사용자 및 역할

  • 사용자 초대 : 프로젝트에 접근할 수 있는 사용자 추가와 역할을 변경해주세요. 프로젝트 생성 후에도 프로젝트 설정 메뉴에서 사용자를 초대할 수 있습니다.


생성한 프로젝트는 프로젝트 목록에 카드 형태로 표시됩니다. 자주 사용하거나 중요한 프로젝트는 프로젝트 카드 하단의 북마크 아이콘을 클릭하여 즐겨찾기로 등록할 수 있습니다. 즐겨찾기된 프로젝트는 생성 순서와 관계없이 프로젝트 목록의 앞쪽에 우선 배치됩니다. 별도의 즐겨찾기 목록은 제공되지 않으며, 북마크 아이콘을 다시 클릭하면 즐겨찾기 설정을 해제할 수 있으며, 최대 5개까지 즐겨찾기 등록이 가능합니다.