0-1. 시냅스 소개

시냅스의 구조 및 모듈에 따른 대표 기능

🏷️

시냅스는 데이터를 정리하고, 라벨링 하고, 학습 데이터셋을 만들고, 모델을 학습하는 과정을 단일 환경에서 관리하는 도구입니다.


시냅스의 기본 구조


시냅스의 구조 도식

시냅스의 구성

시냅스는 3개의 하위 모듈2개의 통합 기능으로 구성됩니다.

1-1. 하위 모듈

  • 카탈로그(Catalog) : 원천 데이터를 컬렉션(Collection)단위로 저장하고 관리하는 영역
  • 프로젝트(Project) : 데이터를 불러와 라벨링하고 관리하는 작업 공간
  • 머신러닝(Machine Learning) : 가공된 데이터를 기반으로 모델을 학습하는 영역

1-2. 통합 기능

  • 인프라(Infra) : 데이터 저장(스토리지)과 모델 학습 등 연산 작업을 수행하는 실행 환경(에이전트) 목록
  • 플러그인(Plugin) : 데이터 처리, 임포트와 익스포트, 모델 등 워크스페이스에 등록된 플러그인 목록


시냅스의 활용


시냅스 모듈 전반 활용 예시


시냅스의 주요 기능


1. 워크스페이스

워크스페이스별 사용자 역할 및 권한 관리

워크스페이스 설정 : 데이터 관리와 모델 개발을 위해 필요한 환경을 워크스페이스별로 구축할 수 있습니다.

구분사용자 권한
워크스페이스오너 / 어드민 / 멤버
워크스페이스 하위 모듈(카탈로그, 프로젝트, 머신러닝)리더 / 매니저

2. 카탈로그

PCD 프로젝트 라벨링 설정 화면

최적화 데이터 업로드 : 다양한 업로드 옵션을 제공합니다. 👉 2-2. 데이터 임포트

  • 이미지, 비디오, 센서, 테스트 등 다양한 데이터
  • 초고용량 데이터 업로드 가능

대규모 데이터 관리 : 대규모 데이터를 목적에 맞게 나누어 관리할 수 있습니다. 👉 2-3. 데이터 유닛 관리

  • 컬렉션 대표 썸네일 변경 기능 제공
  • 다양한 뷰 옵션 기능 : 아이콘, 갤러리, 리스트뷰

데이터 유닛 커스텀 설계 : 라벨링 목적에 맞추어 최적화된 데이터 구조를 설계할 수 있습니다. 👉 2-1. 컬렉션 생성

  • 메인 및 서브 기능을 활용한 커스텀 구조 생성
  • 필수 데이터 지정 가능

3. 프로젝트

직관적인 라벨링 유형 설정 : 프로젝트 요구에 맞는 라벨링을 위한 세팅을 간편하게 설정할 수 있습니다.

프롬프트 프로젝트 대형언어모델 설정

  • 각 어노테이터 유형별 세부 설정 기능 : 클래스, 속성, 옵션
  • 프롬프트 어노테이터 LLM 설정 기능

일관성과 품질을 보장하는 작업물 관리 : 작업물 간 일관성을 유지하며 라벨링 품질을 높일 수 있습니다.

작업 상태 분류


데이터셋 버전 관리와 익스포트 지원 : 데이터셋을 체계적으로 관리하고 익스포트를 통해 활용할 수 있습니다.

데이터 익스포트 유형 옵션


세분화된 작업물 관리 : 작업의 복잡성을 줄이고 진행상황을 명확히 파악할 수 있습니다.

워크샵을 활용한 작업 관리

워크샵별 상세 관리 기능

검수자 할당 및 작업자 배정 기능


4. 머신러닝

학습 현황 시각화

목적에 따른 실험 생성 : 생성하고자 하는 모델의 목적에 따라 실험을 만들 수 있습니다. 👉 4-1. 실험 생성


No Code기반 학습 생성 : 클릭으로 생성하고자 하는 학습의 다양한 값을 설정할 수 있습니다. 👉 4-3. 학습 생성


학습 과정 및 결과에 대한 실시간 모니터링 : 학습 이력의 세부 현황을 시각화하여 열람하고 관리할 수 있습니다.


실험 내 모델 트리 관리 : 동일한 인공신경망에서 생성된 학습 이력 세부 현황을 열람하고 관리할 수 있습니다.
(현재 모델 상세 현황 기능은 개발 중이며 향후 제공 예정)

학습 모델 리스트


5. 플러그인

플러그인 저장 및 활용

학습된 모델의 시냅스 탑재 활용 : 등록된 모델을 플러그인으로 시냅스 내의 원하는 모듈에서 활용할 수 있습니다.

  • 시냅스 어노테이터의 스마트툴 / 프로젝트의 작업(task)에 전처리 등

모델 저장소와 손쉬운 연동 : 시냅스 외부에 있는 모델도 시냅스 플러그인으로 등록하여 활용할 수 있습니다.

  • 플러그인 등록 기능
  • 허깅페이스(Huggingface) 모델 / 깃헙(Github) 모델 연동

6. 인프라

에이전트 연동 : 현재 활용하고 있는 클라우드 혹은 서버를 연동하여 활용할 수 있습니다. 👉 5-1. 에이전트 연동

인프라 - 에이전트 연동

  • 에이전트 연동 : 클라우드 GPU / 온프레미스 GPU / 데이터메이커가 제공하는 GPU
  • 인터페이스를 통한 에이전트 상태 확인 : 현재 활성화(연동) 여부 / 사용량 확인

다양한 종류의 스토리지 연동 : 현재 활용하고 있는 클라우드나 스토리지를 연동해 활용할 수 있습니다. 👉 5-3. 스토리지 관리

스토리지 연동 현황

  • 클라우드 스토리지 / 온프레미스 스토리지 / 데이터메이커가 제공하는 스토리지

7. 데이터랩

데이터랩 (작업자) 화면

워커 공간 관리 : 작업자와 검수자가 필요로 하는 정보를 직관적으로 이용할 수 있습니다.

  • 워커별(작업자/검수자) 할당작업 및 반려 작업 목록 제공
  • 워커별 할당작업 통계 지원

워커와 관리자 간 커뮤니케이션 : 작업 효율성을 높이는 커뮤니케이션 창구를 활용할 수 있습니다.

  • 가이드라인 : 데이터 가공 작업에 관련한 프로젝트별 가이드라인 업로드 제공
  • 공지사항 : 프로젝트별 공지사항 확인 기능

8. 어노테이터

시냅스 프로젝트 생성 시 어노테이터 종류 선택창

다양한 유형별 데이터 가공을 지원 : 작업 효율을 높이는 다양한 어노테이터를 활용할 수 있습니다. 👉 7-1. 어노테이터 종류

  • 이미지 어노테이터 : 객체 구분, 분류 등의 이미지 데이터 형식 라벨링 지원 👉 이미지 어노테이터
  • 비디오 어노테이터 : 객체 추적, 구간 정체 라벨링 등 비디오 형식 데이터 라벨링 지원 👉 비디오 어노테이터
  • 오디오 어노테이터 : 음성 전사, 화자 구분, 구간 태깅 등 오디오 형식 데이터 👉 오디오 어노테이터
  • PCD 어노테이터 : PCD(Point Cloud Data) 3D 데이터를 기반으로한 라벨링 지원 👉 PCD 어노테이터
  • 텍스트 어노테이터 : 텍스트 데이터의 분류, 요약 등의 라벨링을 지원 👉 텍스트 어노테이터
  • 프롬프트 어노테이터 : LLM(대형 언어 모델)기반 질문-답변 데이터셋 구축을 지원 👉 프롬프트 어노테이터