본문 바로가기 메뉴 바로가기

기록은 기억을 지배한다

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

기록은 기억을 지배한다

검색하기 폼
  • 분류 전체보기 (138)
    • 알고리즘&자료구조 (11)
    • HTML+CSS (3)
    • React (3)
    • Python (16)
    • Java (2)
    • DataBase (1)
    • 클라우드 (3)
    • Ubuntu(Linux) (23)
    • 영상처리 (12)
    • ML | DL (29)
    • MLOps (3)
    • 개발 기타 (28)
    • 개인 기타 (4)
  • 방명록

data versioning (1)
[MLOps] DVC(Data Version Control) 데이터 버전 관리 사용법

DVC란?DVC는 data version control의 약자로 데이터의 버전을 관리해주는 툴이다. 딥러닝/머신러닝 분야는 데이터가 핵심이기 때문에 데이터를 잘 관리해줄 필요가 있다. 소스 코드는 git등으로 쉽게 버전을 관리할 수 있지만 데이터는 대용량의 데이터가 대부분이기 때문에 git으로 관리할 수는 없다. 따라서 대용량의 데이터를 git처럼 쉽게 간단한 명령어를 통해 버전을 만들고 쉽게 checkout할수 있으며 원격 저장소에 저장까지 할 수 있게 만들었다.사실 dvc는 데이터 버전 관리만 하는 것은 아니고, 실험 관리, CI/CD 등 ML에 활용되는 전체 파이프라인에 모두 활용할 수 있지만 이름인 DVC인 만큼 데이터 버전 관리하는 방법에 대해 알아보겠다.DVC 설치설치하는 방법은 매우 쉽다. ..

MLOps 2022. 9. 21. 22:34
이전 1 다음
이전 다음
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday

Blog is powered by Tistory / Designed by Tistory
  • 분류 전체보기 (138)
    • 알고리즘&자료구조 (11)
    • HTML+CSS (3)
    • React (3)
    • Python (16)
    • Java (2)
    • DataBase (1)
    • 클라우드 (3)
    • Ubuntu(Linux) (23)
    • 영상처리 (12)
    • ML | DL (29)
    • MLOps (3)
    • 개발 기타 (28)
    • 개인 기타 (4)

  • 방명록

티스토리툴바