[MLOps] DVC(Data Version Control) 데이터 버전 관리 사용법
DVC란?DVC는 data version control의 약자로 데이터의 버전을 관리해주는 툴이다. 딥러닝/머신러닝 분야는 데이터가 핵심이기 때문에 데이터를 잘 관리해줄 필요가 있다. 소스 코드는 git등으로 쉽게 버전을 관리할 수 있지만 데이터는 대용량의 데이터가 대부분이기 때문에 git으로 관리할 수는 없다. 따라서 대용량의 데이터를 git처럼 쉽게 간단한 명령어를 통해 버전을 만들고 쉽게 checkout할수 있으며 원격 저장소에 저장까지 할 수 있게 만들었다.사실 dvc는 데이터 버전 관리만 하는 것은 아니고, 실험 관리, CI/CD 등 ML에 활용되는 전체 파이프라인에 모두 활용할 수 있지만 이름인 DVC인 만큼 데이터 버전 관리하는 방법에 대해 알아보겠다.DVC 설치설치하는 방법은 매우 쉽다. ..
MLOps
2022. 9. 21. 22:34
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday