[딥러닝] Albumentations으로 증강 쉽게하기(Augmentation-python)AlbmentationsAlbumentations는 이미지를 손쉽게 augmentation 해주는 python 라이브러리이다. 코드 몇 줄로 매우 쉽게 구현할 수 있다. 또한 다양한 영상변환 알고리즘을 제공하고 있고, 그 처리속도도 매우 빨라 딥러닝 전처리 용으로 유용하게 사용할 수 있다.1. 이미지샘플 이미지로 Pascal VOC 중 하나의 이미지를 사용했습니다. A.Compose() 안에 augmentation하고 싶은 함수가 들어있는 리스트를 입력하면 됩니다. 각 함수들에는 p라는 파라미터를 입력받게 되어있는데, probability의 약자로 해당 함수가 적용될 확률을 입력하면 됩니다. 1이라면 무조건 적용하..
[ML] Pycaret으로 ML모델 쉽게 만들기Pycaret이란?pycaret이란 AutoML을 하게 해주는 파이썬 라이브러리입니다. scikit-learn 패키지를 기반으로 하고 있으며 Classification, Regression, Clustering, Anomaly Detection 등등 다양한 모델을 지원합니다. 공식문서에 설명이 매우 잘 되어있고, 몇 줄의 코드로 쉽게 구현이 가능하여 유용하게 사용할 수 있을 것 같습니다.1. 데이터셋 준비, setuppycaret에서 제공하는 get_data 함수로 juice 데이터를 불러오겠습니다. 데이터를 불러오면 자동으로 .head() 를 실행해 5개의 row를 출력합니다.from pycaret.datasets import get_data dataset..
1. 군집의 개수 K를 정한다. 2. 데이터 중 랜덤으로 K개의 데이터를 뽑는다. 3. 모든 데이터를 대상으로 각 군집의 중심(앞서 뽑은 K개의 데이터)까지 가장 가까운 군집에 소속시킨다. 4. 분류된 군집의 데이터를 평균내어 새로운 중심을 설정한다. 5. 3~4과정을 반복한다. Tensorflow로 구현한 소스코드 : https://github.com/JeonJeongMin/tensorflow-examples/blob/master/Machine%20Learning/K_means.ipynb
#Classification위의 예제와 같이 Email에서의 Spam유무 확인, 악성종양의 유무 등 분류에 사용하는 방법이 Classification이다.이진 분류의 경우 Label Y는 0 또는 1의 값밖에 없으며 0은 negative, 1은 positive를 의미한다. 이진 분류 이외에 클래스가 여러개라면 y의 레이블 또한 추가할 수 있다. 기존 Linear Regression과 같은 방법으로 구분하면 어떻게 될까?위 그림에서 볼 수 있듯이 종양의 사이즈가 어느정도 이상 큰 경우 positive값을 가질 때에는임계값을 정하여 Linear한 1차 직선으로 구분하는 것이 가능하지만기존사이즈와 달리 매우 큰 종양이 하나라도 있으면 임계값이 바뀌어 Linear하게 구분하는 것이 어려워진다. 이를 방지하기 위..
#Multiple features 실제 딥러닝에서는 위와 같이 입력값의 feature가 여러개인 경우를 고려해야 한다. 예측 함수인 Hypothesis함수도 각각의 feature의 개수에 맞춰 세타n까지 있어야 한다. feature가 여러개인 경우 Gradient Descent를 하기 위해선 각각의 세타를 편미분하여 학습률을 곱하여 빼주면 된다.이 때 편미분하여 유도되는 식은 feature가 하나였을 때와 같다. (단 x0=1로 간주한다.) #Feature Scaling Feature Scaling은 매우 중요하다. 각각의 feature값의 범위가 매우 다를 경우 왼쪽 그림처럼 GD의 학습속도가 매우매우 느려질 수 있다.이를 방지하기 위해 각 feature의 max값으로 나눠주어 대략 범위가 0
이 자료는 Cousera 강의 중 Andrew Ng교수님의 Machine Learning 강의를 더욱 잘 이해하기 위해서 학습용으로 정리하기 위한 자료입니다. #Supervised Learning지도 학습이란 위와 같이 O나 X와 같이 label이 정해져있어 그 함수를 유추해내기 위한 방법이다. 1.Linear Regression - 연속적인 값을 갖는 output을 유추해내는 방법이다. - 평수에 따른 집의 가격예측, 학습시간에 따른 성적예측 2. Classification - 0 또는 1처럼 맞거나 아니거나 둘 중 하나의 값을 갖게되는 것을 분류하는 방법이다. - 질병감염의 유뮤, 스팸메일의 구분 #Unsupervised Learning비지도 학습이란, 대상에 대한 label이 정해져있지 않은 상태에..
- Total
- Today
- Yesterday