
안녕하세요, 오늘은 google에서 작성한 MobileNet의 두 번째 버전입니다. 정식 이름은 MobileNetV2: Inverted Residuals and Linear Bottlenecks로 기존의 MobileNet에서 cnn구조를 약간 더 수정하여 파라미터 수와 연산량을 더욱 줄인 네트워크입니다. 논문링크: https://arxiv.org/abs/1801.04381 MobileNetV1 리뷰: https://minimin2.tistory.com/42 우선 논문에 제시된 아래 cnn 구조를 먼저 살펴보겠습니다. 두 구조의 block내부는 모두 지난 포스팅에서 설명드린 depthwise separable convolution입니다. (a)는 일반적인 resnet 구조에서 사용하는 residual 구조..

안녕하세요, 오늘은 MobileNet:Efficient Convolutional Neural Networks for Mobile Vision Application에 대해 리뷰해보겠습니다. 논문 링크: https://arxiv.org/abs/1704.04861 CNN의 초기 모델 VGG Network는 다들 아실 겁니다. 아래는 VGG-16 Network의 구조입니다. 단순히 채널 수를 증가시키며 convolution-pooling 의 연속으로 구성되어있습니다. 가장 직관적인 구조로 이해도 쉽고 구현하기도 쉽습니다. 하지만 모바일 환경에서 구동시키기엔 convolution 구조가 다소 무겁습니다. 그래서 파라미터량을 획기적으로 줄이기 위해 MobileNet이라는 새로운 논문이 나오게 됩니다. 이는 기존의 ..

안녕하세요, 딥러닝 관련 논문을 읽으며 나중에 공부한 내용을 상기하고자 논문리뷰 포스팅을 시작합니다. 단순 공부 목적으로 틀린 부분이 있으면 지적해주시면 감사하겠습니다. 첫 논문은 Learning Deep Features for Discriminative localization 이라는 논문입니다. [Introduction] 기존 CNN의 모델은 classification 을 이미지 내에서 어떤 특징(feature)를 보고 판단하는지 알 수가 없었습니다. 하지만 출력의 결과를 시각화하여 실제 모델이 이미지의 어떤 부분을 보고 분류하는지 알 수 있게 하였습니다. 이를 Class Activation Map이라고 하며, 줄여서 CAM라고 부릅니다. [모델] 기존 일반적인 모델에서는 마지막 feature map을..
이전 포스팅에서는 tensorflow를 이용해서 여러개의 레이어를 쌓고 그것을 통해 MNIST 손글씨 숫자인식을 구현해보았는데요, CNN(Convolutional Neural Network)을 통해 더욱 높은 정확도를 구현해보겠습니다. 기본적으로 CNN이란 이전의 일반적인 네트워크랑 달리 필터라는 것을 사용합니다. 이미지는 사실 2차원으로 구성된 데이터이기 때문에 이를 1차원으로 나열하면 이미지의 특성을 알아차리기 쉽지 않습니다. 2차원의 특성을 살리고자 CNN모델이 개발이 되었고 어떻게 구현하는지 살펴보겠습니다. 위 그림은 가장 기본적인 모델로 Convolutional Layer와 Pooling Layer를 두개를 연달아 놓은 후 그 데이터를 1차원으로 만들어 주고 Fully Connected Laye..
- Total
- Today
- Yesterday