Main Architecture로는 AlexNet, VGG, GoogleNet, ResNet이 있다.
AlexNet이 처음으로 CNN을 딥러닝에 적용시킨 모델 ⇒ 이 이후 CNN 분야가 발전
AlexNet
최초의; Large Scale CNN.
- INput = 227 * 227 * 3
- 첫번째 레이어에서 출력 사이즈? ⇒ 96개의 11*11 사이즈인 필터니까 ⇒ (227-11)/4 +1 = 55
- 이 레이어에서의 파라미터의 갯수? ⇒ 96 * 11 * 11 * 3 이 됨.
- 필터 하나가 11113을 통과 여기에 전체 필터갯수까지 곱해서 되는거임.
- Alexnet은 8개의 레이어를 가진다요
VGGNet\
- VGG는 16에서 19개의 레이어를 가짐 (VGG16, VGG19)
- VGGNet은 7x7 conv를 사용하는대신에 3x3conv 2개를 사용하자는 마인드
- 아주 작은 필터 3*3만 사용한다. ⇒ 이웃 픽셀을 포함할 수 있는 가장 작은 필터 사이즈