MobileNet 버전별 비교

인공지능/이미지 분류

MobileNet 버전별 비교

FedTensor 2025. 12. 12. 11:53

timm (PyTorch Image Models) 라이브러리를 사용하면 최신 모델들을 쉽고 빠르게 가져올 수 있습니다. 특히 MobileNet 계열은 파라미터 수가 적고 연산량이 낮아 다양한 실험들을 빠르게 시도해 볼 수 있는 모델입니다.

1. MobileNet 버전별 비교 (timm 기준)

timm에서는 MobileNet V1부터 최신 V4까지 다양한 버전을 지원합니다. 아래 표는 대표적인 모델들의 파라미터 수와 ImageNet-1k 기준 Top-1 정확도입니다.

> 참고: 정확도는 timm 벤치마크 기준이며, 파라미터 수는 모델 구성(width multiplier 등)에 따라 달라질 수 있습니다. 아래는 가장 표준적인 설정(1.0x 또는 100) 기준입니다.

모델 버전	timm 모델명 (예시)	파라미터 수 (약)	Top-1 Acc (ImageNet)	특징
MobileNet V1	mobilenetv1_100	3.2M	~72.0%	Depthwise Separable Conv를 처음 도입. 구조가 단순하지만 최신 모델 대비 효율이 떨어짐.
MobileNet V2	mobilenetv2_100	3.5M	~72.8%	Inverted Residuals & Linear Bottlenecks 도입. 가장 널리 쓰이는 표준적인 경량 모델.
MobileNet V3 Large	mobilenetv3_large_100	5.4M	~75.2%	NAS(Neural Architecture Search)로 설계. h-swish 활성화 함수 사용. 성능과 속도 밸런스가 좋음.
MobileNet V3 Small	mobilenetv3_small_100	2.5M	~67.4%	극도로 적은 파라미터와 빠른 추론 속도가 필요할 때 사용. 정확도는 다소 낮음.
MobileNet V4 (최신)	mobilenetv4_conv_small	3.8M	~74.6%	최신 아키텍처. 모바일 기기에서의 하드웨어 효율성(지연 시간 최소화)에 집중하여 설계됨.
MobileNet V4 (최신)	mobilenetv4_conv_medium	9.7M	~79.9%	V4의 더 큰 버전. 파라미터 대비 매우 높은 정확도를 보여줌.

추천:

균형 잡힌 성능: mobilenetv3_large_100 또는 mobilenetv4_conv_small을 추천
CIFAR-10 특성 고려: CIFAR-10은 이미지가 작고(32x32) 클래스가 10개뿐이므로, mobilenetv3_small_100으로도 꽤 준수한 성능(90% 이상)을 낼 수 있으며 학습 속도가 매우 빠를 것임

2. 모델 버전별 사전학습 데이터셋

timm 라이브러리에서 제공하는 pretrained=True 옵션의 가중치들은 거의 대부분 ImageNet-1k (ILSVRC-2012) 데이터셋으로 학습된 것입니다.

데이터셋: ImageNet-1k
내용: 1,000개의 클래스, 약 128만 장의 훈련 이미지.
해상도: 기본적으로 224x224 해상도로 학습되었습니다.

CIFAR-10 적용 시 유의사항 (중요):

CIFAR-10 데이터는 32x32 픽셀입니다. ImageNet으로 학습된 MobileNet은 224x224 입력을 기대하므로 두 가지 전략 중 하나를 선택해야 합니다.

Resize: CIFAR-10 이미지를 224x224로 업샘플링하여 입력 (정확도는 높으나 메모리와 연산 낭비가 심함).
Fine-tuning (권장): 입력 크기를 32x32 그대로 사용하되, 모델의 첫 번째 Stride를 줄이거나 Pooling 레이어를 조정하여 특성맵(Feature map)이 너무 작아지는 것을 방지해야 합니다. (다만 timm 모델을 그대로 로드해서 쓰면 초반 레이어에서 정보 손실이 있을 수 있어, 보통 32x32 입력 시에는 업샘플링을 하거나 처음부터(Scratch) 학습하는 경우도 많습니다.)

요약 및 제안

데이터셋: 사전학습은 ImageNet-1k 기반
모델 선택: MobileNet V3 Large가 가장 무난하며, 최신 트렌드를 반영하고 싶다면 MobileNet V4 시도

'인공지능 > 이미지 분류' 카테고리의 다른 글

MobileNet을 CIFAR-10에 적용 시 정확도 및 기술 이슈 (0)	2025.12.12
CIFAR-10 모델 성능 분석 및 SOTA 트렌드 가이드 (0)	2025.12.04

현재글MobileNet 버전별 비교

FedTensor

데이터의 보호와 활용 - 천천히, 제대로

차등정보보호, 신경세포, ECC, 이질적데이터, 신경망, 데이터분석, 트랜스포머, 개인정보보호, 데이터이질성, 최소작용의원리, secagg+, 베이지안추론, non-iid, 비밀공유, 멱법칙, 이산로그문제, 인공지능, 차분프라이버시, 엔트로피, 뇌가소성, 정보보호, 연합학습, 푸아송분포, 타원곡선암호, 안전한집계, smpc, 사이버보안, kl발산, ecdlp, 보안다자간계산,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

FedTensor