본문 바로가기
반응형

분류 전체보기260

[실전 예제/이미지 분류/PyTorch] ResNet 기반 이미지 분류 모델 구성과 학습 이미지 분류(Image Classification)이란? 이미지 분류(Image Classification)는 입력 이미지 전체를 하나의 클래스로 분류하는 가장 기본적인 컴퓨터 비전 태스크입니다. 객체의 위치나 개수보다는 이미지가 무엇을 나타내는지를 판단하는 데 초점을 둡니다. ResNet(Residual Network)은 깊은 신경망에서 발생하는 기울기 소실 문제를 Residual Connection으로 해결한 대표적인 CNN 모델입니다. 이번 글에서는 이전 글에서 구성한 CIFAR-10 / ImageNet 형식의 데이터셋을 기반으로, PyTorch에서 ResNet 모델을 구성하고 실제 학습까지 연결하는 과정을 정리합니다.예: 동물·사물·풍경 이미지 분류예: 제품 카테고리 자동 분류 목표 CIF.. 2026. 1. 14.
[실전 예제/객체 탐지/PyTorch] Faster R-CNN 모델 구성과 COCO 학습 객체 검출(Object Detection)이란? 객체 검출(Object Detection)은 이미지 내에서 객체의 위치(Bounding Box)와 클래스(Class)를 동시에 예측하는 컴퓨터 비전 태스크입니다. 단순히 무엇이 있는지를 넘어서, 어디에 있는지까지 함께 추론하는 것이 핵심입니다. Faster R-CNN은 Region Proposal Network(RPN)를 통해 후보 영역을 직접 학습으로 생성하는 2-stage 객체 검출 모델로, 정확도가 중요한 환경에서 널리 사용됩니다. 이번 글에서는 이전 글에서 구성한 COCO 데이터셋을 기반으로, PyTorch에서 Faster R-CNN 모델을 구성하고 실제 학습까지 연결하는 과정을 정리합니다.예: 이미지 속 사람·차량·동물 검출예: CCTV, 자.. 2026. 1. 14.
[실전 예제/인스턴스 분할/PyTorch] Mask R-CNN 모델 구성과 COCO 학습 인스턴스 분할(Instance Segmentation)이란? 인스턴스 분할(Instance Segmentation)은 객체 검출(Object Detection)과 의미 분할(Semantic Segmentation)을 결합한 컴퓨터 비전 태스크입니다. 이미지 안의 각 객체를 구분하면서, 객체마다 픽셀 단위의 마스크를 예측하는 것이 핵심입니다. Mask R-CNN은 Faster R-CNN 구조를 기반으로, ROI 단위에서 Bounding Box + Class + Mask를 동시에 예측하는 대표적인 인스턴스 분할 모델입니다. 이번 글에서는 이전 글에서 구성한 COCO 인스턴스 분할 데이터셋을 바탕으로, PyTorch에서 Mask R-CNN 모델을 구성하고 실제 학습까지 연결하는 과정을 정리합니다.예: 사.. 2026. 1. 14.
[실전 예제/객체 탐지/PyTorch] DOTA 객체 검출 모델 구성과 학습 DOTA 기반 객체 검출(Object Detection)이란? 객체 검출(Object Detection)은 이미지 내에서 객체의 위치와 클래스를 동시에 예측하는 컴퓨터 비전 태스크입니다. DOTA(Dataset for Object Detection in Aerial Images)는 항공·위성 이미지 환경에서의 객체 검출을 목적으로 만들어진 대표적인 데이터셋으로, 일반적인 자연 이미지와 달리 작은 객체, 복잡한 배경, 고해상도 이미지라는 특징을 가집니다. 특히 DOTA는 차량, 선박, 건물, 비행기 등 다양한 객체가 매우 작은 크기로 분포되어 있어 단순한 COCO 기반 학습 방식으로는 성능이 잘 나오지 않는 경우가 많습니다. 이번 글에서는 이전 글에서 구성한 DOTA 데이터셋을 기반으로, PyTo.. 2026. 1. 14.
[실전 예제/변화 탐지/PyTorch] Siamese 기반 변화 탐지 모델 구성과 학습 Siamese 기반 변화 탐지(Change Detection)이란? 변화 탐지(Change Detection)는 두 시점(A/B)의 이미지를 비교해 변화가 발생한 영역을 픽셀 단위로 분할(Segmentation)하는 컴퓨터 비전 태스크입니다. 단순히 “다르다/같다”를 판별하는 것이 아니라, 어디가 얼마나 변했는지를 마스크 형태로 예측하는 것이 핵심입니다. Siamese 기반 모델은 두 입력 이미지(A/B)를 같은 가중치(shared weights)를 가진 인코더로 각각 특징을 추출한 뒤, 특징 차이/결합을 통해 변화 영역을 복원합니다. 이번 글에서는 LEVIR 데이터셋을 기준으로 Siamese 구조 모델을 구성하고 학습하는 방법을 PyTorch로 정리합니다.예: 건물 신축/철거, 도로 확장 등 변화.. 2026. 1. 14.
[실전 예제/객체 추적/PyTorch] Re-ID 기반 객체 추적 모델 구성과 학습 Re-ID 기반 객체 추적(Object Tracking)이란? 객체 추적에서 가장 어려운 문제는 객체가 잠시 가려지거나 화면에서 사라졌다가 다시 등장했을 때도 동일한 ID를 유지하는 것입니다. 이를 위해 대부분의 현대적인 객체 추적 시스템은 Re-ID(Re-Identification) 모델을 사용합니다. Re-ID는 객체의 외형 정보를 임베딩 벡터로 변환하고, 시간적으로 떨어진 프레임 간에도 같은 객체인지 판단할 수 있도록 도와줍니다. 이번 글에서는 이전 글에서 생성한 MOT crop 데이터셋을 기반으로 Re-ID 임베딩 모델을 구성하고 학습하는 방법을 살펴봅니다.예: 사람이 가려졌다가 다시 등장했을 때 같은 ID로 복원예: 다른 사람과 교차한 이후에도 ID 스위치 방지 목표 MOT crop + .. 2026. 1. 14.
[PyTorch] 개요 및 설치 가이드 소개 PyTorch는 메타(Facebook)에서 개발한 오픈소스 딥러닝 라이브러리로, 직관적이며 유연한 텐서 연산과 GPU 가속, 자동 미분을 지원하여 빠른 프로토타이핑 및 연구 개발에 널리 사용됩니다. 설치 방법# 기본 설치 (CPU 전용)pip install torch torchvision torchaudio# GPU 지원 설치 (CUDA 12.1 예시)pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 설치 확인import torchprint(torch.__version__, torch.cuda.is_available()) 관련 내용 PyTorch 공식 홈페이지 PyTorch 자주 .. 2025. 5. 28.
[OpenCV] 개요 및 설치 가이드 소개 OpenCV(Open Source Computer Vision Library)는 영상 및 이미지 처리를 위한 오픈소스 라이브러리로, 얼굴인식, 객체 탐지, 이미지 변형 등 다양한 컴퓨터 비전 작업을 빠르게 수행할 수 있습니다. 설치 방법pip install opencv-python# 추가 모듈 (필요시)pip install opencv-contrib-python 설치 확인import cv2print(cv2.__version__) 관련 내용 OpenCV 공식 문서 OpenCV 자주 쓰이는 함수 모음 [OpenCV] 함수 목차1. 이미지 처리 기본 함수cv2.imread(): 이미지를 읽어옵니다.cv2.imshow(): 이미지를 화면에 표시합니다.cv2.imwrite(): 이미지를 저장합니다.cv.. 2025. 5. 28.
반응형