일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Anchor box
- AP
- detr
- mean Average Precision
- IOU
- Region proposal Network
- Faster R-CNN
- RoI pooling
- Bounding box regressor
- Average Precision
- hard negative mining
- Multi-task loss
- multi task loss
- herbwood
- Object Detection
- Map
- Fast R-CNN
- YOLO
- RPN
- Object Detection metric
- Darknet
- Non maximum suppression
- Hungarian algorithm
- Detection Transformer
- Linear SVM
- pytorch
- fine tune AlexNet
- BiFPN
- R-CNN
- object queries
- Today
- Total
목록Computer Vision (24)
약초의 숲으로 놀러오세요
이번 포스팅에서는 FPN 논문(Feature Pyramid Networks for Object Detection)을 리뷰해보도록 하겠습니다. 이미지 내 존재하는 다양한 크기의 객체를 인식하는 것은 Object dection task의 핵심적인 문제입니다. 모델이 크기에 상관없이 객체를 detect할 수 있도록 다양한 방법을 사용해왔습니다. 하지만 기존의 방식을 사용하면 모델의 추론 속도가 너무 느려지며, 메모리를 지나치게 많이 사용한다는 문제가 있습니다. 본 논문에서는 FPN(Feature Pyramid Network)을 통해 컴퓨팅 자원을 적게 차지하면서 다양한 크기의 객체를 인식하는 방법을 제시합니다. 기존 방식의 문제점과 더불어 FPN의 핵심 아이디어, 그리고 Faster R-CNN과 결합된 FPN..
이번 포스팅에서는 YOLO v2 논문(YOLO9000:Better, Faster, Stronger)을 읽고 리뷰해도록 하겠습니다. 입력 이미지의 크기가 300x300인 SSD300 모델은 detection 속도가 빠르지만 정확도가 낮으며, SSD512 모델은 정확도는 높지만 detection 속도가 느리다는 단점이 있습니다. YOLO v2 모델은 다양한 아이디어를 도입하여 정확도와 속도 사이의 trade-off의 균형을 잘 맞춰 좋은 성능을 보였습니다. 논문은 다음과 같이 3개의 3개의 파트로 구성되어 있습니다. Better : 정확도를 올리기 위한 방법 Faster : detection 속도를 향상시키기 위한 방법 Stronger : 더 많은 범위의 class를 예측하기 위한 방법 각 파트별로 논문의 ..
이번 포스팅에서는 R-FCN 논문(R-FCN: Object Detection via Region-based Fully Convolutional Networks) 을 읽고 리뷰해보도록 하겠습니다. 일반적으로 2-stage detector는 서로 다른 task를 수행하는 두 sub-network간에 주로 학습하는 속성에서 차이가 발생하는데 이를 translation invariance 딜레마라고 합니다. 이러한 문제를 해결하기 위해 ResNet 논문의 저자는 모델 설계 시 conv layer 사이에 RoI pooling을 삽입합니다. 하지만 이같은 방법을 사용할 경우 수많은 RoI를 개별적으로 conv, fc layer에 입력시켜야 합니다. R-FCN 논문의 저자는 이로 인해 학습, 추론 시 많은 시간이 소..
이번 포스팅에서는 SSD 논문(SSD: Single Shot MultiBox Detector)을 읽고 정리해봤습니다. RCNN 계열의 2-stage detector는 region proposals와 같은 다양한 view를 모델에 제공하여 높은 정확도를 보여주고 있습니다. 하지만 region proposals를 추출하고 이를 처리하는 과정에서 많은 시간이 걸려 detection 속도가 느리다는 단점이 있습니다. 반면 YOLO v1은 원본 이미지 전체를 통합된 네트워크로 처리하기 때문에 detection 속도가 매우 빠릅니다. 반면 grid cell별로 2개의 bounding box만을 선택하여 상대적으로 적은 view를 모델에 제공하여 정확도가 떨어집니다. 이처럼 일반적으로 정확도와 detection 속도..