일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- Object Detection metric
- multi task loss
- Linear SVM
- herbwood
- RoI pooling
- Non maximum suppression
- BiFPN
- AP
- Map
- hard negative mining
- Multi-task loss
- Hungarian algorithm
- Detection Transformer
- detr
- fine tune AlexNet
- pytorch
- YOLO
- Object Detection
- Bounding box regressor
- Average Precision
- Fast R-CNN
- IOU
- Region proposal Network
- object queries
- mean Average Precision
- RPN
- Anchor box
- R-CNN
- Darknet
- Faster R-CNN
- Today
- Total
목록Computer Vision (24)
약초의 숲으로 놀러오세요
이번 포스팅에서는 RefineDet(Single-Shot Refinement Neural Network for Object Detection) 논문을 읽고 리뷰해도록 하겠습니다. 논문에서는 two-stage detector의 3가지 특징을 설명합니다. 첫 번째로, two-stage 구조와 더불어 sampling heuristic을 사용하여 class imbalance 문제가 one-stage detector에 비해 상대적으로 덜 심각합니다. 두 번째로, 예측된 box의 파라미터를 최적화하기 위해 two-stage cascade를 사용한다는 점입니다. 마지막으로, 객체를 표현하기 위해 two-stage feature를 사용합니다. 두 번째, 세 번째 특징을 통해 객체에 대한 보다 정교한 예측이 가능해집니다..
이번 포스팅에서는 YOLO v3논문(YOLOv3: An Incremental Improvement)을 읽고 리뷰해보도록 하겠습니다. YOLO v3는 당시 유행하던 새로운 기법들을 도입하여 성능을 향상시켰습니다. YOLO v2 논문과 비슷하게 새로 도입한 아이디어를 중심으로 설명합니다. Main Ideas Bounding box Prediction $$b_* = \sigma(t_*) + c_x \\ \sigma(t_*) = b_* - c_* \\ t_* = log(b_* - c_*)$$ YOLO v2는 bounding box를 예측할 때 $t_x, t_y, t_w, t_h$를 구한 후 위의 그림과 $b_x, b_y, b_w, b_h$로 변형한 후 L2 loss를 통해 학습시켰습니다. 여기서 $c_x, c_..
이번 포스팅에서는 Mask R-CNN 논문(Mask R-CNN)을 읽고 리뷰해보도록 하겠습니다. Mask R-CNN은 일반적으로detection task보다는 instance segmentation task에서 주로 사용됩니다. Segmentation 논문을 읽어본 경험이 없었지만 Faster R-CNN에 기반한 모델이기 때문에 이해하기 용이했던 것 같습니다. 논문 리뷰에 앞서 Instance segmentation에 대해 가볍게 짚고 넘어가도록 하겠습니다. Instance segentation은 이미지 내에 존재하는 모든 객체를 탐지하는 동시에 각각의 경우(instance)를 정확하게 픽셀 단위로 분류하는 task입니다. Semantic segmentation이 동일하게 분류된 카테고리의 instanc..
이번 포스팅에서는 RetinaNet 논문(Focal Loss for Dense Object Detection)을 리뷰해도록 하겠습니다. Object detection 모델은 이미지 내의 객체의 영역을 추정하고 IoU threshold에 따라 positive/negative sample로 구분한 후, 이를 활용하여 학습합니다. 하지만 일반적으로 이미지 내 객체의 수가 적기 때문에 positive sample(객체 영역)은 negative sample(배경 영역)에 비해 매우 적습니다. 이로 인해 positive/negative sample 사이에 큰 차이가 생겨 class imbalance 문제가 발생합니다. class imbalance는 학습 시 두 가지 문제를 야기합니다. 첫 번째로 대부분의 sampl..