일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- Detection Transformer
- RPN
- AP
- multi task loss
- Object Detection metric
- Object Detection
- pytorch
- Multi-task loss
- Average Precision
- Faster R-CNN
- herbwood
- RoI pooling
- YOLO
- Anchor box
- fine tune AlexNet
- Non maximum suppression
- Region proposal Network
- Map
- Darknet
- detr
- R-CNN
- object queries
- Linear SVM
- BiFPN
- Bounding box regressor
- IOU
- Hungarian algorithm
- Fast R-CNN
- hard negative mining
- mean Average Precision
- Today
- Total
목록Computer Vision (24)
약초의 숲으로 놀러오세요
이번에는 ECCV 2020년에 발표된 DETR 논문(End-to-End Object Detection with Transformers)을 읽고 리뷰해도록 하겠습니다. DETR은 Transformer 구조를 활용하여, end-to-end로 object detection을 수행하면서도 높은 성능을 보였습니다. 현재 많은 SOTA 모델들이 DETR을 기반으로 발전한만큼, 반드시 읽어야하는 기념비적인 논문이라고 할 수 있습니다. Research gap 본 논문에서는 object detection을 bounding box와 category라는 set $G = \{(B_0, C_0), (B_1, C_1), …, (B_n, C_n)\}$을 예측하는 task로 정의합니다. 이 때 기존의 object detection ..
이번에는 CVPR 2020년에 발표된 EfficientDet 논문(EfficientDet: Scalable and Efficient Object Detection)을 읽고 리뷰해보도록 하겠습니다. 당시 object detection 모델은 모두 속도와 정확도 사이의 트레이드오프(trade-off)가 존재했습니다. EfficientDet은 효과적으로 모델의 구조를 변형함으로써 속도와 정확도라는 두 마리 토끼를 모두 잡았으며, resource에 맞게 모델의 scale을 자유롭게 조정할 수 있는 높은 scalability를 보였습니다. Research gap 정확도가 높은 object detection 모델은 model size가 크며 computational cost가 높아 real-world applica..
이번 포스팅에서는 YOLO v4 논문(YOLOv4: Optimal Speed and Accuracy of Object Detection)을 읽고 리뷰해보도록 하겠습니다. 최근 등장한 가장 정확한 딥러닝 모델은 실시간으로 동작하지 않고, 학습 시 많은 수의 GPU와 mini-batch 크기가 매우 크다는 문제가 있습니다. 본 논문에서는 GPU에서 실시간으로 동작하면서, 기존에 사용하던 하나의 GPU만으로 매우 빠른 학습이 가능한 새로운 모델인 YOLO v4를 소개합니다. YOLO v4는 당시 최신 딥러닝 기법을 적극적으로 활용하여 모델을 설계하고, 학습시켜 정확도와 속도 측면에서 모두 성능을 크게 끌어올렸습니다. 본 논문에서는 성능을 높힐 수 있는 다양한 접근법과 그와 관련된 최신 연구를 소개한 후, 이를..
이번 포스팅에서는 M2Det 논문(M2Det: A Single-Shot Object Detector based on Multi-Level Feature PyramidNetwork)을 읽고 리뷰해보도록 하겠습니다. 본 논문에서는 multi-scale feature map 생성을 위해 주로 사용되던 Feature Pyramid Network(이하 FPN)의 두 가지 한계에 대해 지적합니다. FPN은 classification task를 위해 설계된 backbone network로부터 feature map을 추출하는데, 이를 통해 구성된 feature pyramid는 object detection task를 수행하기 위해 충분히 representative하지 않습니다. Feature pyramid의 각 lev..