전체 글
CH02. Single View Metrology (1)
Introduction 지난 강에서 3D world를 digital image로 transform하는 camera matrix에 대해서 알아보았다. 그렇다면, 역으로 3D world의 구조를 하나의 이미지만을 가지고 추정할 수 있을까? Transformations in 2D Isometric transformation 거리를 보존하는 transformation이다. 가장 basic한 형태로, rotation $R$ 과 translation $t$ 로 표현된다. 3의 자유도를 가지며, 수학적으로 정의하면, $$ \begin{bmatrix}x^\prime \\ y^\prime \\ 1\end{bmatrix}=\begin{bmatrix}R & t \\ 0 & 1\end{bmatrix}\begin{bmatrix..
벡터공간 (2)
Change of Basis $\mathbf{R}^2$ 에서, 어떠한 vector $\text{x}=(x_1,x_2)$도 표준기저 $\{\text{e}_1,\text{e}_2\}$의 linear combination으로 표현가능하다. 이 때, scalar $x_1,x_2$를 표준기저 $\text{e}_1, \text{e}_2$에 대한 coordinates, 즉 좌표라고 부른다. 더 나아가서, 또 다른 새로운 basis인 $\{\text{y},\text{z}\}$가 있을 때, $\text{x}$는 $\text{x}=a\text{y}+b\text{z}$ 로 unique하게 표현된다. $\text{y}=y_1\text{e}_1+y_2\text{e}_2$ 이고 $\text{z}=z_1\text{e}_1+z_2\..
SSD: Single Shot MultiBox Detector 리뷰
Wei Liu 외 5 명의 저자가 쓴 논문으로, ECCV 2016에 accept된 논문이다. SSD는 2-stage detector인 Faster R-CNN과 1-stage detector인 YOLOv1의 단점은 보완하고, 장점은 가져와 정확도와 속도에서 큰 성공을 거둔 모델이다. 논문에서는 비교적 rough하게 설명이 되어있어 이해하는데 꽤나 어려움을 겪었는데, 하나하나 디테일하게 뜯어보면서 확실히 이해를 해보자. Introduction Faster R-CNN과 같이 bounding box를 예측한 후에 classify를 적용하는 2-stage detector는 비교적 정확하나(73.2mAP) 느림(7FPS) YOLOv1과 같은 1-stage detector는 빠르지만(45FPS) 정확도가 낮음 이 논..
벡터공간 (1)
Vector Space $V$가 addition과 scalar multiplication이 정의된 집합이라고 할 때, 1. Addition 두 개의 $V$에 속한 element $\text{u},\text{v}$의 합, 즉 $\text{u}+\text{v}$ 2. Scalar multiplication Scalar인 $c$와 $V$의 element $\text{u}$ 로 이루어진 rule로써, $c\text{u}$로 나타냄. 이와 같이, 두 operation이 정의되어 있고, 다음의 axiom들을 만족하면 Vector space라고 함. Null space Matrix에서 정의된 subspace이다. $m\times n$ matrix $A$ 의 null space는 $A\text{x}=0$을 만족하는 모..
CH01. Camera Models (4)
Handling Distortion in Camera Calibration 지금까지는 distortion이 없는 ideal lens를 다뤄왔다. 하지만 real lens는 rectilinear projection이 안되는 왜곡된 lens일 수도 있다. Lens가 물리적으로 symmetric 하기 때문에 distortion도 radially symmetric 한 편이다. 따라서 isotropic transformation으로 radial distortion을 모델링해보면, $$ QP_i=\begin{bmatrix}\frac{1}{\lambda} & 0 & 0 \\ 0 & \frac{1}{\lambda} & 0 \\ 0 & 0 & 1 \end{bmatrix}MP_i=\begin{bmatrix} u_i \\ ..
CH01. Camera Models (3)
Camera Calibration 앞에서 intrinsic, extrinsic parameter 를 알아야 정확한 transformation이 가능하다고 했다. 하지만 임의의 카메라를 처음 쓰게 되면, parameter들에 대한 정보가 없다. 하지만 그 카메라로 image를 촬영할 수는 있다. 따라서 해당 image를 이용해 extrinsic, intrinsic camera parameter들을 추정하는 것이 바로 camera calibration이다. 위의 사진은 calibration rig 를 보여준다. 이 rig는 보통 그림처럼 차원을 가진 simple한 패턴으로 구성되고, 더 나아가 rig는 world reference를 원점 $O_w$ 와 $i_w,j_w,k_w$ 로 정의한다. 이 때, worl..