전체 글

전체 글

    Edge detection

    Edge detection Edge detection이란 뭘까? Edge detection은 2D image를 curve의 set으로 변환하는 것이다. 즉, 해당 scene 또는 object의 가장 두드러지고 핵심적인 feature를 추출하는 것이라고 할 수 있다. 그렇다면 왜 edge를 사용하는 걸까? 왜냐하면 edge는 빛과 색깔에 비교적 robust하기 때문이다. 즉, 위와 같이 색깔이 다른 같은 모델의 자동차는 비슷한 edge feature를 가지고 있을 것이다. 따라서 edge는 recognition과 이미지의 patch들을 matching하는 데 유용하게 쓸 수 있다. 그렇다면 edge에 대해서 조금 고민해보자. Edge는 위의 그림과 같이 단순히 하나의 이유만으로 생기는 것이 아니다. 깊이가..

    Image filtering

    What is Image? A grid (matrix) of intensity values (보통 0이 black, 255 : white를 의미) 이 map을 intensity(강도) map이라고도 함 이 grid를 pixel이라고 함 이 pixel 하나하나가 intensity value를 가지고 있음 Images as functions 이미지는 discrete한 pixel수를 가지고 있다. - Pixel value grayscale/intensity [0, 255] color RGB는 [R, G, B] 즉 빨강 초록 파랑의 3 채널이고, 각각 [0, 255] per channel HSV [H, S, V]: Hue, saturation, value 로 나타낼 수도 있음 Image는 $R^2$에서 $R$ ..

    티스토리(tistory) 모바일에서 LaTex 수식 깨짐 해결

    수학 공부한 내용을 정리하거나, 논문 리뷰할 때 수식이 많이 나와 LaTex을 이용해서 블로그에 정리를 하곤 한다.그런데 pc버전은 아무 문제가 없는데, 모바일 버전에서는 아래와 같이 내가 쓴 LaTex수식이 변환이 안되고 그대로 나와서 문제를 해결해보고자 했다.먼저, 여러 블로그를 참고해보니 아래와 같은 솔루션을 제공했다.먼저, 서식 관리에 들어간다.서식 쓰기 누르고,제목은 대충 아무거나 짓고, 를 넣으면 된다.결과는 다음과 같다.그리고 완료를 누르게 되면, 아래처럼 서식이 생긴다.이제  변환을 원하는 페이지마다 들어가서 수정을 누르고,서식에 들어가서 작성한 서식을 눌러주면,이렇게 상단에 script가 두 개 생긴다.그리고 수정을 완료하면 된다.근데 여기서!! 모바일에서 다 업데이트가 될 ..

    CH04. Stereo Systems (2)

    Perspective structure from motion 앞서서는 간단한 affine한 경우를 알아봤고, 이제는 좀 더 일반적인 projective cameras 에 대해 알아본다. Projective cameras $M_i$는 11의 자유도를 가지고, up to scale로 다음과 같이 표현 가능하다. $$ M_i=\begin{bmatrix}a_{11}&a_{12}&a_{13}&b_1\\a_{21}&a_{22}&a_{23}&b_2\\a_{31}&a_{32}&a_{33}&1\end{bmatrix} $$ Affine 의 경우에는 affine transformation을 structure 행렬, motion에 해줬던 것처럼, 이 경우에는 projective transformation을 struture, ..

    CH04. Stereo Systems (1)

    지난 번까지는 여러 추가적인 viewpoints 들이 얼마나 해당 scene에 대한 정보를 많이 줄 수 있는지에 대해서 알아봤었다. Epipolar geometry는 3D scene에 대한 정보 없이 한 image plane의 점들을 다른 image plane으로 대응했었다면, 이번 강에서는 여러 2D images를 이용해서 3D scene을 recover 하는 법에 대해 알아본다. Triangulation Triangulation은 multiview geometry에서 가장 fundamental한 문제 중 하나다. Triangulation은 3D point가 projection된 두 개 이상의 images를 이용해서 해당 3D point의 위치를 결정하는 작업이다. 만약 두 개의 view를 이용한 tr..

    CH03. Epipolar Geometry (2)

    The Fundamental Matrix 앞선 강의에서 봤던 Essential matrix 같은 경우는 카메라가 canonical 한 경우($K=I)$에만 해당되므로 canonical한 카메라가 아닌 general한 경우에 대해서도 생각해볼 필요가 있다. 먼저 projection matrix는 다음과 같았다. $$ M=K\begin{bmatrix}I&0\end{bmatrix}\quad\quad M^\prime=K^\prime\begin{bmatrix}R_{wc^\prime}^{T}&-R_{wc^\prime}^{T}T_{wc^\prime}\end{bmatrix} $$ 만약 카메라가 canonical하다면, 각각의 image plane으로의 $P$의 projection은 $p_c=K^{-1}p$ 와 $p_c..