태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.


'유사성'에 해당되는 글 1건

  1. 2009/04/04 이미지의 특성과 비주얼 검색
2009/04/04 02:01

이미지의 특성과 비주얼 검색

이 포스팅은 일전에 올렸던 "비주얼 검색이란?"의 2편이라고 볼 수 있습니다. 이 글에서는 이미지가 갖는 특성을 살펴봄으로써 비주얼 검색이란 무엇이고 기존의 텍스트 검색을 통한 이미지 검색과는 어떤 차이가 있는지를 살펴보도록 하겠습니다. 

이미지는 사람의 시각을 통해서 전달 될 때, 이미지가 갖는 함축적인 정보를 동시에 전달합니다. 가령 아래 그림을 보고서 사람은 "음~ 인류 최초의 달착륙 사진이군? 저 사람이 암스트롱이었던가?" 이런 식으로 인식하는 반면 컴퓨터 입장에서는 "이게 뭥미?" 라고 할 수도 있습니다. ^^;


이미지는 텍스트와 달리 아무런 의미론적인 정보가 없으며, 순서도 없으며, 특정한 분류체계를 만들기도 어려우므로 컴퓨터의 입장에서는 텍스트에 비해 처리가 훨씬 어렵습니다. 다만 하나의 이미지를 기준 이미지(reference image)로 삼고서 다른 이미지들과 유사성을 비교할 수 있으며, 이러한 방법이 컴퓨터의 입장에서 이미지를 처리하는 주요한 방법이 될 수 있습니다. 통상 이미지를 표현하는 방법은 다음과 같은 두가지 방법이 있습니다. 

  • 주석(Annotation) : 이미지를 텍스트로 설명하는 방법입니다. 이는 우리가 통상적으로 쓰는 방법으로 이미지에 제목이나 설명, 태그 등을 달아서 이미지를 표현합니다.
  • 유사성(Similarity) : 이미지 A와 이미지 B의 속성(색상, 모양, 패턴 등)을 추출하여, 이미지간의 유사성으로 이미지를 표현하는 방법입니다. 
주석(annotation)을 다는 것이 사람을 통한 매뉴얼한 방법이라면, 유사성을 찾는 것은 이미지가 갖는 다양한 속성을 비교하여야 하므로 컴퓨팅 파워를 이용하여야 하며 다시 말하면 자동화된 방법이라 할 수 있습니다.  

새끼양과 어미양 VS. 최초의 복제양 돌리 (?)

주석(Annotation)은 위와 같은 이미지를 적합하게 설명할 수 있는 텍스트(메타데이터)를 수작업을 통해서 부여하는 것입니다. 위 사진의 경우 최초의 복제양 돌리와 관련된 내용이면 제목이 "복제양 돌리"겠지만, 유아동 동화책에 나오는 사진이라면 "새끼양과 어미양" 정도가 맞는 제목이 되겠습니다. 

반면 
유사성(Similarity)을 통해서 이미지를 설명하는 것은 아래와 같이 두 이미지 간의 색상이나 모양, 패턴을 비교하여 해석하는 것이고 컴퓨터를 이용한 자동화된 프로세스가 사용됩니다.  

이미지 A를 색상, 모양, 패턴 등을 통해 이미지 B로 해석



이미지를 표현하는 두가지 방법은 검색에도 영향을 미칩니다. 이미지에 주석(Annotation)을 달아 놓으면 쉽게 기존의 텍스트 검색을 통해서 찾으면 됩니다. 반면 이미지 A는 이미지 B와 유사하다라고 해석하는 방법이 바로 비주얼 검색에 적합한 방법입니다. 즉, 주석(Annotation)을 다는 수작업이 없이도 컴퓨터를 통해서 찾고자 하는 이미지와 유사한 이미지들을 찾을 수 있는 것입니다. 

이렇게 이미지를 설명하는 방법에 따라서 검색방법도 달라지게 되는데, 의미론적(semantic)인 접근방법과 시각적(visual)인 접근방법이 있습니다.

  • 의미론적인 접근방법(Semantic Approach) - Query By Keyword
    아래와 같이 이미지를 설명하는 제목, 설명, 태그 등을 텍스트 검색으로 찾는 방법이며, 이를 위해서는 수작업으로 이미지를 설명하는 주석(annotation)을 달아야 합니다.


  • 시각적인 접근방법(Visual Approach) - Query By Example
    이미지가 갖는 속성을 비교해서 유사한 이미지를 찾는 방법으로 주석(annotation)이 필요 없습니다.


의미론적인 접근방법이 텍스트 검색을 통해서 이미지를 찾는 방법이라면, 시각적인 접근방법은 비주얼 검색을 통해서 이미지를 찾는 방법입니다. 그런데 이 두가지 방법은 서로 배타적인 방법이 아닌 상호 보완적일 때 더욱 효과적입니다. 이렇게 두가지 검색 방법을 서로 보완적으로 적용하는 검색 방법을 "교차검색(Cross-modal Search)" 이라고 합니다.

  • 교차검색 - 1단계 텍스트 검색
    키워드 검색에 "야구"라는 키워드를 입력하고 검색을 수행하면 "야구"라는 단어를 메타데이터에 포함한 다양한 이미지가 검색되어 나옵니다.
 
  • 교차검색 - 2단계 비주얼 검색
    위의 키워드 검색 결과 중에서 찾고자 하는 이미지(파란 점선)를 클릭하면, 찾고자 하는 이미지와 색상, 모양, 패턴이 비슷한 이미지를 비교하여 그 결과를 보여줍니다. 
     


이렇게 이미지 검색과 관련한 특징과 방법을 장황하게 설명한 이유는 비주얼 검색 자체가 이미지가 갖는 특성을 이해하는 과정의 산물이며, 또한 이러한 특성에 맞게 적용하여야 하기 때문입니다. 디지털 카메라의 보급과 인터넷이라는 매체의 만남을 통해 디지털 이미지는 폭발적으로 증가하고 있지만, 여러가지 이유로 아직은 비주얼 검색이 아닌 텍스트 검색에 의존한 이미지 검색이 대부분입니다. 네이트에서 이번에 새로운 이미지 검색을 선보였습니다만, 이미지의 일부 속성인 "색상"만을 이용한 것으로 본격적인 비주얼 검색이라고 하기엔 미흡하다 할 수 있습니다.  


네이트에서 새로 선보인 컬러 검색


아직까지는 제약사항이 많은 비주얼 검색을 적용하려면 텍스트 검색으로는 어렵지만 비주얼 검색으로는 쉬운 분야를 찾아야 합니다. 즉, 텍스트 검색을 수행하기 위해서 필요한 주석(annotation)을 달기가 어렵고, 이미지간 유사성을 비교했을 때 그 효과가 돋보이는 분야을 찾아야 할 것 입니다. 


Trackback 0 Comment 0