야후의 신규 검색 서비스에 대하여

 

야후! 코리아에서 클러스터링 검색을 론치 하였습니다. 야후는 검색의 컨텐츠 유형외에도 독특하게 통합검색허브어드벤쳐의 3가지 탭 구성이 다른 검색포탈 사이트와 차이점을 형성하고 있습니다.


 


1. 클러스터링 검색


 


먼저, 클러스터링이라는 것에 대한 개념이 이해하시는 것이 중요할 듯 합니다.


클러스터링은 데이터에 내재된 특성을 자동으로 추출하는 기법으로 기계학습의 무감독학 (unsupervised learning)에 해당한다. 클러스터링은 주어진 데이터를 의미 있는 집단(subgroup)들로 분류하며, 데이터 분석, 시각화, 압축 및 전처리와 관련된 많은 분야에서 널리 응용되고 있습니다.


 


이러한 클러스터링 기법은 검색에서도 활용할 수 있는데, 클러스터링이란 대용량의 문서 집합을 주제에 따라 분류하는 것으로 정보 추출을 위한 중요한 도구로 오래 전부터 다루어져왔으며, 문서 검색, 혹은 정보 검색에서 색인 후에 검색의 전처리(preprocessing) 단계에 많이 사용된다. 주어진 다량의 문서를 미리 분류해 두면 사용자의 특정 정보에 대한 검색 요구가 들어올 때 모든 문서를 검색하는 대신 사용자의 요구와 가장 가까운 주제의 클러스터 내의 문서만을 검색함으로써 탐색 시간을 절약할 수 있고 검색의 효율을 향상시킬 수 있는 효과가 있습니다.


 


최근, 문서 클러스터링은 웹 탐색 엔진의 중요한 도구로 사용되고 있으며, 탐색 및 문서목록 검색과 분산화된 추출에서 유용하게 적용되고 있다고 말씀드릴 수 있습니다.


 


이러한 클러스터링 검색은 이전에도 시도하고 있던 곳이 있었습니다. 첫눈이 클러스터링 기반의 검색을  오픈 하였었고, 해외 사이트에서는 클러스티 라는 유명한 사이트가 있었습니다. 야후 코리아에서 론치한 클러스터 검색은 다른 검색 사이트보다 깔끔한 U.I 와 정보 분류가 체계적으로 이루어진 것 같습니다. 제가 말씀드린 다른 사이트들과 비교하여 검색해보시는 것도 좋을 듯 합니다.


 



2. 타임존


 


타임존이란 서비스는 처음에는 어떤 것인가 고민하였는데, 클러스터링을 한 대량의 문서를 시간대의 이슈별로 제공하는 서비스입니다. 해당 서비스는 사용자가 시간대 별로 이슈가 되고 있는 정보를 플래시를 이용하여, 인터랙티브하게 정보 전달이 가능하게 됩니다.


 


사용자는 특정 키워드에 대한 이슈를 찾는 것이 아니라, 시간대별로 이슈화 되고 있는 정보를 타임 네비게이션을 따라 정보를 얻을 수 있습니다.


 





 


3. 스마트웹 검색


 


키워드를 입력하게 되면, 추천검색어를 자동완성 형태로 제공하고 있네요. 그리고, 추천키워드를 키보드로 이동시키면 해당 키워드의 검색결과를 페이지 로딩 없이 제공하네요. 해당 서비스는 Alltheweb Live search 에서 접했던 서비스입니다. All the web이 야후가 인수한 회사라면, 해당 서비스가 론치된 것은 당연한 결과일 것 같습니다.


 


한가지 아쉬운 점은 검색 키워드를 입력함에 따라서 검색결과가 변경되는 all the web 의 Live Search  에 비하여, 사용자 선택에 따라서만 결과가 변경되고 있는점입니다.


하지만 해당부문은 곧 업그레이드 될 것이라 생각합니다.


 


사용자는 키워드를 입력하여 Enter 키를 쳐야지만, 검색결과를 찾을 수 있는것이 아닌, 키워드를 입력하는 도중에도 편리한 정보를 제공받을 수 있을 것 같습니다.