본문 바로가기

디지털 마케팅

[검색광고마케터 1급 합격]통합 검색 노출 기준(1)

검색 결과의 랭킹을 결정하는 검색 모델(search model)


만약 수입 김치에서 대장균이 검출되었다는 뉴스가 화제인 상황이라면, 아래와 같이 김치 만드는 방법보다는 대장균 검출과 관련된 내용의 블로그 포스트가 검색 결과에 먼저 나오는 것 역시 검색 모델을 통해 검색 랭킹이 결정된 결과라고 할 수 있습니다.


C-RANK 알고리즘과 네이버 라이브 검색


검색 랭킹의 정확도를 높이기 위해 사용되는 기술 중 문서 자체보다는 해당 문서의 출처인 블로그의 신뢰도를 평가하는 알고리즘이 있는데 네이버 검색에서는 이를 'C-Rank'라고 부릅니다.


C-Rank 알로리즘에서 블로그 신뢰도를 평가할 때는 다음과 같은 요소를 종합적으로 계산하며 그 결과는 블로그 검색 랭킹에 일부 반영됩니다.

이처럼 C-Rank 알고리즘을 통해 해당 블로가 주제별 관심사의 집중도는 얼마나 되고(Context), 생산되는 정보의 품질은 얼마나 좋으며(Content), 생산된 콘텐츠는 어떤 연쇄반응을 보이며 소비/생산되는지(Chain)를 파악해 이를 바탕으로 해당 블로그가 얼마나 믿을 수 있고 인기 있는 블로그인지(Creator)를 계산합니다.

 

물론 C-Rank 알로리즘은 검색 결과 순서를 결정하는 네이버 블로그 검색 랭킹 알고리즘 중 출처와 관련된 부분을 계산하는 알고리즘이기에 검색 랭킹을 C-Rank로만 설명하기엔 무리가 있습니다. 왜냐하면 만약 검색 랭킹에 출처의 인기도만 반영한다면 C-Rank값이 높은 블로그의 글만 항상 검색 결과 상위에 노출되기 때문입니다. 그래서 그동안 C-Rank 알고리즘으로 계산된 값은 블로그 검색 결과에서 매우 제한적인 영향만 미치도록 활용되어 왔습니다.

 

그러나 오랜 기간 동안의 데이터 학습과 테스트, 시스템 튜닝을 통해 끊임없이 관련 알고리즘을 개선해 왔고, 2016년 '네이버 라이브 검색'에서 라이브 검색의 서비스 특징에 맞는 일부 요소를 추가해 비로소 'C-Rank' 라는 이름으로 외부에 공개하기에 이르렀습니다.

 

'네이버 라이브 검색'은 특정 주제의 검색어에 대해 공통의 관심사를 가진 이용자 간의 정보 네트워크를 찾아내고, 그 안에서 현재 가장 주목 받는 문서와 생산자(Creator)의 정보를 찾아 검색 이용자와 생산자 간의 활발한 소통을 특히 강조한 검색이라고 할 수 있습니다.

따라서 '네이버 라이브 검색'에서는 아이돌이나 게임, 여행, 방송 등 특정 주제에 대한 관심과 집중도가 높은 블로그의 포스트가 검색 결과에 더 잘 노출되도록 검색 랭킹에서 C-Rank 알고리즘의 결과를 높은 비중으로 반영하고 있습니다.


네이버 라이브 검색에 적용된 C-Rank와 블로그 검색에 적용된 C-Rank가 같다고 할 수는 없습니다.

라이브 검색에서는 관심사를 기반으로 주제에 따라 역동적인 검색 결과를 제공하기 위해 '좋아요'나 댓글 등의 피드백, 유사한 이용자의 네트워크 정보, 그리고 장소, 시간, 날씨 등 현재 상황에 따른 맥락을 고려하고 있는데 이러한 요소가 보통의 블로그 검색에서는 보편적으로 검색 이용자에게 만족을 준다고 할 수 없기 때문입니다. 

그러나 C-Rank 알고리즘의 기본이 되는 개념인 출처의 신뢰도와 인기도는 라이브 검색과는 또 다른 방식으로 블로그 검색 결과에 반영되고 있으며, 그 비중을 점차 늘려 가고 있습니다.

 

C-Rank 알로리즘에서 블로그의 신뢰도와 인기도를 측정하는 핵심은 해당 블로그가 특정한 주제, 즉 '특정 관심사에 대해서 얼마나 깊이가 있는 좋은 콘텐츠를 생산해 내는가'입니다.

 

이전 포스트에서도 의무적으로 포스팅되는 일상 글보다는 전문성을 살린 단 하니의 글이 블로그 검색 결과 노출에 더 도움 될 것입니다. 블로그 검색 결과에 C-Rank 알고리즘 반영 비율을 높일수록 더욱더 그러한 블로그와 그렇지 않은 블로그의 차이가 커집니다.


위 '산후다이어트'블로그 검색 결과 예시에서 보시는 것과 같이 C-Rank를 검색 랭킹 알고리즘에 반영했을 때와 반영하지 않았을 때의 검색 결과는 크게 차이가 납니다.

 

C-Rank 적용 전에는 별다른 차별성 없는 내용의 단순 병원 홍보 글이 상단에 나오는 것과 달리 C-Rank를 적용하면 피트니스센터나 출산상담센터 등 '산후 다이어트'를 검색한 이용자에게 보다 더 유익한 정보가 검색 결과 상단에 노출됩니다. 이러한 검색 결과가 나타나는 이유는 위 피트니스 블로그에서는 다이어트에 대한 전문적인 내용을 출산상담센터 블로그에서는 산모와 관련된 전문적인 내용을 지속적으로 포스팅했고 C-Rank에서 이러한 주제별 신뢰도와 인기도를 계산해 반영했기 때문입니다.

반응형