본문 바로가기

디지털 마케팅

[검색광고마케터 1급 합격]통합 검색 노출 기준(2)

C-Rank에 반영되는 정보


과연 어떤 정보가 C-Rank 알고리즘에 반영되는 살펴보겠습니다.

현재 C-Rank가 참고하는 데이터는 다음과 같습니다. 물론 향후 알고리즘 개선 작업에 따라 변경될 수 있지만 네이버 검색에서 블로그 검색 랭킹을 결정하기 위해 어떤 방식과 기준으로 접근하고 있는지에 대한 참고가 될 수 있을 것 같습니다.


● BLOG Collection

- 블로그 문서의 제목 및 본문, 이미지, 링크 등 문서를 구성하는 기본 정보를 참고해 문서의 기본 품질을 계산합니다.

 

● 네이버 DB

- 인물, 영화 정보 등 네이버에서 보유한 콘텐츠 DB를 연동해 출처 및 문서의 신뢰도를 계산합니다.

 

● Search LOG

- 네이버 검색 이용자의 검색 로그 데이터를 이용해 문서 및 문서 출처의 인기도를 계산합니다.

 

● Chain Score

- 웹문서, 사이트, 뉴스 등 다른 출처에서의 관심 정도를 이용해 신뢰도와 인기도를 계산합니다.

 

● BLOG Activitiy

- 블로그 서비스에서의 활동 지표를 참고해 얼마나 활발한 활동이 있는 블로그인지를 계산합니다.

 

● BLOG Editor 주제 점수

- 딥러닝 기술을 이용해 문서의 주제를 분류하고, 그 주제에 얼마나 집중하고 있는지 계산합니다.


이처럼 기본적으로 블로그 검색에 사용하는 데이터뿐만 아니라 사이트나 인물 정보 등 다양한 데이터를 참고합니다. 이러한 데이터를 이용해서 어떤 블로그가 어떤 주제에 집중하고 있는지, 얼마나 검색 이용자에게 인기 있는 블로그인지 계산하고 있습니다. 특히 블로그 전체에서 생산된 문서의 주제 분포로 특정에 대한 집중도가 어느 정도 되는지를 계산하기 때문에, C-Rank의 반영 비중이 높아질수록 다양한 일상 주제에 대한 포스트보다는 특정 주제에 대한 자신만의 포스트가 늘어날수록 검색 결과에서는 더 잘 노출될 수 있습니다.

 

이러한 C-Rank 알고리즘은 특정 분야에 집중애서 전문적인 내용을 포스팅하는 블로그가 그렇지 않은 블로그에 비해 검색 이용자들로부터 선호된다는 통계에 근거하고 있습니다.

 

과거의 검색 랭킹 알고리즘이 질의에 대한 유사도와 문서의 품질, 사용자 반응으로 구성된 것과 달리, 주제별로 품질을 계산하고 출처의 신뢰도와 인기도를 검색 랭킹에 적절히 반영했을 때 검색 이용자의 검색 만족도가 높아진다는 가설과 실험 결과를 바탕으로 좋은 문서를 추정하고 있으며 그 정확도를 높이기 위해 검색 랭킹 알고리즘을 계속 개선해 나가고 있습니다.


그런데 C-Rank 알고리즘에도 명확한 한계가 있습니다. C-Rank 알고리즘을 통해 계산된 결과가 검색 랭킹에 많이 반영되면 될수록 문서 자체의 품질보다는 출처의 품질에 따른 결과가 검색 결과에서 강조될 가능성이 있다는 것입니다.

 

물론 좋은 블로그에서 좋은 문서를 포스팅할 확률은 그렇지 않은 블로그보다 높다고 할 수 있겠으나 좋은 블로그라고 항상 좋은 글만, 나쁜 블로그라고 항상 나쁜 글만 생산하는 것은 아니기 때문입니다.

그렇기 때문에 C-Rank 알고리즘을 확대해 반영할수록 지난 포스트에서 설명드린 속칭 '최적화 블로그'나 '저품질 블로그'라고 이야기되는 것과 유사한 현상이 나타날 수 밖에 없고, 이러한 현상이 많은 블로거가 쉽게 해결할 수 없는 고충으로 작용하기에 C-Rank알고리즘 역시 많은 개선과 테스트를 진행하고 있습니다.


그러나 남들과 다른 나만의 차별적인 콘텐츠가 검색 결과에 잘 노출될 수 있도록 하는 네이버 블로그 검색의 방향성은 앞으로도 쉽게 바뀌지 않을 것이며, C-Rank 등 검색 알고리즘을 지속적으로 개선하여 검색 결과의 품질을 높여 나갈 예정입니다. 

 

어떤 블로그가 좋은 블로그이고 어떤 블로그가 나쁜 블로그인지 시스템이 사람처럼 절대적인 기준을 갖고 평가할 수는 없습니다. 그렇기 때문에 결국 좋은 문서라고 여겨지는 문서를 모아 놓고 그 문서의 공통된 특징을 패턴화 하여 이러한 패턴이 많이 관찰되는 문서를 좋은 문서로 판별하고 있습니다.

 

결국 블로그 검색 랭킹은 이러한 좋은 패턴과 나쁜 패턴이 얼마나 많이 탐지되는지에 따라 결정된다고 할 수 있는데, 그렇기 때문에 단기간에 검색 결과에 잘 나오는 블로그로 만드는 것은 어려울 수 있습니다. 그러나 그렇다고 아무리 노력해도 검색 결과에서는 항상 뒤처지는 블로그로만 남는 것은 아닙니다.

반응형