2014.05.23

검색엔진 최적화의 10가지 기술적 문제와 수정 방법

James A martin | CIO

'펭귄(Penguin)', '팬더(Panda,)', '허밍버드(Hummingbird)' 기타 대규모 구글 알고리즘 업데이트 시점에서, 검색엔진 최적화(search engine optimization, SEO)의 목적은 링크를 따내는 고품질 콘텐츠를 펴내는 것에 달려있다.

하지만 아무리 콘텐츠 품질이 높다고 해도 자신의 사이트에 구조적 문제나 기타 기술적 문제가 있을 경우 검색 순위에 도움이 되지 않는다.

검색엔진 최적화 커뮤니티에서 오늘날 사이트 검색 순위에 악영향을 미치는 가장 흔한 기술적 문제에 대해 물었다.

중복 콘텐츠 등 이들 기술적 어려움들의 상당수는 이미 오래전부터 있어왔던 문제다. 하지만 검색엔진 최적화 게임이 성숙해가고 진화할수록 사이트의 복잡성을 줄이는 것이 그 어느 때보다도 더 중요해졌다.

결국 성공적인 검색엔진 최적화의 1/3는 페이지 최적화, 1/3은 페이지 이외의 최적화(백링크 등), 그리고 나머지 1/3은 기술적 문제로부터 자유로운 깔끔한 웹사이트 구조에 달려있다고 그린랜스 서치 마케팅(Greenlance Search Marketing)의 사장 빌 세발드(Bill Sebald)는 말한다.

30명에 가까운 전문가들이 선정한 2014년 검색엔진 최적화의 가장 큰 기술적 문제 10가지와 이에 대한 해결책을 살펴보자.

1. 중복 콘텐츠
거의 대부분의 검색엔진 최적화 전문가들은 중복 콘텐츠가 가장 심각한 기술적 문제라고 답했다. 간단히 말해 사이트의 중복 콘텐츠는 같은 사이트 내에 있는 다른 콘텐츠와 "눈에 띄게 유사"하거나 완전히 똑같은 콘텐츠를 의미하는 것으로 구글 웹마스터 툴(Google Webmaster Tools)에는 나와있다.

SEMrush의 미국내 마케팅 이사 마이클 스트리커는 "구글의 크롤러는 막대한 영역을 커버해야 한다"고 말했다.

구글은 각각의 페이지의 변화 내역이나 새로운 자료를 찾기 위해 동일 페이지를 재반복해야 하는 상황 등에 특히 데이터를 소모할 상황이 안된다. 구글의 디스커버리나 웹 크롤링을 지연시키는 어떤 것도 웹에서는 환영받지 못한다.

즉석에서 데이터베이스로부터 웹페이지를 만드는 역동적으로 생성된 웹사이트는 검색엔진 최적화의 관점에서 볼 때 잘못 구성된 셈이다. 이런 사이트들은 기본적으로 같은 콘텐츠를 담은 수많은 페이지, URL들을 계속해서 만들어낼 수 있기 때문이다.

중복 콘텐츠의 다른 원인으로는 '보통' URL과 안전 프로토콜 URL(HTTP와 HTTPS)를 동시에 사용하기, www.domain.com과 domain.com에 대한 명시적 선호 지명 안하기, 블로그 태그, 연합된 RSS 피드 등이 있다.

또한 델리게이터닷컴(Delegator.com)의 웹 분석가 조니 유턴은 "중복 콘텐츠는 한도 분류 등을 포함한 흔한 CMS(content management system) 기능에 의해서도 발생할 수 있다"고 말했다.

스트리커는 "이런 중복 콘텐츠의 해결책은 사이트 내 중복을 꼼꼼히 찾아내고 '크롤 명령'을 적용해 구글측에 여러 URL들의 비교적 가치를 알려주는 것"이라고 설명했다.

구글의 봇이 자신의 웹 페이지를 어떻게 크롤하고 색인붙이는 지를 제어해주는 파일인 'robots.txt'을 활용해 구글에 특정 폴더와 디렉토리는 크롤할 필요가 없음을 말해주는 것이다.

또한 구글에 여러 URL 가운데 어느 URL을 인덱스 용도로 선호하는지 rel="canonical" 링크 요소를 적용함으로써 선호 URL을 지목하는 것도 좋은 방법이다.

벤슨 SEO(Benseon SEO) 창업자이자 회장인 스콧 벤슨은 "캐노니컬 태그는 검색엔진에 한 페이지가 다른 페이지의 중복임을 알리고, 구글 봇이 어떤 페이지를 대표 페이지로 고려해야 하는 지를 지명해주기 때문에 중복 콘텐츠 문제 해결에 도움이 된다"고 말했다.

머클(Merkle)의 디지털 전략 수석 부회장인 맷 내거는 "여러 언어로 된 콘텐츠로 여러 국가를 대상으로 하는 국제적 사이트 역시 수많은 중복 콘텐츠 문제를 겪을 수 있다"고 지적했다.

이런 상황에서 유사한 콘텐츠의 지역을 더욱 대상화된 언어로 식별하기 위해서 내거는 rel="alternate" hreflang 코드를 모든 페이지의 <head> 내에 사용을 추천한다. 정확한 언어와 기본적인 화폐 단위를 생성하기 위해 IP 감지 기능을 사용하는 것 역시 솔루션이 될 수 있다.




2014.05.23

검색엔진 최적화의 10가지 기술적 문제와 수정 방법

James A martin | CIO

'펭귄(Penguin)', '팬더(Panda,)', '허밍버드(Hummingbird)' 기타 대규모 구글 알고리즘 업데이트 시점에서, 검색엔진 최적화(search engine optimization, SEO)의 목적은 링크를 따내는 고품질 콘텐츠를 펴내는 것에 달려있다.

하지만 아무리 콘텐츠 품질이 높다고 해도 자신의 사이트에 구조적 문제나 기타 기술적 문제가 있을 경우 검색 순위에 도움이 되지 않는다.

검색엔진 최적화 커뮤니티에서 오늘날 사이트 검색 순위에 악영향을 미치는 가장 흔한 기술적 문제에 대해 물었다.

중복 콘텐츠 등 이들 기술적 어려움들의 상당수는 이미 오래전부터 있어왔던 문제다. 하지만 검색엔진 최적화 게임이 성숙해가고 진화할수록 사이트의 복잡성을 줄이는 것이 그 어느 때보다도 더 중요해졌다.

결국 성공적인 검색엔진 최적화의 1/3는 페이지 최적화, 1/3은 페이지 이외의 최적화(백링크 등), 그리고 나머지 1/3은 기술적 문제로부터 자유로운 깔끔한 웹사이트 구조에 달려있다고 그린랜스 서치 마케팅(Greenlance Search Marketing)의 사장 빌 세발드(Bill Sebald)는 말한다.

30명에 가까운 전문가들이 선정한 2014년 검색엔진 최적화의 가장 큰 기술적 문제 10가지와 이에 대한 해결책을 살펴보자.

1. 중복 콘텐츠
거의 대부분의 검색엔진 최적화 전문가들은 중복 콘텐츠가 가장 심각한 기술적 문제라고 답했다. 간단히 말해 사이트의 중복 콘텐츠는 같은 사이트 내에 있는 다른 콘텐츠와 "눈에 띄게 유사"하거나 완전히 똑같은 콘텐츠를 의미하는 것으로 구글 웹마스터 툴(Google Webmaster Tools)에는 나와있다.

SEMrush의 미국내 마케팅 이사 마이클 스트리커는 "구글의 크롤러는 막대한 영역을 커버해야 한다"고 말했다.

구글은 각각의 페이지의 변화 내역이나 새로운 자료를 찾기 위해 동일 페이지를 재반복해야 하는 상황 등에 특히 데이터를 소모할 상황이 안된다. 구글의 디스커버리나 웹 크롤링을 지연시키는 어떤 것도 웹에서는 환영받지 못한다.

즉석에서 데이터베이스로부터 웹페이지를 만드는 역동적으로 생성된 웹사이트는 검색엔진 최적화의 관점에서 볼 때 잘못 구성된 셈이다. 이런 사이트들은 기본적으로 같은 콘텐츠를 담은 수많은 페이지, URL들을 계속해서 만들어낼 수 있기 때문이다.

중복 콘텐츠의 다른 원인으로는 '보통' URL과 안전 프로토콜 URL(HTTP와 HTTPS)를 동시에 사용하기, www.domain.com과 domain.com에 대한 명시적 선호 지명 안하기, 블로그 태그, 연합된 RSS 피드 등이 있다.

또한 델리게이터닷컴(Delegator.com)의 웹 분석가 조니 유턴은 "중복 콘텐츠는 한도 분류 등을 포함한 흔한 CMS(content management system) 기능에 의해서도 발생할 수 있다"고 말했다.

스트리커는 "이런 중복 콘텐츠의 해결책은 사이트 내 중복을 꼼꼼히 찾아내고 '크롤 명령'을 적용해 구글측에 여러 URL들의 비교적 가치를 알려주는 것"이라고 설명했다.

구글의 봇이 자신의 웹 페이지를 어떻게 크롤하고 색인붙이는 지를 제어해주는 파일인 'robots.txt'을 활용해 구글에 특정 폴더와 디렉토리는 크롤할 필요가 없음을 말해주는 것이다.

또한 구글에 여러 URL 가운데 어느 URL을 인덱스 용도로 선호하는지 rel="canonical" 링크 요소를 적용함으로써 선호 URL을 지목하는 것도 좋은 방법이다.

벤슨 SEO(Benseon SEO) 창업자이자 회장인 스콧 벤슨은 "캐노니컬 태그는 검색엔진에 한 페이지가 다른 페이지의 중복임을 알리고, 구글 봇이 어떤 페이지를 대표 페이지로 고려해야 하는 지를 지명해주기 때문에 중복 콘텐츠 문제 해결에 도움이 된다"고 말했다.

머클(Merkle)의 디지털 전략 수석 부회장인 맷 내거는 "여러 언어로 된 콘텐츠로 여러 국가를 대상으로 하는 국제적 사이트 역시 수많은 중복 콘텐츠 문제를 겪을 수 있다"고 지적했다.

이런 상황에서 유사한 콘텐츠의 지역을 더욱 대상화된 언어로 식별하기 위해서 내거는 rel="alternate" hreflang 코드를 모든 페이지의 <head> 내에 사용을 추천한다. 정확한 언어와 기본적인 화폐 단위를 생성하기 위해 IP 감지 기능을 사용하는 것 역시 솔루션이 될 수 있다.


X