Offcanvas

분쟁|갈등 / 비즈니스|경제

글로벌 칼럼 | 검색엔진의 엄청난 거짓말

2011.02.15 Steven J. Vaughan-Nichols  |  Computerworld

만약 마이크로소프트가 우리 집 강아지였다면, 필자는 최근의 실수를 크게 꾸짖었을 것이다. 마이크로소프트는 자체적으로 인터넷을 검색하는 대신에, 구글의 검색 결과에 편승해왔던 것으로 드러났다. 이는 단순한 추측에 불과한 것이 아니다. 구글은 기발한 함정을 파놓았고, 마이크로소프트의 검색 엔지니어들은 그 함정에 빠져버렸다.

 

필자는 여기서 짧고도 흥미로운 이야기를 소개하려 한다. 하지만 그 전에, 그 사건은 검색 엔진이 제공하는 결과가 내재적으로 불완전하고 편향되기 쉽다는 것을 일반 대중들이 알고 있는지를 묻도록 만든다. 과연 검색 결과를 어느 정도까지 신뢰할 수 있는지, 모든 웹 사용자는 한 번쯤 고민해봐야 한다.

 

이제 구글-마이크로소프트의 논쟁으로 돌아가보자. 마이크로소프트의 검색엔진 빙(Bing)이 진짜로 구글의 결과를 베끼는지 보기 위해, 구글은 (‘hiybbprqag’ 따위의) 무의미한 검색어에 대해, 수작업으로 임의의 검색 결과를 입력했다. 그리고 시간이 지남에 따라, 빙에서도 이러한 무의미한 검색어들로 검색을 할 수 있게 됐다.

 

구글은 마이크로소프트가 인터넷 익스플로러와 빙 브라우저 툴바를 통해, 사용자의 어깨너머로 검색 결과를 훔치고 있다고 믿는다. 구글의 선임 연구원 아미트 싱할의 말을 빌려, 한마디로 말하자면, “실험 결과, 우리는 빙이 구글 웹 검색 결과를 베낀다고 결론 내렸다.”

 

빙의 책임자 스테판 와이츠는 “우리는 구글의 검색 결과를 베끼지 않는다. 우리는 검색 결과의 순위를 매기기 위해 다양한 신호와 접근방식을 사용한다. 가장 중요한 목표는, 검색의 의도를 더 잘 파악해내어, 주어진 검색어에 대해 가장 적절한 답을 내놓을 수 있도록 하는 것이다. 툴바 같은 부가 프로그램들은 (우리, 그리고 다른 검색엔진들이 사이트들의 순위를 매기기 위해 사용하는 많은 자료 중의 하나인) 클릭스트림(clickstream) 데이터로 이에 기여한다”라고 반박했다. 하지만 이를 다른 말로 풀자면, 결국 “우리는 구글 검색 결과를 보고 이를 사이트 순위에 적용했다”가 될 것이다.

 

이건 빌 클린턴식의 답변이다. 모든 것은 “베끼다”의 정의가 무엇이냐에 달려있다.

 

구글에 적대적인 몇몇 기자들은 마이크로소프트가 한 일에는 전혀 문제될만한 것이 없다고 주장한다. 컨슈머 와치독(Consumer Watchdog)의 인사이드 구글(Inside Google) 리서치 팀의 존 심슨은 “구글의 항의는 위선의 절정이라 볼 수 있다. 구글의 모든 비즈니스 모델은 일반적으로 별다른 허락을 구하지 않은 채 사용하고 있는, 다른 사람들의 컨텐츠가 그 기반이 된다”고 지적했다.

 

하지만 이런 지적에 대해서는 “멋진 검색엔진의 세계에 오신 것을 환영합니다”라고 답할 수밖에 없다. 심슨이 말하는 것은 세상의 모든 검색엔진이 하고 있는 것이다.

 

검색엔진이 검색을 잘 해내기 위해서는, 당연히 웹 그리고 웹 상의 무수한 컨텐츠에 자유롭게 접근할 수 있어야 한다. 이는 개인정보 보호 권리에 대해 논쟁하고 있는, 여기 미국에서 검색 엔진이 돌아가는 방식이다. 그렇다고 지불장벽(paywall) 없이 공개적인 웹사이트에 게재된 신문 기사가 검색이 되어야 한다는 것은 아니다.

 

인터넷 상의 “잊혀질 권리”가 점점 크게 대두되고 있는 유럽에서는 상황이 다르게 흘러가고 있다.

 

이는 단순히 여자들과 술을 퍼 마시고 있는 사진을 페이스북 페이지에서 삭제할 권리를 말하는 게 아니다. 웹 사이트 어딘가에 기록되어 있는, 사용자에 대한 모든 내용을 제거하고 그 어느 검색엔진도 한때나마 그런 내용이 있었다는 사실도 찾을 수 없도록 하는 것이다.

 

예를 들자면, 스페인은 한 재판에 참여하는 원고를 위해, 원고에게 부정적인 시각으로 쓰여진 뉴스 기사 혹은 인터넷 정보의 링크 90개를 공식 기록에서 제거해 달라고 구글에 요청했다. 여느 미국인과 마찬가지로, 필자도 이러한 생각이 잘 이해가 되지 않는다. 사람들이 공식적인 기록을 검색하는 것을 막는다? 놀라운 일이다.

 

물론, 이는 비단 유럽만의 일이 아니다. 중국은 일상적으로 인터넷 검색을 검열한다. 다른 국가들은 검색을 다른 방법으로 제한한다. 그리고 이집트는 최근에 사람들이 인터넷을 통해 정보를 공유하는 것을 막기 위해 가장 무식한 방법을 사용했다. 그것은 바로 아예 인터넷의 연결을 끊어버리는 것이었다.

 

마지막 것은 성공하지 못했지만, 나머지는 먹히고 있다.

 

실제로 얼마나 많은 사람들이 검색 결과에 대해 생각할까? 그렇다, 검색 엔진은 믿을 수 없을 만큼 편리하다. 필자는 매우 초기의 나사 리콘(NASA RECON), OCLC 그리고 다이얼로그(Dialog) 같은 제한된 형태의 검색엔진부터 사용해왔고, 그리고 앞으로도 사용을 그만둘 생각이 없다.

 

하지만 그 때나 지금이나, 필자가 찾은 검색 결과를 절대적으로 믿지는 않는다. 필자는 검색을 효율적으로 하는 방법뿐 아니라, 누가 사이트를 운영하고, 그들이 어디에 편향되어 있으며, 어떤 정보를 볼 수 있고 어떤 정보가 차단되었는지, 그리고 누가 사용자와 검색엔진 사이의 네트워크를 통제하고 있는지에 대해 생각했다.

 

진실은 저 너머에 있겠지만, 검색어 하나로 그것이 드러날 것이라고는 절대 생각지 말라. 그렇게는 되지 않는다.  editor@idg.co.kr

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.