머하웃(Mahout)
데이터 분석, 분류, 필터링을 위한 알고리즘은 무척 많은데, 머하웃은 이러한 알고리즘의 구현을 하둡 클러스터로 가져오기 위한 프로젝트다. K-Means, Dirichelet, 병렬 패턴, 베이즈 분류와 같은 표준 알고리즘의 상당수를 하둡 스타일의 맵/리듀스를 사용해서 데이터에 적용할 수 있다. 위 이미지는 점과 반경을 선택해서 점 집합을 덮는 캐노피 클러스터링 알고리즘의 결과를 보여준다. 이는 하둡에 구축된 다양한 데이터 분석 도구 중의 하나일 뿐이다. 머하웃은 아파치 프로젝트며 아파치 라이선스에 따라 배포(http://mahout.apache.org/)된다.