캐스케이딩
캐스케이딩(Cascading)은 하둡용 오픈소스 소프트웨어 추상화 계층(abstraction layer)으로, 사용자들이 JVM 기반 언어를 활용해 하둡 클러스터에서 데이터 프로세싱 워크플로(data processing workflow)를 제작, 실행할 수 있도록 지원한다. 캐스케이딩의 장점은 맵리듀스 작업 근간의 복잡성을 숨겨준다는데 있다. 캐스케이딩의 개발자 크리스 웬슬은 이를 맵리듀스의 대안 API라 소개한다. 이는 광고 타겟팅(ad targeting)이나 로그 파일(log file) 분석, 생물정보학, 기기 학습, 예측적 애널리틱스, 웹 컨텐츠 마이닝(Web contents mining), ETL 애플리케이션 등에 주로 사용된다. 캐스케이딩의 상용 버전은 캐스케이딩의 개발자 웬슬이 설립한 컨커런트(Concurrent)이 지원하고 있다. 캐스케이딩을 도입한 기업들로는 트위터, 엣시(Etsy) 등이 있다. 캐스케이딩은 GNU 제너럴 퍼블릭 라이선스로 이용 가능하다.