가상 분산 모드란?
하둡은 기본적으로 분산 컴퓨팅 환경을 상정해서 만들어진 시스템입이다. 한대의 컴퓨터를 이용해서 저장/분석을 한다면 하둡을 사용할 이유가 없다. 가상 분산 모드란 마치 여러대의 컴퓨터를 이용하는 것처럼 한대의 컴퓨터에 하둡을 설치하는 방법이다. 학습/개발 단계에서 좋은 방법이다.
리눅스 설치
리눅스를 설치하는 방법은 생활코딩 리눅스 수업을 참조하면 된다. 이 중에 가상머신을 이용한 방법을 추천한다. 필자도 가상 머신에 설치 할 예정이다.
http://opentutorials.org/course/141/1003
하둡 다운로드
아래 URL로 접근해서 적당한 링크를 클릭하고 들어가보면 하둡의 버전별로 다운 받을 수 있다. 필자는 1.X 버전을 기준으로 수업을 진행 할 예정이기 때문에 1.0.4를 다운받겠다. 실습 단계에서는 가급적 필자와 같은 버전의 사용을 권한다.
http://www.apache.org/dyn/closer.cgi/hadoop/common/