Hadoop

본 토픽은 현재 준비중입니다. 공동공부에 참여하시면 완성 되었을 때 알려드립니다.

설치 - 리눅스에 가상 분산모드로 설치

가상 분산 모드란?

하둡은 기본적으로 분산 컴퓨팅 환경을 상정해서 만들어진 시스템입이다. 한대의 컴퓨터를 이용해서 저장/분석을 한다면 하둡을 사용할 이유가 없다. 가상 분산 모드란 마치 여러대의 컴퓨터를 이용하는 것처럼  한대의 컴퓨터에 하둡을 설치하는 방법이다. 학습/개발 단계에서 좋은 방법이다. 

리눅스 설치

리눅스를 설치하는 방법은 생활코딩 리눅스 수업을 참조하면 된다. 이 중에 가상머신을 이용한 방법을 추천한다. 필자도 가상 머신에 설치 할 예정이다. 

http://opentutorials.org/course/141/1003

하둡 다운로드

아래 URL로 접근해서 적당한 링크를 클릭하고 들어가보면 하둡의 버전별로 다운 받을 수 있다. 필자는 1.X 버전을 기준으로 수업을 진행 할 예정이기 때문에 1.0.4를 다운받겠다. 실습 단계에서는 가급적 필자와 같은 버전의 사용을 권한다.  

http://www.apache.org/dyn/closer.cgi/hadoop/common/

 

댓글

댓글 본문
  1. koz vell
    유튜브에서 이것이 리눅스다라는 강의 보시면 가상운영체제를 여러개 설치하고 운영하는 방식을 배울 수 있습니다.
    대화보기
    • draco7
      올리신 하둡 강의 잘 보았습니다. 막연하던 개념이 조금 이해하는 듯 합니다. 하둡을 학습하기 위한 환경으로 꼭 여러대의 컴퓨터가 필요한지 문의드립니다. 학습 차원에서 빠른 결과보다는 사용법 익히는게 우선이라 조금 느려도 실제와 같은 결과를 얻을 수 있으면 괞찬다고 생각하는 초보자 생각입니다. 혹 한 대의 컴퓨터안에서 네임노드와 데이터 노드를 구성하는 환경 꾸미는 방법 아시면 알려주시면 감사하겠습니다.
    버전 관리
    egoing@gmail.com
    현재 버전
    선택 버전
    graphittie 자세히 보기