Java

데이터 타입

데이터 타입은 조금 어렵다. 후속 수업에서 필수적인 선행지식은 아니지만, 또 뒤에 배치하는 것도 애매하다. 이번 토픽의 학습이 어렵게 느껴지면 다음 토픽으로 넘어가고 나중에 다시 학습하면 된다.

데이터 타입에 대해서 자세히 알아보기 전에 데이터의 크기에 대해서 학습하자.

데이터의 크기

8 bit (비트) 1 byte
1024 byte (바이트) 1 kilobyte
1024 kilobyte (킬로바이트) 1 megabyte
1024 megabyte (메가바이트) 1 gigabyte
1024 gigabyte  (기가바이트) 1 terabyte
1024 terabyte (테라바이트) 1 petabyte
1024 petabyte (페타바이트) 1 exabyte
1024 exabyte (엑사바이트) 1 zettabyte

위 의 표에서 볼 수 있듯이 컴퓨터에 저장되는 정보의 가장 작은 단위는 bit다. 컴퓨터를 0과 1로 이루어졌다는 말을 들어본 적이 있을 것이다. 바로 이 0과 1이 bit다. 1bit는 0이나 1의 값을 가질 수 있다. byte는 bit 보다 8배 큰 단위다. 1byte는 8비트다. 여기까지 지금 기억해야 할 내용이다. 그 외의 내용은 차차 알게 된다. 

정수형

데이터 타입 메모리의 크기 표현 가능 범위
byte 1 byte -128 ~ 127
short 2 byte -32,768 ~ 32,767
int 4 byte -2,147,483,648~2,147,483,647
long 8 byte -9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807

위의 표는 정수에 해당하는 데이터 타입의 리스트다.

아래와 같이 int를 데이터 타입으로 변수를 생성하면 어떻게 되는지를 생각해보자. (실행)

byte a;

이 변수에 담을 수 있는 숫자의 범위는 -128~127까지다. 이 범위 밖의 수인 -129나 128을 변수에 대입하려고 하면 오류가 발생할 것이다. 그럼 매우 큰 표현범위를 가지고 있는 long형을 사용하지 왜 byte 형을 사용할까? 만약 표현하고자 하는 수가 많아봐야 100을 넘지 않는 경우가 있다고 생각해보자.

행정구역을 숫자로 표시한다고 가정해보자.

1 경기도
2 전라도
3 충청도
4 경상도
5 제주도
6 강원도

 코드로는 아래와 같이 나타낼 것이다. (실행)

byte district = 1; //경기도

도처럼 그 수가 사실상 정해져있고, 늘어나도 100을 넘을 가능성이 없는 정보의 경우 byte로 표현하면 1byte의 크기만을 사용하게 된다. 하지만 아래와 같이 long을 사용한다면 8배나 많은 메모리를 사용하게 된다. (실행)

long district = 1;

반면에 국가별 인구의 수를 변수에 담으려고 하는데 byte형을 사용한다면 byte 형의 최대 한계인 127을 초과해서 오류가 발생할 것이다. (실행)

byte population = 50000000;

조금 다른 관점에서 생각해보자. 

아래의 변수 a와 변수 b는 둘 다 똑같이 8byte의 메모리를 사용하게 된다. 데이터 타입이 같기 때문이다. (실행)

long a = 2147483647;
long b = 1;

반대로 아래의 변수 a와 변수 b는 똑같은 수를 저장하고 있지만, 변수 b가 2배의 메모리를 사용한다. 데이터 타입이 다르기 때문이다. (실행)

int a = 2147483647;
long b = 2147483647;

즉 어떤 숫자를 저장하느냐에 따라서 사용하는 메모리의 크기가 달라지는 것이 아니고, 어떤 데이터 타입으로 변수를 선언했느냐에 따라서 사용하는 메모리의 크기가 달라지는 것이다. 결국, 변수에 들어올 수 있는 숫자의 최대 크기를 잘 판단해서 데이터 타입을 지정해야 귀한 메모리의 용량을 아낄 수 있다. 하지만 오늘날은 메모리의 용량이 늘어났고, 또 어떤 데이터형을 사용할 것이냐는 문제를 판단하기 위해서는 여러 가지가 고려되어야 한다. 결과적으로 말해서 정수를 저장할 때는 int를 사용하면 된다. int 형을 처리 할 때 CPU의 처리속도가 빠르고, int는 충분히 큰 수를 표현할 수 있는 데이터 타입이기 때문이다.

실수형

float 4byte ±(1.40129846432481707e-45 ~ 3.40282346638528860e+38)
double 8byte

±(4.94065645841246544e-324d ~ 1.79769313486231570e+308d)

실수형은 float과 double이 있다. 실수를 사용할 때는 double을 사용하도록 하자.

문자

char 2byte 모든 유니코드 문자

자바에서는 문자와 문자열이 다르다. 문자(character)는 글자 하나를 의미하고, 문자열은 글자들의 집합을 의미한다. 그럼 문자열은 메모리를 얼마나 사용할까? 문자열은 문자의 집합이라고 했다. 문자는 char 형이고, char는 2byte의 메모리를 사용한다. 따라서 6글자를 담고 있는 String 타입의 변수는 12바이트의 공간을 차지하게 된다. 자세한 내용은 String 클래스의 문자열 길이의 한계를 참고하자.

댓글

댓글 본문
작성자
비밀번호
  1. Ryan.L
    감사합니다.!
  2. 감사합니다 ^^~
  3. ㅎㅎ
    감사합니다! 강의 잘 보고있어요 ♥-♥
  4. 감사합니다!!
  5. 윤지영
    이고잉님 너무 친절해 ㅠㅡㅠ ♥ 뀨
  6. JustStudy
    고맙습니다
  7. Devani0310
    감사합니다
  8. 오빠는다르다
    감사합니다!!!!
  9. 화책이
    감사합니다 잘듣고 있어요!
  10. 박첩구드
    데이터 타입은 언제봐도 햇갈리는것 같아요~ 감사합니다!
  11. Byunghawk Lee
    위에 보시면 cha은 2 byte로 되어있네요.
    저도 궁금한 것은 유니코드는 4바이트를 사용하지않나요?
    대화보기
    • Byunghawk Lee
      감사합다.
      잘보고 다음으로 넘어갑니다.
    • hotsipa
      감사합니다
    • 허니버터
      잘보고 갑니다
    • ㅈㄱㄴ
      char는 문자열을 저장하기 위한 변수고
      byte는 정수를 저장하기 위한 변수이기 때문입니다.
      대화보기
      • ㅈㄱㄴ
        char 도 -128 ~ 127
        byte 도 -128 ~ 127
        이라고 적혀있는데 왜 char 가 2byte 인가요?
      • anonziny
        이것이 바로 창조경제
      • 자바자바
        자바는 char형이 2바이트네요 c언어랑 헷갈린당 ㅠㅠ 원래 언어마다 데이터 크기가 다른건가요?
      • user0123
        PHP 랑 자바스크립트 를 몇달동안 하다 자바 배우니
        확실히 이해도 잘가고 쉽습니다.

        자바가 좀 깐깐하네요..
      • 디버거
        강의 잘 듣고 있습니다.
        감사합니다.
      • Sung Gil Yun
        목소리는 젊으신데 말씀에선....뭔가 깨달으신 분 같은 느낌이 계속 듭니다.^^
        다시 한번 감사드리고... 저도 따라서 갈수 있기를 희망합니다.
      • 노수한
        쉽게 설명을 해주셔서 아주 이해하기 쉬웠습니다.
        즐거운 강의 감사합니다.
      • 김도현
        처음 겁주신(?)것만큼 어렵진 않네요. ㅎㅎ
        데이터 타입에 따라 데이터 크기가 달라지는건 정보의 수량화에 대해 알고 있으면 이해하는데 도움이 될듯 합니다.
        정보이론이라고 불리는 것인데 정보를 수량화하는데 기여한 이론입니다.
        '불확실성의 제거가 곧 정보의 크기'라고 이해한다면 어느정도 감이 오지 않을까 싶네요.

        데이터 타입을 다른 것을 쓰면 같은 숫자를 표시하더라도 해당 숫자일 '확률'은 달라지는 것이니까
        각 변수가 가지는 데이터 크기가 달라지는것이겠죠.

        적긴 했는데 이렇게 이해해도 되는건가 싶기도 하네요^^;;
      • Do-hyun Ryu
        egoing 은 사랑이네요
      • 이영수
        int 와 double 의 경우 cpu 가 계산할 때 정수는 4바이트, 실수는 8바이트로 계산하기 때문 아닌가요?

        short 나 float 으로 나누고 cpu 로 넘겨도, cpu 가 각각 int, double 로 형변환 한 뒤 연산하는 것으로 알고 있습니다.

        메모리가 여유있으면 cpu 가 형변환 작업을 구지 하지 않도록 해서 퍼포먼스를 높이도록 int 와 double 을 사용하고, 빅데이터처럼 cpu 성능을 좀 희생하더라도 메모리에 다 올려서 처리하는게 하드디스크보다는 빠른 상황일 때는 자료 크기에 맞춰서 돌리는 것으로... 알고 있는데...

        이게 맞나요?

        http://ko.wikipedia.org......%B4) 를 보면, 32비트 cpu 컴퓨터는 int 형이 32비트인 것으로 나옵니다.

        음.. 카더라 하는걸 들었더니 헷갈리네요.
        대화보기
        • 안영철
          자바에서 데이터 타입은 크게 2 가지가 있습니다.

          기본형과 참조형

          int, double, ... 등은 Primitive(기본형) 데이터 타입이구요

          String 은 Reference(참조형) 데이터 타입이에요 (객체이기도 하지요)

          String은 단순 값만 저장하는 것이 아니라,
          메소드도 가지고 있습니다.

          좀더 나아가서 wrapper class 에 대해서 공부하시면 심도있게 이해가 되실거에요.
          대화보기
          • 이르
            float a;
            a = 1.0002;

            해서 안되길래 찾아보니 float 형은 숫자 뒤에 f를 붙여줘야 한다더라구요.
            혹시 저처럼 헤매는 분이 계실까봐 댓글 남겨요~
          • 디지
            메모리를 잡아서 쓰고 풀고 하기때문에 상황마다 메모리 사용량은 다릅니다.
            권장사양을 어떤식으로 측정하는지는 모르겠지만
            데이터가 언제나 메모리를 점유하고있지 않으므로
            제작시 쓰인 데이터 총합은 아닐 것이고 순간 최대 점유 메모리로 보는게 맞을것 같네요.

            데이터양이 컴퓨터 램을 넘어설 경우 가상메모리를 활용하게됩니다.
          • 헐랭헐랭
            질문 있습니다. 이제 처음 자바를 공부해봐겠다고 생각하여 강의를 듣고 있습니다.
            지식이 전혀 없는 학생의 질문으로 어이 없는 질문 일 수 있으나 갑자기 궁금증이 생기어 질문합니다.

            음.. 게임을 돌릴 수 있는 사양을 보면 ram이 표기가 되어 있습니다.
            여기서 말하는 권장 램은 게임 제작시 쓰인 데이터의 총합을 고려하여 측정되는 것인가요????

            또 최소사양 권장사양이 나뉘어져 있는데 게임을 실행중 사용된 데이터의 양이 컴퓨터 램을 넘어 설 경우, 프로그래밍상 앞쪽에 쓰인 데이타양을 쓴 후에 순차적으로 데이타가 사용되는것인가요???
          • 미국에서 컴퓨터 전공하는 학생입니다 원서가 너무 어려워서 여기서 선행학습 하고 있는데... 와.. 정말 감탄밖에 안나올 정도로 쉽게 설명해주시네요 너무너무 감사합니다 :)
          • Diew
            매번 강의를 듣지만 정말 감사하다는 말로는 부족하네요
          • 김영재
            우와~!
            최고의 강의입니다.
            감사합니다.
          • egoing
            e-45라는 것은 지수표기법이라는 것입니다. 큰 수를 표현하기 위한 방법입니다. 주로 과학에서 많이 사용하는 것인데요. 제가 지금 상세한 답변을 드리는 좀 어려운 상황이라서 검색어를 일단 드리겠습니다. http://goo.gl/DQEjLS 그런데 이 내용은 지금 단계에서는 전혀 중요한 것은 아닙니다. 나중에 벼녕님이 큰수, 정확한 수를 다뤄야 하는 일이 있을 때 그 때 깊게 공부하시면 되는 부분이거든요.

            그리고 -324d의 d는 이 숫자가 double 형이라는 의미입니다. d는 없어도 되는 사족이라고 할 수 있습니다.

            답변이 부실해서 죄송합니다!
            대화보기
            • 벼녕
              float와 double의 표현가능범위를 잘 모르겟어요.. 소수 뒤에 e-45라고 쓰여있는 건 뭐고 -324d라고 쓰여있는건 뭔가요???
            • egoing
              수정 했습니다. 감사합니다 ^^
              대화보기
              • 누리짱
                short 표현범위 수정해 주세요 ^^
                현재 -32,769 - 32,767 -> -32,768 ~ 32,767
              • egoing
                int, double과 같은 데이터 형식은 원시 데이터 형이라는 것으로 언어에 내장된 데이터 형식이라는 특수한 데이터 타입입니다. 반면에 String은 객체라는 것인데요. 객체의 이름을 만드는 약속이 대문자로 시작하는 것이기 때문에 그렇습니다. 객체가 무엇인지는 뒤에서 배우게 되니까요. 일단은 정주행 부탁드립니다~
                대화보기
                • 초보맨
                • egoing
                  수정 했습니다. ^^
                  대화보기
                  • dawndream
                    정수형의 표현 가능 범위 설명 글에 자리수 표시가 없는 것들이 있습니다.
                    -32769 ~ 32767
                    -2147483648~2,147,483,647
                  버전 관리
                  egoing
                  현재 버전
                  선택 버전
                  graphittie 자세히 보기