Collection Framework

배열과 컬렉션즈 프레임워크

이전 시간에 배열에 대해서 공부했다. 배열은 연관된 데이터를 관리하기 위한 수단이었다. 그런데 배열에는 몇가지 불편한 점이 있었는데 그 중의 하나가 한번 정해진 배열의 크기를 변경할 수 없다는 점이다. 이러한 불편함을 컬렉션즈 프래임워크를 사용하면 줄어든다.

package org.opentutorials.javatutorials.collection;

import java.util.ArrayList;

public class ArrayListDemo {

public static void main(String[] args) {

String[] arrayObj = new String[2];

arrayObj[0] = "one";

arrayObj[1] = "two";

// arrayObj[2] = "three"; 오류가 발생한다.

for(int i=0; i<arrayObj.length; i++){

System.out.println(arrayObj[i]);

}

ArrayList al = new ArrayList();

al.add("one");

al.add("two");

al.add("three");

for(int i=0; i<al.size(); i++){

System.out.println(al.get(i));

}

아래 코드처럼 배열은 그 크기를 한번 지정하면 크기보다 많은 수의 값을 저장할 수 없다.

ArrayList는 배열과는 사용방법이 조금 다르다. 배열의 경우 값의 개수를 구할 때 .length를 사용했지만 ArrayList는 메소드 size를 사용한다. 또한, 특정한 값을 가져올 때 배열은 [인덱스 번호]를 사용했지만 컬렉션은 .get(인덱스 번호)를 사용한다.

그런데 ArrayList를 사용할 때 주의할 점이 있다. 위의 반복문을 아래처럼 바꿔보자.

for(int i=0; i<al.size(); i++){

String val = al.get(i);

System.out.println(val);

}

위의 코드는 컴파일 오류가 발생한다. ArrayList의 메소드 add의 입장에서는 인자로 어떤 형태의 값이 올지 알 수 없다. 그렇기 때문에 모든 데이터 타입의 조상인 Object 형식으로 데이터를 받고 있다. 예를들면 아래와 같은 모습일 것이다. (실제와는 다르다)

public boolean add(Object e) {

따라서 ArrayList 내에서 add를 통해서 입력된 값은 Object의 데이터 타입을 가지고 있고, get을 이용해서 이를 꺼내도 Object의 데이터 타입을 가지고 있게 된다. 그래서 위의 코드는 아래와 같이 바꿔야 한다.

for(int i=0; i<al.size(); i++){

String val = (String)al.get(i);

System.out.println(val);

}

get의 리턴값을 문자열로 형변환하고 있다. 원래의 데이터 타입이 된 것이다.

그런데 위의 방식은 예전의 방식이다. 이제는 아래와 같이 제네릭을 사용해야 한다.

ArrayList<String> al = new ArrayList<String>();

al.add("one");

al.add("two");

al.add("three");

for(int i=0; i<al.size(); i++){

String val = al.get(i);

System.out.println(val);

}

제네릭을 사용하면 ArrayList 내에서 사용할 데이터 타입을 인스턴스를 생성할 때 지정할 수 있기 때문에 데이터를 꺼낼 때(String val = al.get(i);) 형변환을 하지 않아도 된다.

컬렉션즈 프래임워크란?

그럼 이제부터 컬렉션즈 프래임워크가 무엇인가 본격적으로 알아보자. 컬렉션즈 프래임워크라는 것은 다른 말로는 컨테이너라고도 부른다. 즉 값을 담는 그릇이라는 의미이다. 그런데 그 값의 성격에 따라서 컨테이너의 성격이 조금씩 달라진다. 자바에서는 다양한 상황에서 사용할 수 있는 다양한 컨테이너를 제공하는데 이것을 컬렉션즈 프래임워크라고 부른다. ArrayList는 그중의 하나다.

위의 그림은 컬렉션즈 프래임워크의 구성을 보여준다. Collection과 Map이라는 최상위 카테고리가 있고, 그 아래에 다양한 컬렉션들이 존재한다. 그럼 구체적인 컬렉션즈 프래임워크 클래스들을 살펴보자.

ArrayList를 찾아보자. Collection-List에 속해있다. ArrayList는 LIst라는 성격으로 분류되고 있는 것이다. List는 인터페이스이다. 그리고 List 하위의 클래스들은 모두 List 인터페이스를 구현하기 때문에 모두 같은 API를 가지고 있다. 클래스의 취지에 따라서 구현방법과 동작방법은 다르지만 공통의 조작방법을 가지고 있는 것이다. 익숙한 ArrayList를 바탕으로 나머지 컬렉션들의 성격을 파악해보자.

List와 Set의 차이점은 List는 중복을 허용하고, Set은 허용하지 않는다.

package org.opentutorials.javatutorials.collection;

import java.util.ArrayList;

import java.util.HashSet;

import java.util.Iterator;

public class ListSetDemo {

public static void main(String[] args) {

ArrayList<String> al = new ArrayList<String>();

al.add("one");

al.add("two");

al.add("three");

al.add("five");

System.out.println("array");

Iterator ai = al.iterator();

while(ai.hasNext()){

System.out.println(ai.next());

}

HashSet<String> hs = new HashSet<String>();

hs.add("one");

hs.add("two");

hs.add("three");

hs.add("five");

Iterator hi = hs.iterator();

System.out.println("\nhashset");

while(hi.hasNext()){

System.out.println(hi.next());

}

결과는 아래와 같다.

array

one

two

three

five

hashset

two

five

one

three

우선 값을 가져오는 방법이 조금 달라졌다. (ArrayList에서도 이 방법을 사용할 수 있다)

메소드 iterator()는 인터페이스 Collection에 정의되어 있다. 따라서 Collection을 구현하고 있는 모든 컬렉션즈 프레임웍크는 이 메소드를 구현하고 있음을 보증한다. 메소드 iterator의 호출 결과는 인터페이스 Iterator를 구현한 객체를 리턴한다. 인터페이스 Iterator는 아래 2개의 메소드를 구현하도록 강제하고 있는데 각각의 역할은 아래와 같다.

hasNext()

반복할 데이터가 더 있으면 true, 더 이상 반복할 데이터가 없다면 false를 리턴한다.

next()

hasNext가 true라는 것은 next가 리턴할 데이터가 존재한다는 의미다.

이러한 기능을 조합하면 for 문을 이용하는 것과 동일하게 데이터를 순차적으로 처리할 수 있다.

그럼 본론으로 돌아와서 Set과 List의 차이를 짚어보자. 위의 결과를 통해서 알 수 있는 것처럼 Set는 중복을 허용하지 않고 순서가 없지만, List는 중복을 허용하고 저장되는 순서가 유지된다는 것을 알 수 있다. 이러한 특징을 고려해서 컬렉션을 선택해야 한다. 그럼 Set에 대해서 조금 더 알아보자.

Set

Set은 한국어로 집합이라는 뜻이다. 여기서의 집합이란 수학의 집합과 같은 의미다. 수학에서의 집합도 순서가 없고 중복되지 않는 특성이 있다는 것이 기억날 것이다. 수학에서 집합은 교집합(intersect), 차집합(difference), 합집합(union)과 같은 연산을 할 수 있었다. Set도 마찬가지다.

이 내용은 수학적 지식을 요구하지 않는다. 겁내지 말자.

아래와 같이 3개의 집합 hs1, hs2, hs3이 있다고 하자. h1은 숫자 1,2,3으로 이루어진 집합이고, h2는 3,4,5 h3는 1,2로 구성되어 있다. set의 API를 이용해서 집합 연산을 해보자.

package org.opentutorials.javatutorials.collection;

import java.util.ArrayList;

import java.util.HashSet;

import java.util.Iterator;

public class SetDemo {

public static void main(String[] args) {

HashSet<Integer> A = new HashSet<Integer>();

A.add(1);

A.add(2);

A.add(3);

HashSet<Integer> B = new HashSet<Integer>();

B.add(3);

B.add(4);

B.add(5);

HashSet<Integer> C = new HashSet<Integer>();

C.add(1);

C.add(2);

System.out.println(A.containsAll(B)); // false

System.out.println(A.containsAll(C)); // true

//A.addAll(B);

//A.retainAll(B);

//A.removeAll(B);

Iterator hi = A.iterator();

while(hi.hasNext()){

System.out.println(hi.next());

}

부분집합 (subset)

System.out.println(A.containsAll(B)); // false

System.out.println(A.containsAll(C)); // true

합집합(union)

A.addAll(B);

교집합(intersect)

A.retainAll(B);

차집합(difference)

A.removeAll(B);

Map

이번에는 Map 컬렉션에 대해서 알아보자. Map 컬렉션은 key와 value의 쌍으로 값을 저장하는 컬렉션이다. 아래 코드를 보자.

package org.opentutorials.javatutorials.collection;

import java.util.*;

public class MapDemo {

public static void main(String[] args) {

HashMap<String, Integer> a = new HashMap<String, Integer>();

a.put("one", 1);

a.put("two", 2);

a.put("three", 3);

a.put("four", 4);

System.out.println(a.get("one"));

System.out.println(a.get("two"));

System.out.println(a.get("three"));

iteratorUsingForEach(a);

iteratorUsingIterator(a);

}

static void iteratorUsingForEach(HashMap map){

Set<Map.Entry<String, Integer>> entries = map.entrySet();

for (Map.Entry<String, Integer> entry : entries) {

System.out.println(entry.getKey() + " : " + entry.getValue());

}

static void iteratorUsingIterator(HashMap map){

Set<Map.Entry<String, Integer>> entries = map.entrySet();

Iterator<Map.Entry<String, Integer>> i = entries.iterator();

while(i.hasNext()){

Map.Entry<String, Integer> entry = i.next();

System.out.println(entry.getKey()+" : "+entry.getValue());

}

Map에서 데이터를 추가할 때 사용하는 API는 put이다. put의 첫번째 인자는 값의 key이고, 두번째 인자는 key에대한 값이다. key를 이용해서 값을 가져올 수 있다.

Set<Map.Entry<String, Integer>> entries = map.entrySet();

for (Map.Entry<String, Integer> entry : entries) {

System.out.println(entry.getKey() + " : " + entry.getValue());

}

메소드 entrySet은 Map의 데이터를 담고 있는 Set을 반환한다. 반환한 Set의 값이 사용할 데이터 타입은 Map.Entry이다. Map.Entry는 인터페이스인데 아래와 같은 API를 가지고 있다.

getKey

getValue

위의 API를 이용해서 Map의 key, value를 조회할 수 있다.

앞서 Set이 수학의 집합을 프로그래밍적으로 구현한 것이라고 언급했다. map은 수학의 함수를 프로그래밍화한 것이다. 수학의 함수가 "정의역과 공역 원소들 사이의 단가 대응의 관계"라는 의미를 이해하고 있는 사람이라면 Map의 key와 value의 관계가 함수의 정의역과 공역의 관계와 같다는 것을 이해할 수 있을 것이다. 함수에 대한 이해가 없다면 이 내용은 몰라도 된다. 하지만 프로그래밍을 하게 되면 수학적인 지식들을 매우 구체적으로 경험할 수 있기 때문에 프로그래밍은 수학에 대한 좋은 실습 도구라고 할 수 있다. 수학이 너무 추상적이라서 배움에 어려움이 있는 독자라면 프로그래밍에 익숙해진 후에 수학공부를 시작해보자. 프로그래밍의 많은 장치들이 수학적인 장치들을 빌려온 것임을 알 수 있을 것이고, 수학이 보다 구체적으로 다가올 것이다.

정렬

컬렉션을 사용하는 이유 중의 하나는 정렬과 같은 데이터와 관련된 작업을 하기 위해서다. 정렬하는 법을 알아보자. 패키지 java.util 내에는 Collections라는 클래스가 있다. 이 클래스를 사용하는 법을 알아보자.

package org.opentutorials.javatutorials.collection;

import java.util.*;

class Computer implements Comparable{

int serial;

String owner;

Computer(int serial, String owner){

this.serial = serial;

this.owner = owner;

}

public int compareTo(Object o) {

return this.serial - ((Computer)o).serial;

}

public String toString(){

return serial+" "+owner;

}

public class CollectionsDemo {

public static void main(String[] args) {

List<Computer> computers = new ArrayList<Computer>();

computers.add(new Computer(500, "egoing"));

computers.add(new Computer(200, "leezche"));

computers.add(new Computer(3233, "graphittie"));

Iterator i = computers.iterator();

System.out.println("before");

while(i.hasNext()){

System.out.println(i.next());

}

Collections.sort(computers);

System.out.println("\nafter");

i = computers.iterator();

while(i.hasNext()){

System.out.println(i.next());

}

결과

before

500 egoing

200 leezche

3233 graphittie

after

200 leezche

500 egoing

3233 graphittie

이렇게 해서 컬렉션즈 프레임워크에 대한 수업을 마무리 하겠다. 컬렉션즈 프레임워크는 효율적인 에플리케이션을 구축하기 위해서 매우 중요한 내용이다. 그런데 컬렉션은 단순히 사용법을 이해하는 것으로는 부족하고, 소위 알고리즘이나 자료구조(data structure)라고 불리는 분야에 대한 충분한 이해가 필요하다. 컬렉션즈 프레임워크는 이러한 분야의 성취를 누구나 쉽게 사용할 수 있도록 제공되는 일종의 라이브러리라고 할 수 있기 때문이다.

댓글