티스토리 뷰

반응형

데이터 모델의 정의와 중요성

GIS는 복잡한 실세계의 현상들을 수치화하여 컴퓨터에 표현함으로써, 지리정보를 효과적으로 관리, 분석, 시각화할 수 있도록 한다. 따라서 실세계 현상들의 원리와 의미를 쉽게 이해할 수 있도록 단순화, 일반화, 수치화하여 컴퓨터에 표현하는 것은 GIS를 활용하기 위해 매우 중요하며, 이러한 과정을 데이터 모델링이라고 한다. 실세계에서 일어나고 있는 현상들은 연속적이며 무한히 복잡하다. 그러나 컴퓨터는 디지털화된 상대적으로 단순하고 유한한 정보만을 처리할 수 있다. 따라서 실세계의 모든 현상들을 컴퓨터에 표현하는 것은 거의 불가능하며 비효율적이다. 따라서 데이터 모델링을 통해 실세계에서 일어나는 현상의 중요한 특성만을 추출하여 컴퓨터에서 처리할 수 있도록 하는 작업이 필요하다. 대학 캠퍼스 영상에서 볼 수 있는 실세 현상들 가운데 주요 건물, 도로, 하천, 등산로, 지형 등의 정보 요소를 추출하였고, 현상의 위치와 형태는 면(polygon)과 선 line)의 형태로 단순화하였다. 현상을 설명하기 위한 속성 정보로서 주요 건물들에 대한 건물명을 기재하였고, 등산로의 경우 정상까지의 소요 시간을 함께 표현하였다. 또한 지형의 경우에는 10m 간격의 고도 값을 가지는 등고선을 이용하여 표현하였다.

데이터 모델링을 통해 단순화된 지도는 캠퍼스를 방문한 방문객, 특히 운전자들에게 필요한 목적지까지의 간결하면서도 명확한 캠퍼스 도로교통 정보를 제공한다. 그러나 데이터 모델링 과정에서 선택되지 않는 실세계 현상의 특성들은 컴퓨터에서 더 이상 정보를 처리할 수 없는 한계가 있다. 예를 들어, 대중교통을 이용하는 방문객들에게는 캠퍼스 내 버스 정류장에 대한 정보를 제공해야 하지만, 데이터 모델링 과정에서 버스 정류장에 대한 정보는 생략되었기 때문에 컴퓨터는 필요한 정보를 제공할 수 없다. 데이터 모델링 작업은 컴퓨터에 저장된 정보를 어떤 용도로 사용할 것인지 충분히 고려하여 수행해야 한다. 실세 현상들의 많은 특성을 추출하고 컴퓨터에 최대한 상세하게 표현할 경우, 정보의 활용성은 높아지지만 저장을 위해 필요한 컴퓨터의 저장 공간과 처리 비용이 증가하게 된다. 반면에 실세계 현상 최소한의 특성만을 추출하여 컴퓨터에 간략하게 표현할 경우에는 컴퓨터 저장 공간 처리 비용은 절약할 수 있으나, 컴퓨터에 저장된 정보를 활용하는 과정에서 많은 제약이 따르게 된다. 따라서 합리적인 데이터 모델링이란 GIS의 활용 목적에 적합하도록 필수적인 정보 요소들을 모두 포함하는 동시에 불필요한 정보들은 최소화하는 것이라고 할 수 있다. 데이터 모델링 작업은 일반적으로 첫째, 특정한 문제와 관련한 실세계의 정보 요소들을 추출하여 인간이 이해하기 쉬운 개념 모델을 생성한다. 여기에는 GIS에 표현할 객체 유형과 객체 간의 관계를 정의하고 개념적인 서술을 하는 과정이 포함되며, 소프트웨어 및 하드웨어에서 독립적으로 수행된다. 둘째, 개념적으로 정의한 모델을 다이어그램과 리스트를 이용하여 정보 요소의 속성, 관계 등을 구체화한다. 이 단계에서 생성되는 모델을 논리 모델이라고 한다. 논리 모델은 GIS 애플리케이션의 적용 범위를 정의하는 데 매우 유용하게 활용되며 하드웨어에서 독립적으로 수행된다. 셋째, 논리 모델을 디지털화하여 컴퓨터 물리 공간에 저장한다. 이와 같이 실세계의 정보 요소를 컴퓨터에 실제로 구현하는 모델을 물리 모델이라고 하며, 물리 모델을 통해 명확한 파일 또는 데이터베이스를 지정하여 컴퓨터에 자료를 저장하고 객체 간의 관계성을 정의할 수 있다. 물리 모델은 소프트웨어 및 하드웨어에 종속적이기 때문에 시스템의 구성에 따라 상이한 방법으로 구축될 수 있다.

 

반응형

래스터 모델과 벡터 모델

데이터 모델링 절차 중 논리 모델과 물리 모델의 구성은 GIS 소프트웨어가 제공하는 데이터 모델을 충분히 고려하여 수행해야 한다. 대부분의 GIS 소프트웨어가 제공하는 데이터 모델은 크게 두 가지 유형으로 구분할 수 있다. 하나는 실세계 공간을 일정한 크기의 격자 단위로 분할한 후 각 격자에 대응하는 실세계 객체의 정보를 격자의 속성값으로 입력하는 래스터 (raster) 모델이며, 다른 하나는 지도와 유사하게 점, , 면 등의 도형요소를 이용하여 실세계 객체의 정보를 표현하는 벡터(vector) 모델이다. 래스터 모델은 셀(cell) 또는 그리드(grid)라고 불리는 격자 형태를 기본 단위로 사용하여 실세계를 규칙적으로 분할한다. 분할된 격자들의 상대적인 위치로 실세계 현상의 위치정보를 표현하며, 각각의 격자에 값을 할당하여 속성정보를 표현한다. 래스터 모델의 격자에 할당되는 값의 유형은 크게 정수형, 실수형, 문자(text)형으로 구분하며, 표현하고자 하는 실세계 현상의 특성에 따라 값의 유형을 적절하게 선택해야 한다.

실세계에 존재하는 객체들을 구분할 수 있는 문자(- F. 하천-R. -H)가 래스터 모델의 격자에 할당되었다. 또한, 어떤 객체도 존재하지 않는 나머지 배경 영역을 구분하기 위해 나머지 격자에는 문자(O)가 할당되었다. 아무것도 할당하지 않으면 컴퓨터가 인식하지 못한다. , 래스터 모델에서는 주어진 격자 내의 모든 셀에 데이터가 하나씩 존재해야만 하는데, 이러한 점 때문에 불필요하게 과다한 메모리가 소요되기도 한다.

벡터 모델은 점, , 면의 도형요소를 이용하여 실세계 현상을 객체 단위로 표현한다. 도형요소를 이용하여 실세계 객체의 위치와 형상 정보를 표현하며, 도형요소와 연동된 데이터베이스 테이블을 이용하여 객체의 속성정보를 표현한다.

래스터 모델의 특징

래스터 모델은 실세계를 격자 단위로 분할한 후 수치 방식 또는 문자 방식의 코드를 격자에 할당하여 현상의 속성정보를 표현한다. 따라서 실세계를 격자로 옮겨 표현하는 래스터 코딩 과정을 바르게 이해하는 것이 중요하다. 실세계에 세 가지 객체(편의점, 철도, 바다)에 대한 개념 모델을 구성한 후, 래스터 코딩을 수행하기 위해 4×4 크기의 격자망을 설정하였다. 객체의 위치와 격자의 위치를 비교하여 객체를 포함하는 격자들에 대해서는 속성값으로 1을 할당하였다. 실세계 개념 모델에는 4개의 편의점이 존재한다. 그러나 레스터 모델의 편의점 레이어는 3개의 격자에 1의 값이 할당되었다. 이는 래스터 모델에서는 하나의 격자 안에 다수의 객체가 존재할 경우 객체들을 따로 구분하지 못하는 한계가 있기 때문이다. 철도 레이어의 경우에는 7개의 격자에 1의 값이 할당되었다. 철도가 상대적으로 폭이 가는 선형 구조물임에도 불구하고 래스터 모델에서는 철도의 폭이 과장되어 표현되었으며 이산적인 형태를 보인다. 이는 객체 단위가 아닌 격자 단위로 실세계를 표현하기 때문이다. 바다와 같이 영역을 가지는 실세계 객체들은 래스터 코딩 과정이 다소 복잡한데, 이는 하나의 격자 영역에 다수의 객체 영역이 포함될 수 있기 때문이다. 레스터 격자에는 하나의 속성값만을 입력할 수 있으므로, 격자 내에 존재하는 객체 중 어떤 것의 속성정보를 입력할지 선택해야 한다. 다양한 방식의 래스터 코딩이 가능하지만 대표적인 방법은 관심 객체의 존재 여부에 따라 결정하는 방식, 격자 중심에 대응하는 객체에 따라 결정하는 방식, 다수의 면적을 차지하는 객체에 따라 결정하는 방식이 있다. 래스터 모델의 격자에 입력된 속성값에 대응하는 컬러를 논리적 팔레트로부터 선택하고, 격자 단위로 컬러를 채워서 가시화 작업을 수행한다. 논리적 팔레트란 속성값에 대응하는 컬러를 사전에 정의해 둔 것이다. 래스터 자료에 입력된 속성값이 실수형이거나 논리적 팔레트에 정의된 수치의 범위를 벗어날 경우에는 래스터 자료를 스케일링(scaling)하여 논리적 팔레트와 대응될 수 있도록 한다.

래스터 모델의 가시화 결과는 격자의 크기(해상도)에 크게 영향을 받는다. 동일한 지역에 대해 래스터 모델을 구성할 경우 격자의 크기가 작을수록 더 상세한 정보를 표현할 수 있다. 그러나 격자의 크기가 작아질수록 컴퓨터가 처리하고 저장해야 하는 총 격자수는 증가하기 때문에, GIS의 활용 목적에 따라 적절한 수준에서 격자의 크기를 결정해야 한다. 어떤 프로젝트에서 결과물의 공간해상도가 너무 낮을 경우 아예 처음의 입력 자료 구축부터 새로운 격자 크기를 이용하여 다시 시작해야 하므로 프로젝트 기획 단계에서 격자 크기를 신중히 결정해야 한다.

래스터 모델은 격자의 구성 방법에 따라 객체의 실제 크기, 모양 등을 왜곡할 수 있으며, 격자 내부에 다수의 객체들이 포함될 경우 개별 객체들을 구분할 수 없는 한계가 있다. 그럼에도 불구하고 래스터 모델이 GIS의 대표적인 데이터 모델로 사용되는 이유는 래스터 모델이 가지는 장점 때문이다. 래스터 모델은 디지털카메라, 인공위성 센서 등 디지털 센서로부터 취득할 수 있는 자료와 유사한 형태를 가진다. 우리가 사용하고 있는 컴퓨터의 모니터도 자세히 살펴보면 격자망으로 구성된 구조로 래스터 모델과 유사함을 알 수 있다. 따라서 디지털 기기로부터 취득된 자료들과 쉽게 호환이 가능하다는 점은 GIS 구축 시 래스터 모델이 갖는 큰 장점이므로 상용 GIS 소프트웨어 중에서 여전히 래스터 방식이 이용되고 있다. 또한 래스터 모델은 행렬 형태의 자료구조를 갖기 때문에 다양한 분야에서 개발된 과학계산 알고리즘을 그대로 적용할 수 있는 장점이 있다. 이러한 래스터 구조의 범용성은 GIS가 다양한 학문 분야에서 활용될 수 있는 중요한 이유이기도 하다.

벡터 모델의 특징

벡터 데이터 모델은 그림 3-8과 같이 점, , 면의 세 가지 요소를 이용하여 실세계의 객체를 표현한다. 실세계 객체가 가지는 본래의 위치정보에 따라 점, , 면의 도형요소를 이용하여 객체의 형상을 그대로 스케치할 수 있기 때문에, 래스터 코딩 과정을 거쳐야 하는 래스터 모델에 비해 더 사실적으로 객체를 표현할 수 있다.

점은 특정 지점에 객체가 존재한다는 것을 표현하기 위해 사용한다. 객체가 위치하는 좌표 정보(X-Y coordinates)를 가지며, 객체가 가지는 다른 특성들은 데이터베이스 테이블을 이용하여 속성정보로 입력할 수 있다. 실세계의 어떤 객체를 점으로 표현할 것인지는 GIS의 응용 목적이나 사용되는 지도의 축척에 따라 결정된다. 전국 규모의 지도에서 대학 캠퍼스는 하나의 점으로 표현되며, 이러한 경우 대학 캠퍼스의 위치에 대한 정보만을 제공한다. 그러나 점으로 표현된 객체는 지역 규모의 지도에서 대학 캠퍼스가 차지하는 영역의 크기와 모양보다 상세한 공간정보를 제공할 수 없다. 이러한 경우에는 영역을 표시할 수 있는 면을 이용하여 대학 캠퍼스를 표현하는 것이 보다 합리적일 것이다.

선은 갱도, 하천, 도로, 전력선, 파이프라인 등과 같은 일차원 선형 객체를 표현하는 데 유용하다. 벡터 모델에서는 작은 직선들을 연결하여 곡선을 표시하며, 이러한 작은 직선들을 chain 또는 line segment라고 부른다. 각각의 chain 들은 2개의 점으로 구성되는데 이러한 점을 vertex라고 부르며, 특별히 전체 선의 시작점과 끝점을 node라고 부른다. 선의 두께 등과 같은 정보는 데이터베이스 테이블을 이용하여 속성정보로 입력한다.

(또는 풀리곤)은 영역으로 표시되는 객체를 표현할 때 사용한다. 면도 선과 동일하게 연결된 직선 chain 들의 집합으로 볼 수 있으나, 하나의 node를 중심으로 연결된 chain 들이 폐합되어 하나의 면을 형성한다는 점에서 차이가 있다. 면은 실세계 객체의 위치정보뿐만 아니라 모양과 크기에 대한 정보도 함께 가지며, 또한 데이터베이스 테이블을 이용하여 추가적인 속성정보도 저장할 수 있다. 순환도로 역시 폐곡선의 형태로 직선 chain 들의 집합으로 표현되므로 순환도로와 면 개체와의 구분을 위해 면 객체의 경우 또 다른 node를 면 객체의 내부에 가상으로 위치시켜 정의하여 구분하기도 한다.

산림 훼손지는 영역을 가지는 실세계의 객체이기 때문에 벡터 모델의 도형요소 중 면을 이용하여 표현하였다. 그 결과 산림훼손지의 위치, 모양, 규모 등의 정보를 GIS에서 사실적으로 표현할 수 있으며, 도형요소와 연동된 데이터베이스 테이블에는 산림 훼손지의 속성정보 (기후, 용도, 가시권, 관리용이도 등)를 입력하여 관리할 수 있다.

래스터 모델과 벡터 모델의 장단점

과거에는 GIS 소프트웨어가 래스터 모델과 벡터 모델 중 한 가지 방식만을 지원했으나, 현재는 대부분의 GIS 소프트웨어들이 두 가지 모델을 모두 적용할 수 있는 통합 환경을 제공하고 있다. 따라서 각각의 모델의 장점과 단점을 이해하고 GIS의 응용 목적에 따라 적합한 모델을 선택하는 것이 매우 중요하다. 광역지역을 대상으로 구성된 GIS의 경우 두 모델 중의 하나를 채택했다가 다른 형태로 전환할 경우 과거에는 아예 새로 데이터 입력부터 하는 경우가 종종 있었다. 이런 경우를 대비해서 요즘의 GIS 소프트웨어는 데이터의 입출력 시 래스터-벡터 방식 전환을 실시하는 실행명령을 포함하고 있다.

래스터 모델의 장점은 상대적으로 단순화 자료구조, 중첩 연산을 간단하게 구현, 위성영상 등 디지털 자료와의 호환, 영상처리, 모델링에 효율적, 실세계의 연속적인 현상 표현에 효과적이다. 벡터 모델의 장점은 객체의 위치, 형상을 보다 사실적으로 표현 가능, 속성정보의 입력, 검색, 갱신이 용이, 실세계의 이산적 현상 표현에 효과적, 공간해상도에 좌우되지 않는다. 래스터 모델의 단점은 정확한 위치정보의 파악이 어렵고, 해상도에 따라 객체의 형상이 왜곡되며, 객체가 존재하지 않는 격자에도 값을 할당해야 하므로 비효율적이다. 벡터 모델의 단점은 복잡한 자료구조이고, 중첩 연산 등 공간분석 기법의 구현이 어렵고, 공간분석 함수의 프로그래밍이 다소 복잡하다.

 

 

 

 
반응형
댓글