(1-2) 시각화의 요소
210809
데이터 이해하기
데이터를 시각화하기 위해서는 데이터가 우선적으로 필요하다.
시각화를 진행할 데이터
데이터셋 관점 (global)
개별 데이터의 관점 (local)
데이터셋의 종류
정형 데이터
일반적으로 csv, tsv 파일로 제공된다.
한 row에 한 item이, 한 column에 한 attribute(feature)가 제공된다.
데이터 간 관계를 파악하거나 비교할 수 있다
시계열 데이터
시간 흐름이 있으면 무조건 시계열 데이터이다.
시간 흐름에 따른 추세, 계절성, 주기성을 살필 수 있다
지리/지도 데이터
geospatial 데이터라고도 한다
지도 정보를 어떤식으로 표현하는지가 중요하다.
거리, 경로, 분포 등 다양하게 사용할 수 있다
관계 데이터
객체와 객체 간의 관계를 시각화 할 때 쓴다
정형데이터나 지도 데이터도 관계 데이터로 바꿀 수 있다
객체는 Node로, 관계는 Link로 표현한다.
관계는 Json, 2D array, linked array 등으로 표현 가능하다
크기, 색, 수 등으로 관계의 가중치를 표현
가독성이 좋지 않다
휴리스틱하게 노드 배치를 구성
휴리스틱은 빠르게 파악할 수 있는 방법이다.
계층적 데이터
관계 중에서도 포함관계가 분명한 데이터
보통 트리를 사용한다
데이터의 종류는 다양하게 분류가 가능하다
수치형 (ex 점수)
연속형 : 길이, 무게, 온도 등
이산형 : 주사위 눈금, 사람 수 등
범주형 (ex 리뷰)
명목형 : 혈액형, 종교 등
순서형 : 학년, 별점, 등급 등
이산형이나 순서형으로 둘 다 분류되는 데이터도 있다. 비례나 비율이 가능하면 이산형으로, 수치가 절대적이 아니라면 순서형으로 나타낸다.
시각화 이해하기
점, 선, 면에서 시작하는 시각화
마크와 채널
마크
그래픽 이미지에서 구성되는 대표적인 요소
점, 선, 면
채널
마크를 변경시킬 수 있는 요소
수직, 수평, 모양, 크기(길이, 면적, 부피), 색, 기울기
전주의적 속성
주의를 주지 않아도 인지하게 되는 요소
동시에 사용하면 인지하기 어렵기 때문에 적재적소에 잘 사용하는 것이 중요하다.
이렇게 시각적 분리가 일어나는 것을
visual pop-out
이라고 한다. 이 pop-out이 잘 일어나게 하는 것이 중요하다.
Last updated
Was this helpful?