(1-2) 시각화의 요소

210809

데이터 이해하기

데이터를 시각화하기 위해서는 데이터가 우선적으로 필요하다.

시각화를 진행할 데이터

  • 데이터셋 관점 (global)

  • 개별 데이터의 관점 (local)

데이터셋의 종류

정형 데이터

  • 일반적으로 csv, tsv 파일로 제공된다.

  • 한 row에 한 item이, 한 column에 한 attribute(feature)가 제공된다.

  • 데이터 간 관계를 파악하거나 비교할 수 있다

시계열 데이터

  • 시간 흐름이 있으면 무조건 시계열 데이터이다.

  • 시간 흐름에 따른 추세, 계절성, 주기성을 살필 수 있다

지리/지도 데이터

  • geospatial 데이터라고도 한다

  • 지도 정보를 어떤식으로 표현하는지가 중요하다.

    • 거리, 경로, 분포 등 다양하게 사용할 수 있다

관계 데이터

  • 객체와 객체 간의 관계를 시각화 할 때 쓴다

    • 정형데이터나 지도 데이터도 관계 데이터로 바꿀 수 있다

  • 객체는 Node로, 관계는 Link로 표현한다.

  • 관계는 Json, 2D array, linked array 등으로 표현 가능하다

  • 크기, 색, 수 등으로 관계의 가중치를 표현

    • 가독성이 좋지 않다

  • 휴리스틱하게 노드 배치를 구성

    • 휴리스틱은 빠르게 파악할 수 있는 방법이다.

계층적 데이터

  • 관계 중에서도 포함관계가 분명한 데이터

  • 보통 트리를 사용한다

데이터의 종류는 다양하게 분류가 가능하다

  • 수치형 (ex 점수)

    • 연속형 : 길이, 무게, 온도 등

    • 이산형 : 주사위 눈금, 사람 수 등

  • 범주형 (ex 리뷰)

    • 명목형 : 혈액형, 종교 등

    • 순서형 : 학년, 별점, 등급 등

이산형이나 순서형으로 둘 다 분류되는 데이터도 있다. 비례나 비율이 가능하면 이산형으로, 수치가 절대적이 아니라면 순서형으로 나타낸다.

시각화 이해하기

점, 선, 면에서 시작하는 시각화

마크와 채널

마크

  • 그래픽 이미지에서 구성되는 대표적인 요소

  • 점, 선, 면

채널

  • 마크를 변경시킬 수 있는 요소

  • 수직, 수평, 모양, 크기(길이, 면적, 부피), 색, 기울기

전주의적 속성

주의를 주지 않아도 인지하게 되는 요소

  • 동시에 사용하면 인지하기 어렵기 때문에 적재적소에 잘 사용하는 것이 중요하다.

    • 이렇게 시각적 분리가 일어나는 것을 visual pop-out 이라고 한다. 이 pop-out이 잘 일어나게 하는 것이 중요하다.

Last updated

Was this helpful?