728x90
반응형
데이터 시각화 (Data Visualization)
-> 수집 - 정제 - 시각화 - 예측모형/분석
-> 데이터 분석 결과를 쉽게 이해할 수 있도록 보여주는 것
-> 마찬가지로 시각화하여 직관적으로 파악하면서 결국에는 Insight 를 발견해야 한다.
-> 엑셀, Python, R 등 도구를 사용한다.
< 시각화 종류 >
1> 인포그래픽
2> 히스토그램
3> 산점도
- x축 : 독립변수 (원인) - 음주량
- y축 : 종속변수 (결과) - 수명
- 분포된 점들을 통해 형태, 강도( x, y가얼마나 밀접한 관계인지), 방향을 파악
- 상관계수(r) : 선형적인 상관관계 의미 (-1 ~ +1로 수치화)
4> 상자그림
- 최대값, 중앙값, 최소값, 삼사분위수(최소값으로부터 75% 범위), 일사분위수(최소값으로부터 25% 범위) 정보 제공
728x90
반응형
'IT ▶ > Database' 카테고리의 다른 글
[빅데이터] 데이터 수집, 데이터 탐색 (예측모형, 과적합, 불균형) (0) | 2019.10.28 |
---|---|
[빅데이터] 통계 확률 기초 개념 (조건부 확률, 정규분포) (0) | 2019.10.26 |
[DA 전문가 자격] 데이터아키텍처 전문가 DAP 자격증 준비 (0) | 2019.10.04 |
[데이터베이스 SQL 기본쿼리] MERGE() 쿼리 사용방법 (0) | 2019.09.30 |
[Data Science] 데이터 과학 & 데이터 분석 개념 (0) | 2019.09.27 |