전체 글 127

데이터 시각화 핵심 방법론 및 원칙

데이터를 단순히 나열하는 것을 넘어, 숨겨진 의미와 스토리를 발견하고 효과적으로 전달하기 위한 데이터 시각화. 세계적인 전문가 3인의 핵심 이론을 통해 그 방법론과 원칙을 소개합니다.1. 벤 프라이 (Ben Fry): 데이터에서 인사이트까지의 여정"데이터를 의미 있는 정보로 시각화하는 체계적인 7단계 프로세스" 벤 프라이는 데이터를 수집하는 것부터 사용자와 상호작용하는 최종 결과물에 이르기까지, 전 과정을 7개의 논리적 단계로 정의했습니다. 이 방법론을 따르면 데이터의 잠재력을 최대한 이끌어낼 수 있습니다.획득 (Acquire): 원석(데이터)을 모으는 단계 설명: 시각화의 대상이 될 데이터를 수집합니다. 데이터는 파일, 데이터베이스, 웹 API 등 다양한 형태로 존재할 수 있습니다. 예시: 온라인 쇼핑..

데이터 시각화 유형

데이터가 넘쳐나는 시대에, 숫자 그 자체만으로는 숨겨진 의미를 파악하기 어렵습니다. 데이터 시각화는 복잡한 데이터를 이해하기 쉬운 이미지로 변환하여 인사이트를 발견하고, 설득력 있는 이야기를 전달하는 가장 강력한 도구입니다. 이 문서는 효과적인 데이터 시각화를 위해 알아야 할 핵심 유형을 소개합니다. 어떤 차트를 선택해야 할지 고민된다면, 데이터로 무엇을 보여주고 싶은지 먼저 자문해보세요. 항목 간의 '비교'가 중요한가요? 변수 간의 '관계'를 찾고 있나요? 데이터의 '분포'를 파악하고 싶나요? 아니면 전체에 대한 각 부분의 '구성' 비율을 보여줘야 하나요? 이 질문에 따라 가장 효과적인 시각화 유형이 결정됩니다.시간 시각화 (Temporal Visualization)시간의 흐름에 따른 데이터 변화를 표..

로지스틱 회귀: 오즈(Odds)와 오즈비(Odds Ratio)

로지스틱 회귀 분석을 이해하는 데 가장 기본이 되는 오즈(Odds)와 오즈비(Odds Ratio)에 대해 자세히 설명해 드리겠습니다. 이 두 개념은 확률(Probability)을 통계 모델(특히, 선형 모델)에서 더 다루기 쉬운 형태로 변환하고, 그 결과를 해석하는 데 핵심적인 역할을 합니다.1. 오즈 (Odds)오즈(Odds)는 "어떤 일이 일어나지 않을 확률 대비 일어날 확률의 비율"을 의미합니다.확률(Probability)과의 차이:확률 (P): 전체 시도 중 특정 사건이 일어날 비율 ($P$). 범위: [0, 1]오즈 (Odds): 실패 확률 대비 성공 확률의 비율. 범위: [0, $\infty$]수식: 어떤 사건이 일어날 확률을 $P$라고 할 때, 오즈는 다음과 같이 계산됩니다.$$Odds = ..

로지스틱 회귀: 오즈, 로짓 함수, 로지스틱 함수의 관계

오즈, 로짓 함수, 로지스틱 함수는 로지스틱 회귀가 선형 모델의 결과를 (0, 1) 사이의 확률로 어떻게 변환하는지를 보여주는 중요한 요소들입니다.1. 오즈 (Odds)오즈는 어떤 사건이 일어날 확률을 일어나지 않을 확률로 나눈 값입니다. 확률과 비슷한 개념이지만, 표현 방식이 다릅니다.확률 ($p$): 전체 시도 중 특정 사건이 일어날 비율 (0과 1 사이의 값)오즈: 성공 확률과 실패 확률의 비율 (0과 무한대 사이의 값)수식으로 표현하면 다음과 같습니다.$$\text{Odds} = \frac{p}{1-p}$$여기서 $p$는 사건이 일어날 확률입니다. 예시어떤 팀의 경기 승리 확률($p$)이 80% (0.8)라고 가정해 보겠습니다.승리하지 못할 확률($1-p$)은 20% (0.2)입니다.이때 오즈는 ..

로지스틱 회귀: 모델, 비용 함수, 파라미터 찾기

1. 문제 정의1.1. 데이터셋로지스틱 회귀에 대한 이해를 돕기 위하여 다음과 같이 두 종류의 데이터셋을 준비하고 설명을 진행합니다.Dataset-A: $$\begin{flalign} x&=\left[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20 \right] \\ y&=[0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1] \end{flalign}$$Dataset-B: $$\begin{flalign} x&=\left[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20 \right] \\ y&=[0,0,0,1,1,0,1,0,1,1,1,1,1,1,1,1,1,1,1,1] \end{flalign}$$위에서 ..