데이터 반출 없는 다기관 연합 인공지능 학습 플랫폼

2026/04/29 2

최근 각광받는 3가지 차원 축소 기법

전통적인 차원 축소 기법들이 데이터의 선형적 구조나 통계적 특성에 기반을 둔다면, 최근의 차원 축소 기법들은 비선형적(Non-linear) 구조, 데이터의 위상(Topology), 그리고 딥러닝을 활용하는 방향으로 발전해 왔습니다.​최근 각광받는 대표적인 차원 축소 기법 세 가지는 다음과 같습니다.1. t-SNE (t-Distributed Stochastic Neighbor Embedding)t-SNE는 고차원 공간에 있는 데이터 포인트 간의 유사도(지역적 구조)를 최대한 보존하면서 2차원이나 3차원과 같은 저차원 공간에 시각화하는 데 매우 강력한 성능을 보이는 기법입니다.핵심 아이디어: 고차원 공간에서 가까운 데이터 포인트들은 저차원 공간에서도 가깝게 유지되도록 만듭니다. 데이터 포인트 간의 유사성을 ..

데이터 분석을 위한 익명화 기법

익명화(Anonymization)는 개인 식별 정보를 제거하거나 변환하여 데이터의 유용성은 유지하면서 개인정보를 안전하게 보호하는 핵심 기술입니다. 본 문서는 성공적인 데이터 익명화를 위해 '왜' 익명화가 필요한지 이해하고, 보호 수준을 측정하는 '무엇(프라이버시 모델)'을 배우며, 이를 구현하는 '어떻게(처리 기법)'를 단계적으로 알아봅니다.1. 주요 용어 정리익명화 기법을 이해하기 전에 몇 가지 핵심 용어를 알아두는 것이 좋습니다.식별자 (Identifier): 그 자체만으로 특정 개인을 바로 알아볼 수 있는 정보입니다. (예: 주민등록번호, 여권번호, 이름, 전화번호)준식별자 (Quasi-identifier): 단독으로는 개인을 식별하기 어렵지만, 다른 정보와 결합하면 특정 개인을 추론할 수 있는 ..