분류 전체보기 127

SMPC-01. 보안 다자간 계산(SMPC) 소개 및 주요 기법 비교

1. 보안 다자간 계산(Secure Multi-Party Computation, SMPC)이란?현대 사회에서 데이터는 막대한 가치를 지니지만, 동시에 개인정보, 기업비밀 등 민감한 정보를 포함하고 있어 그 공유와 활용에 큰 제약이 따릅니다. 보안 다자간 계산(SMPC)은 이러한 딜레마를 해결하는 혁신적인 암호 기술로, 서로 신뢰하지 않는 여러 참여자가 각자의 데이터를 공개하지 않고도 공동으로 분석하고 활용할 수 있게 해줍니다. '데이터를 사용하되, 노출하지 않는다(Compute on data without seeing it)'는 원칙을 실현하여, 프라이버시를 지키면서 데이터의 가치를 극대화하는 것을 목표로 합니다. 신뢰할 수 있는 제3자(TTP, Trusted Third Party)가 존재한다면 이 문제..

유방암 양성예측도, 베이지안 추론으로 설명하기

이 글에서는 유방암 진단 결과가 양성으로 나온 경우 실제로 유방암에 걸렸을 확률을 계산하는 식을 유도합니다. 또한 진단을 전후하여 달라지는 확률에 대하여 베이지안 추론 방식으로 설명해 보고자 합니다.문제 정의관심 대상군에 속하는 여성의 1%가 유방암에 걸린다고 알려져 있습니다. 병원을 방문한 어떤 여성의 진단 결과가 양성으로 나왔고 진단에 사용한 장비의 민감도는 90 %, 특이도는 85% 입니다. 그렇다면 그 여성이 실제로 유방암에 걸렸을 확률은 얼마입니까?진단 장비의 성능혼동행렬(Confusion Matrix)진단 장비의 성능을 파악하기 위하여 질병의 유무를 알고 있는 사람들을 대상으로 진단을 수행하고 아래와 같이 혼동행렬을 작성합니다.A: 진양성(True Positive) 수B: 위양성(False P..

몬티 홀 문제, 베이지안 추론으로 설명하기

몬티 홀 문제를 풀고 이에 대하여 베이지안 추론 방식으로 설명해 보고자 합니다.몬티 홀 문제세 개의 문이 있고 한 개의 문 뒤에는 자동차, 나머지 두 개의 문 뒤에는 염소가 있습니다. 각각의 문에는 1, 2, 3으로 번호가 붙어 있고 문이 닫힌 상태에서는 뒤에 무엇이 있는지 알 수 없습니다. 게임쇼 참여자가 1번을 선택하였습니다. 이어서 문 뒤에 무엇이 있는지 알고 있는 진행자는 3번 문을 열었고 그 뒤에는 염소가 있었습니다. 게임쇼 참여자에게 선택을 2번으로 바꿀 수 있는 기회가 주어집니다. 그렇다면 1번에 머무르는 것보다 2번으로 바꾸는 것이 우승할 확률을 더 높여줄까요? 이때 선택을 바꾸는 것이 자동차를 얻을 확률을 두 배로 높여주기 때문에 유리합니다.왜 선택을 바꾸는 것이 유리할까요?많은 사람들이..

믿음의 정량화 및 수정 과정

인간은 살아가면서 수많은 결정을 내리고 그것이 기대한 결과로 이어지기를 바랍니다.부서 회식 장소 결정하기영어 학원 등록 여부 결정하기이사할 집 결정하기결혼할 배우자 결정하기입사할 회사 결정하기결정에 따르는 결과를 완전히 운에 맡기는 것이 아니라면 결정을 내리기 전까지 거치는 과정을 아래와 같은 다이어그램으로 표현할 수 있습니다. 위에서 사실(fact), 확률(probability) 대신에 굳이 믿음(belief)이라는 용어를 사용한 이유는 충분한 증거가 없는 상태에서 무엇이 어떠하다라고 생각하는 것은 믿음에 가깝기 때문입니다. 한편으로는 믿음이라고 표현함으로써 얻게 되는 이득 중의 하나는 구체적인 적용을 시도할 때 엄밀함을 추구하지 않아도 된다는 것입니다. 우리는 일상 대화에서 믿음의 정도를 백분율로 표..

파동함수의 역사: 아이디어에서 양자역학의 중심으로

파동함수는 어느 날 갑자기 등장한 개념이 아니라, 20세기 초반 물리학의 혁명적인 흐름 속에서 탄생했습니다. 그 도입 과정은 크게 세 단계로 나누어 볼 수 있습니다.1단계: 드브로이의 담대한 제안 - "모든 물질은 파동이다" (1924년)파동함수의 역사는 프랑스 물리학자 루이 드브로이(Louis de Broglie)의 혁명적인 아이디어에서 시작됩니다. 당시 빛이 입자성과 파동성을 모두 가진다는 '광전 효과'와 '회절 현상'이 알려져 있었습니다. 드브로이는 여기서 더 나아가 자연의 대칭성을 믿고, 빛뿐만 아니라 전자와 같은 모든 물질 또한 입자인 동시에 파동의 성질을 가질 것이라고 주장했습니다. 이를 물질파(matter wave) 가설이라고 부릅니다. 그는 움직이는 모든 입자가 그 운동량($p$)에 반비례..

물리/양자역학 2025.10.08

04. 해밀턴 역학 개요

뉴턴의 운동 법칙 F=ma는 '어떤 힘이 가해졌을 때, 물체는 다음 순간 어떻게 움직이는가?'라는 질문에 답하며 운동을 순간적으로 설명합니다. 하지만 '물체는 왜 시작점에서 도착점까지 바로 그 경로를 따라가야만 했는가?'라는 더 근본적인 질문에 답하는 우아한 관점이 있습니다. 바로 '최소 작용의 원리'와 이를 바탕으로 전개되는 '해밀턴 역학'입니다. 이들은 "자연은 가장 효율적인 경로를 선택한다"는 하나의 대원칙으로부터 운동 법칙을 유도해냅니다.1. 최소 작용의 원리 (Principle of Least Action)자연 현상의 근본에는 '경제성'이 있다는 철학적인 아이디어에서 출발합니다. 물체가 한 지점에서 다른 지점으로 이동할 때, 가능한 무수히 많은 경로 중에서 실제 자연이 선택하는 경로는 '작용(A..

물리/고전역학 2025.10.08

DP-02. 재식별 위험의 정량화를 위한 실마리

재식별 위험, 어떻게 측정할 수 있을까?데이터가 공개될 때 우리가 느끼는 '왠지 모를 불안감'을 숫자로 측정할 수 있다면 어떨까요? 놀랍게도, 프라이버시 보호 기술은 그 막연한 불안감을 구체적인 '위험도'로 계산하고 관리하는 것을 목표로 합니다. 그 실마리는 '한 개인의 정보가 전체 결과에 미치는 영향'을 살펴보는 데 있습니다. 데이터베이스에 내 정보가 추가됨으로 인해 통계 결과가 크게 달라진다면, 역으로 그 결과를 통해 나를 특정하기 쉬워진다는 의미입니다. 반대로 내 정보가 추가되어도 결과에 거의 변화가 없다면, 나는 수많은 데이터 속에 안전하게 숨을 수 있습니다. 즉, 재식별 위험을 낮추려면 개인의 정보가 결과에 미치는 영향(차이)을 최소화해야 합니다.상황 1: N명의 데이터베이스 → 통계 결과 A상..

DP-01. 재식별 위험: 보이지 않는 위협

데이터의 가치와 공개의 역설데이터를 완벽하게 보호하는 가장 확실한 방법은 아무에게도 공개하지 않는 것입니다. 하지만 이는 데이터가 가진 무한한 잠재력을 사장시키는 것과 같습니다. 결국 데이터의 가치를 실현하기 위해 '공개'는 피할 수 없는 선택이며, 바로 그 순간 '재식별'이라는 피할 수 없는 위험이 뒤따릅니다. 이름이나 주민등록번호 같은 명백한 식별자를 제거하는 것만으로는 충분하지 않습니다. 언뜻 사소해 보이는 여러 정보가 조각 그림 맞추듯 결합되면, 결국 특정 개인을 가리키는 '재식별'의 화살이 될 수 있기 때문입니다. 이 위험이 얼마나 현실적인지, 구체적인 시나리오를 통해 살펴보겠습니다.평범한 통계에 숨겨진 위험어느 작은 마을에 1,000명이 살고 있습니다. 보건 당국이 이 마을의 희귀 질병 유병률..

DP-17. 가우시안 노이즈에서 프라이버시 손실 관계식 유도

프라이버시 손실 관계 수식 유도차등 정보보호에서 가우시안 메커니즘이 (ε, δ)-DP를 만족할 때, 다음 파라미터들 간의 관계는 어떻게 될까요?$ε$: 프라이버시 손실 예산$δ$: ε-DP가 깨질 수 있는 확률 (프라이버시 손실 예산 초과 확률)$S$: L2-민감도 (인접한 두 데이터셋 $D_1$, $D_2$에 대한 질의 함수 $f$의 결과값 차이를 L2-놈으로 정의할 때 이들 사이의 최댓값)$$S=\max_{D_1,D_2}||f(D_1)-f(D_2)||_2$$$σ$: 노이즈 표준편차프라이버시 손실은 데이터셋 $D_1$와 $D_2$(하나의 레코드만 차이나는 인접 데이터셋)에 대한 질의 함수 $f$의 결과 $o$가 나올 확률의 비율로 정의됩니다. 여기에 로그 함수를 적용하여 확률 변수 $L$을 다음과 같이..

놈(Norm)의 정의와 활용

1. 놈의 도입 배경: '거리'와 '크기'의 일반화우리는 초중고 수학 과정에서 피타고라스 정리를 이용해 2차원 또는 3차원 공간에서 두 점 사이의 거리나 화살표(벡터)의 길이를 구하는 법을 배웠습니다. 예를 들어, 좌표평면 위의 점 (3, 4)에서 원점 (0, 0)까지의 거리는 $\sqrt{3^2+4^2}=5$ 라고 쉽게 계산할 수 있죠. 수학자들은 이러한 '거리' 또는 '크기'라는 직관적인 개념을 우리가 일상적으로 다루는 2차원, 3차원 공간을 넘어 훨씬 더 복잡하고 추상적인 '벡터 공간(Vector Space)'으로 확장하고 싶었습니다. 예를 들어, '함수'들도 하나의 벡터 공간을 이룰 수 있는데, "두 함수의 거리는 얼마일까?" 또는 "이 함수의 전체적인 크기는 얼마일까?"와 같은 질문에 답하기 위..