데이터 반출 없는 다기관 연합 인공지능 학습 플랫폼

개인정보보호 강화 기술 31

CMATH-07. 이산 로그 문제를 풀기 어려운 이유

이 문제의 어려움은 간단한 지름길이나 공식이 없어서, 답을 찾으려면 사실상 거의 모든 가능성을 하나하나 확인해야 한다는 데 있습니다.시계 위에서의 점프 게임먼저, 모듈러 연산을 거대한 눈금을 가진 시계라고 상상해 보겠습니다. 일반 시계는 눈금이 12개지만, 암호학에서 사용하는 시계(법, p)는 그 눈금의 수가 상상도 할 수 없을 만큼 많습니다.​쉬운 문제 (앞으로 점프하기)​3을 5번 곱하고 17로 나눈 나머지(3^5 mod 17)를 구하는 것은 쉽습니다. 이는 "17칸짜리 시계에서, 3배씩 점프하는 규칙으로 5번 뛰어라. 최종 위치는 어디인가?"와 같습니다.3^1 → 33^2 → 93^3 → 27 ≡ 10 (mod 17)3^4 → 10 * 3 = 30 ≡ 13 (mod 17)3^5 → 13 * 3 = ..

CMATH-06. 숫자가 아닌 원소들로 구성된 체(Field): 유한체, 함수체

우리가 흔히 아는 유리수, 실수, 복소수 집합 외에도 숫자가 아닌 원소들로 구성된 필드가 존재하며, 수학의 여러 분야에서 매우 중요하게 사용됩니다.​가장 대표적인 예는 유한체(Finite Field) 또는 갈루아 체(Galois Field)와 함수체(Function Field)입니다.유한체 (Finite Fields)유한체는 이름 그대로 원소의 개수가 유한한 필드입니다. 이 필드의 원소들은 우리가 일반적으로 생각하는 숫자가 아니라, 특정 규칙에 따라 연산되는 '기호'나 '상징'으로 볼 수 있습니다.​가장 단순한 유한체의 예는 $Z_p$ (또는 $GF(p)$)입니다. 여기서 $p$는 소수입니다. 이 필드의 원소는 {0,1,2,…,p−1} 이고, 모든 연산은 $p$로 나눈 나머지를 기준으로 하는 모듈러 연산..

CMATH-05. 수학의 '필드(Field)': 사칙연산이 자유로운 대수적 구조

수학에서 필드(Field), 우리말로는 체(體)는 덧셈, 뺄셈, 곱셈, 나눗셈(0으로 나누는 경우 제외)이라는 네 가지 기본 연산, 즉 사칙연산이 자유롭게 가능하고 우리가 일반적으로 사용하는 수의 체계와 유사한 성질을 만족하는 대수적 구조를 말합니다. 쉽게 말해, 필드는 우리가 일상적으로 숫자를 다루는 방식의 규칙들을 엄밀하게 정의해 놓은 집합이라고 할 수 있습니다. 필드가 되기 위해서는 특정 공리(Axiom)들을 만족해야 합니다. 이 공리들은 덧셈과 곱셈이라는 두 가지 연산에 대해 정의됩니다.필드의 공리 (Field Axioms)어떤 집합 F가 두 연산 '+'(덧셈)와 '·'(곱셈)에 대해 필드라고 불리기 위해서는 다음의 조건들을 모두 만족해야 합니다. 덧셈에 관한 공리 (F, +)는 가환군(Abeli..

CMATH-04. 타원 곡선과 순환 군: 암호 기술의 핵심 원리

타원 곡선 암호(Elliptic Curve Cryptography, ECC)는 현대 디지털 보안의 핵심 기술입니다. 비트코인과 같은 암호화폐는 물론, 우리가 매일 사용하는 메시징 앱의 종단간 암호화, 웹사이트 접속에 쓰이는 HTTPS 통신 등 수많은 곳에서 데이터를 안전하게 지키고 있죠. 이 기술의 심장에는 '타원 곡선'이라는 특별한 수학적 구조와 그것이 이루는 '순환 군(Cyclic Group)'이라는 특성이 자리 잡고 있습니다.​1. 타원 곡선: 점들의 특별한 덧셈 규칙타원 곡선은 특정 방정식(보통 $y^2 = x^3 + ax + b$ 형태)을 만족하는 점(x, y)들의 집합입니다. 이 곡선 위의 점들은 매우 독특하고 강력한 덧셈 규칙을 가지고 있습니다.타원 곡선 위에서 두 점의 덧셈 (출처: des..

CMATH-03. 군(Group), 가환 군, 순환 군

군은 추상대수학의 가장 기본적인 개념으로, 특정 규칙들을 만족하는 집합과 그 집합에 정의된 연산의 조합을 말합니다. 어떤 집합 G와 그 위의 이항 연산(예: 덧셈 '+' 또는 곱셈 '×')이 '그룹'이 되려면 다음 네 가지 기본 조건(공리)을 반드시 만족해야 합니다.군의 4가지 조건 (Group Axioms)​어떤 집합 G와 연산 '*'에 대해, 집합 안의 임의의 원소 a, b, c가 다음 규칙을 만족할 때 (G, *)를 군이라고 부릅니다.1. 연산에 대해 닫혀 있다 (Closure)a * b는 반드시 집합 G의 원소이다.집합 안의 어떤 두 원소를 가져와 연산해도 그 결과는 항상 그 집합 안에 있어야 합니다. 예를 들어, 두 정수를 더하면 항상 정수가 되므로, 정수 집합은 덧셈에 대해 닫혀 있습니다.2...

CMATH-02. 군(Group)과 체(Field)

​군: 더 일반적이고 단순한 구조군이 체보다 더 단순하고 일반적인 개념이며, 체를 정의하기 위한 기본적인 구성 요소로 사용됩니다.군: 단 하나의 연산과 네 가지 기본 규칙(닫힘, 결합법칙, 항등원, 역원)만 만족하면 성립합니다. 이 단순함 덕분에 대칭성을 가지는 거의 모든 대상(예: 도형의 회전, 분자 구조, 암호학)에서 군의 구조를 발견할 수 있습니다.체: 두 개의 연산(덧셈, 곱셈)이 필요하며, 각 연산에 대해 군과 유사한 규칙들(특히 교환법칙까지)을 만족해야 하고, 두 연산을 연결하는 분배법칙까지 성립해야 합니다. 조건이 훨씬 까다롭기 때문에, 체가 되는 대상은 군이 되는 대상보다 훨씬 제한적입니다.​쉽게 말해, 모든 체는 그 안에 군의 구조를 포함하고 있지만, 모든 군이 체가 되는 것은 아닙니다...

CMATH-01. 덧셈의 일반화된 수학적 정의

초등 산술에서 덧셈은 단순히 수를 합하는 과정이지만, 수학이 발전하면서 이 '더한다'는 행위의 본질적인 속성은 무엇인지, 그리고 이 속성을 숫자뿐만 아니라 벡터, 행렬, 함수 등 다른 대상에도 적용할 수 있는지 탐구하게 되었습니다. 이러한 탐구의 결과로, 현대 수학에서는 덧셈을 훨씬 더 추상적이고 강력한 개념으로 정의합니다. 덧셈의 수학적 정의는 크게 두 단계로 일반화됩니다. 첫 번째는 페아노 공리계를 이용한 자연수의 덧셈 정의이며, 두 번째는 이를 추상대수학의 구조로 확장하는 것입니다.1. 페아노 공리를 이용한 자연수의 덧셈 정의가장 근본적인 수 체계인 자연수(N=0,1,2,...)에서 덧셈은 다음의 두 가지 규칙으로 재귀적으로 정의됩니다. 이는 주세페 페아노가 제시한 공리계에 기반합니다.​ 여기서 S..

정보 보안 vs. PETs: 데이터를 '지키는' 기술과 '안전하게 활용하는' 기술

정보 보안 기술과 개인정보보호 강화 기술(PETs)은 데이터를 보호한다는 공통점을 갖지만, 목표와 범위, 핵심 기능에서 뚜렷한 차이를 보입니다. 정보 보안 기술이 외부의 위협으로부터 데이터라는 성을 지키는 '견고한 방패'라면, PETs는 성 안의 중요한 개인정보를 보호하면서도 안전하게 바깥과 교류(활용)할 수 있도록 길을 열어주는 '마법 열쇠'에 비유할 수 있습니다. 핵심 목표의 차이 가장 큰 차이는 기술이 추구하는 핵심 목표에 있습니다. 정보 보안 기술: 정보의 기밀성(Confidentiality), 무결성(Integrity), 가용성(Availability), 즉 '정보 보안의 3요소(CIA Triad)' 보장을 최우선으로 합니다. 허가되지 않은 접근을 막고, 데이터 위변조를 방지하며, 필요할 때 언..

DP-06. 질의 함수에 의해서만 결정되는 전역 민감도

전역 민감도(Global Sensitivity)는 데이터셋 자체와는 무관하게, 오직 질의(query) 함수에 의해서만 결정된다.1. 간단한 비유로 시작하기학교 선생님이 학생들의 키를 조사한다고 상상해 봅시다. 선생님은 두 가지 질문(질의)을 할 수 있습니다.질의 1(COUNT): "우리 반 학생은 총 몇 명인가요?"질의 2(SUM): "우리 반 학생들의 키(cm)를 모두 더하면 얼마인가요?"이때, '민감도'란 "학생 한 명이 전학을 오거나 갔을 때, 질문의 답이 얼마나 크게 변할 수 있는가?"를 의미합니다.질의 1(COUNT): 학생 한 명이 추가되거나 빠지면, '총 학생 수'는 언제나 정확히 1만큼 변합니다. 우리 반에 어떤 학생들이 있는지, 그들의 키가 몇인지는 전혀 중요하지 않습니다. 이 질의의 민..

DP-05. 차등 정보보호의 핵심 개념: 인접 데이터셋

차등 정보보호(Differential Privacy)는 "어떤 한 개인이 데이터셋에 포함되거나 포함되지 않더라도, 분석 결과는 거의 바뀌지 않아야 한다"는 강력한 개인정보보호 모델입니다. 여기서 '거의 바뀌지 않음'을 수학적으로 엄밀하게 정의하기 위해 사용되는 핵심 도구가 바로 인접 데이터셋(Adjacent Datasets)입니다. 간단히 말해, 인접 데이터셋이란 단 한 사람의 데이터만 다른 두 개의 데이터셋을 의미합니다.인접 데이터셋의 두 가지 주요 정의인접 데이터셋을 정의하는 방식은 크게 두 가지로 나뉩니다. 어떤 시나리오에서 개인정보를 보호하고 싶은지에 따라 적절한 정의를 사용합니다.1. 레코드 추가/삭제 (비제한적 인접성, Unbounded Adjacency)가장 일반적인 정의입니다. 두 데이터셋..