데이터 반출 없는 다기관 연합 인공지능 학습 플랫폼

DICOM 2

09. DICOM 파일 형식과 구조

CT 이미지와 의료용 디지털 영상 표준인 DICOM(Digital Imaging and Communications in Medicine)은 단순히 이미지만 담고 있는 파일이 아니라, 환자 정보, 촬영 장비 설정, 3D 공간 좌표 등 방대한 메타데이터가 포함된 복합 데이터 구조체입니다. 인공지능 모델 개발에 필요한 핵심적인 파일 형식과 내부 구조를 정리합니다.1. DICOM 파일 구조 (The Anatomy of a DICOM File)DICOM 파일은 크게 Preamble(서문), Prefix(접두사), 그리고 수많은 Data Element(데이터 요소)들의 집합으로 구성됩니다.구성 요소설명Preamble (128 bytes)파일의 시작을 알리는 공간 (주로 0으로 채워짐).Prefix (4 bytes)..

08. CT 이미지에서 개인 식별 정보 제거

의료 데이터, 특히 CT 이미지에서 개인 식별 정보(PII: Personally Identifiable Information)를 제거하는 것은 데이터 활용과 보호 사이의 균형을 맞추는 핵심 작업입니다. 인공지능 학습에서 이 과정은 데이터 비식별화(De-identification) 및 익명화(Anonymization)의 필수 단계가 됩니다. CT 이미지의 비식별화는 크게 두 가지 영역에서 이루어집니다.1. DICOM 메타데이터 비식별화 (Header Cleaning)대부분의 CT 이미지는 DICOM(Digital Imaging and Communications in Medicine) 형식으로 저장됩니다. 이 파일의 헤더에는 수많은 태그 정보가 포함되어 있습니다.직접 식별자 제거: 환자 성명(Patient ..