데이터 반출 없는 다 기관 협업 인공지능 학습 인프라

의료 AI/요로결석

STONE-09. DICOM 파일 형식과 구조

FedTensor 2026. 3. 16. 11:52

CT 이미지와 의료용 디지털 영상 표준인 DICOM(Digital Imaging and Communications in Medicine)은 단순히 이미지만 담고 있는 파일이 아니라, 환자 정보, 촬영 장비 설정, 3D 공간 좌표 등 방대한 메타데이터가 포함된 복합 데이터 구조체입니다.

 

인공지능 모델 개발에 필요한 핵심적인 파일 형식과 내부 구조를 정리합니다.

1. DICOM 파일 구조 (The Anatomy of a DICOM File)

DICOM 파일은 크게 Preamble(서문), Prefix(접두사), 그리고 수많은 Data Element(데이터 요소)들의 집합으로 구성됩니다.

구성 요소 설명
Preamble (128 bytes) 파일의 시작을 알리는 공간 (주로 0으로 채워짐).
Prefix (4 bytes) DICOM 파일임을 증명하는 문자열 "DICM".
Data Elements 태그(Tag), VR(Value Representation), 길이, 실제 값으로 구성된 데이터 단위.

Data Element의 4단계 구성

각 데이터 요소는 16진수 쌍으로 된 Tag를 주소로 가집니다.

  1. Tag: (Group Number, Element Number) 형태. 예: (0010, 0010)은 환자 이름.
  2. VR (Value Representation): 데이터 타입 (예: PN=Person Name, DA=Date, UI=Unique ID).
  3. Value Length: 데이터의 바이트 길이.
  4. Value Field: 실제 데이터 값.

2. 주요 DICOM 태그 (Metadata) 내용

연합학습 전처리 및 비식별화 시 반드시 확인해야 할 핵심 태그들입니다.

① 환자 및 기관 식별 (비식별화 대상)

  • (0010, 0010) Patient's Name
  • (0010, 0020) Patient ID
  • (0010, 0030) Patient's Birth Date
  • (0008, 0080) Institution Name (병원명)

② 촬영 및 장비 정보 (Non-IID 분석 시 중요)

  • (0008, 0070) Manufacturer (GE, Siemens, Philips 등 제조사)
  • (0018, 0060) KVP (X선 전압 - 이미지 대조도에 영향)
  • (0018, 0110) Radionuclide (조영제 사용 여부 등)

③ 이미지 해석 및 공간 정보 (AI 모델 입력값)

  • (0028, 0010/0011) Rows / Columns (이미지 해상도, 보통 512x512)
  • (0028, 0030) Pixel Spacing: 픽셀 하나가 실제 몸 안에서 몇 mm인지 (ESWL 결석 크기 측정 시 필수).
  • (0018, 0050) Slice Thickness: CT 단면의 두께.
  • (0028, 1052/1053) Rescale Intercept / Slope: 픽셀 값을 실제 물리량인 HU(Hounsfield Unit)로 변환하는 공식의 계수.
    • $HU = (\text{Pixel Value} \times \text{Rescale Slope}) + \text{Rescale Intercept}$

3. 픽셀 데이터 (Pixel Data) 형식

가장 용량이 큰 부분으로, 태그 (7FE0, 0010)에 저장됩니다.

  • 비트 심도 (Bit Depth): 일반 JPEG(8-bit)와 달리 의료 영상은 보통 12-bit 또는 16-bit를 사용합니다. 이는 미세한 조직 간의 밀도 차이(결석 vs 조직)를 구분하기 위함입니다.
  • 압축 방식:
    • Uncompressed (Explicit VR Little Endian): 가장 일반적이며 무손실.
    • JPEG Lossless / JPEG 2000: 용량을 줄이기 위해 압축된 형태.

4. DICOM 외 관련 파일 형식

CT 데이터를 다루다 보면 AI 학습을 위해 DICOM을 다른 형식으로 변환하기도 합니다.

형식 특징 용도
NIfTI (.nii) 여러 장의 DICOM 슬라이스를 하나의 3D 볼륨 파일로 병합. 딥러닝(Segmentation) 학습용 표준.
NRRD (.nrrd) NIfTI와 유사하며, 메타데이터 저장이 유연함. 3D Slicer 등 분석 소프트웨어용.
JSON/XML DICOM 헤더 정보만 따로 추출하여 저장한 텍스트 파일. 연합학습 서버에서 메타데이터 통계 분석용.