CT 이미지와 의료용 디지털 영상 표준인 DICOM(Digital Imaging and Communications in Medicine)은 단순히 이미지만 담고 있는 파일이 아니라, 환자 정보, 촬영 장비 설정, 3D 공간 좌표 등 방대한 메타데이터가 포함된 복합 데이터 구조체입니다.
인공지능 모델 개발에 필요한 핵심적인 파일 형식과 내부 구조를 정리합니다.
1. DICOM 파일 구조 (The Anatomy of a DICOM File)
DICOM 파일은 크게 Preamble(서문), Prefix(접두사), 그리고 수많은 Data Element(데이터 요소)들의 집합으로 구성됩니다.
| 구성 요소 | 설명 |
| Preamble (128 bytes) | 파일의 시작을 알리는 공간 (주로 0으로 채워짐). |
| Prefix (4 bytes) | DICOM 파일임을 증명하는 문자열 "DICM". |
| Data Elements | 태그(Tag), VR(Value Representation), 길이, 실제 값으로 구성된 데이터 단위. |
Data Element의 4단계 구성
각 데이터 요소는 16진수 쌍으로 된 Tag를 주소로 가집니다.
- Tag: (Group Number, Element Number) 형태. 예: (0010, 0010)은 환자 이름.
- VR (Value Representation): 데이터 타입 (예: PN=Person Name, DA=Date, UI=Unique ID).
- Value Length: 데이터의 바이트 길이.
- Value Field: 실제 데이터 값.
2. 주요 DICOM 태그 (Metadata) 내용
연합학습 전처리 및 비식별화 시 반드시 확인해야 할 핵심 태그들입니다.
① 환자 및 기관 식별 (비식별화 대상)
- (0010, 0010) Patient's Name
- (0010, 0020) Patient ID
- (0010, 0030) Patient's Birth Date
- (0008, 0080) Institution Name (병원명)
② 촬영 및 장비 정보 (Non-IID 분석 시 중요)
- (0008, 0070) Manufacturer (GE, Siemens, Philips 등 제조사)
- (0018, 0060) KVP (X선 전압 - 이미지 대조도에 영향)
- (0018, 0110) Radionuclide (조영제 사용 여부 등)
③ 이미지 해석 및 공간 정보 (AI 모델 입력값)
- (0028, 0010/0011) Rows / Columns (이미지 해상도, 보통 512x512)
- (0028, 0030) Pixel Spacing: 픽셀 하나가 실제 몸 안에서 몇 mm인지 (ESWL 결석 크기 측정 시 필수).
- (0018, 0050) Slice Thickness: CT 단면의 두께.
- (0028, 1052/1053) Rescale Intercept / Slope: 픽셀 값을 실제 물리량인 HU(Hounsfield Unit)로 변환하는 공식의 계수.
- $HU = (\text{Pixel Value} \times \text{Rescale Slope}) + \text{Rescale Intercept}$
3. 픽셀 데이터 (Pixel Data) 형식
가장 용량이 큰 부분으로, 태그 (7FE0, 0010)에 저장됩니다.
- 비트 심도 (Bit Depth): 일반 JPEG(8-bit)와 달리 의료 영상은 보통 12-bit 또는 16-bit를 사용합니다. 이는 미세한 조직 간의 밀도 차이(결석 vs 조직)를 구분하기 위함입니다.
- 압축 방식:
- Uncompressed (Explicit VR Little Endian): 가장 일반적이며 무손실.
- JPEG Lossless / JPEG 2000: 용량을 줄이기 위해 압축된 형태.
4. DICOM 외 관련 파일 형식
CT 데이터를 다루다 보면 AI 학습을 위해 DICOM을 다른 형식으로 변환하기도 합니다.
| 형식 | 특징 | 용도 |
| NIfTI (.nii) | 여러 장의 DICOM 슬라이스를 하나의 3D 볼륨 파일로 병합. | 딥러닝(Segmentation) 학습용 표준. |
| NRRD (.nrrd) | NIfTI와 유사하며, 메타데이터 저장이 유연함. | 3D Slicer 등 분석 소프트웨어용. |
| JSON/XML | DICOM 헤더 정보만 따로 추출하여 저장한 텍스트 파일. | 연합학습 서버에서 메타데이터 통계 분석용. |
'의료 AI > 요로결석' 카테고리의 다른 글
| STONE-08. CT 이미지에서 개인 식별 정보 제거 (0) | 2026.03.16 |
|---|---|
| STONE-07. 요로결석 CT 데이터셋: KSSD2025 & Mendeley Data (0) | 2026.03.16 |
| STONE-06. CT 이미지로부터 결석을 추출하는 기술 및 모델 소개 (0) | 2026.03.15 |
| STONE-05. 라디오믹스(Radiomics): 의료 영상을 '빅데이터'로 변환하는 기술 (0) | 2026.01.20 |
| STONE-04. AI는 요로결석 치료 성공을 예측할 수 있을까? (0) | 2026.01.20 |