SSIM이란? 이미지 품질 평가를 위한 구조적 유사성 지수 완벽 정리

1. SSIM(구조적 유사성 지수) 소개

SSIM(Structural Similarity Index Measure)은 두 이미지 간의 화질 손실량을 평가하는 지표로, 인간의 시각적 특성을 반영하여 이미지의 구조적 유사성을 정량적으로 측정하는 방법입니다. 기존의 픽셀 단위 평가 방식인 PSNR과 달리, 휘도(Luminance), 대비(Contrast), 구조(Structure)의 세 가지 요소를 기반으로 이미지를 평가합니다.

2. SSIM의 핵심 요소

SSIM은 다음의 세 가지 요소를 통해 계산됩니다.

  • 휘도(Luminance)

$$ l(x,y) = \frac{2\mu_x\mu_y + C_1}{\mu_x^2 + \mu_y^2 + C_1} $$

  • 대비(Contrast)

$$ c(x,y) = \frac{2\sigma_x\sigma_y + C_2}{\sigma_x^2 + \sigma_y^2 + C_2} $$

  • 구조(Structure)

$$ s(x,y) = \frac{\sigma_{xy} + C_3}{\sigma_x\sigma_y + C_3} $$

각각의 기호는 다음과 같은 의미를 가집니다.

  • \(\mu_x, \mu_y\): 각 이미지의 평균값
  • \(\sigma_x, \sigma_y\): 각 이미지의 표준편차
  • \(\sigma_{xy}\): 두 이미지 간 공분산

여기서 \(C_1, C_2, C_3\)은 작은 상수로, 보통 다음과 같이 설정됩니다.

$$ C_1=(K_1L)^2, \quad C_2=(K_2L)^2, \quad C_3=C_2/2 $$

\(K_1=0.01\), \(K_2=0.03\), \(L\)은 픽셀의 정보 최대값(흑백 255, RGB 255)입니다.

3. SSIM 계산 방법

일반적으로 SSIM은 위의 세 가지 요소를 곱하여 다음과 같이 표현됩니다.

$$ SSIM(x,y)=l(x,y)^\alpha \cdot c(x,y)^\beta \cdot s(x,y)^\gamma $$

일반적인 설정에서는 \(\alpha=\beta=\gamma=1\)로 가정하여 아래와 같은 간소화된 형태로 표현됩니다.

$$ SSIM(x, y)=\frac{(2\mu_x\mu_y+C_1)(2\sigma_{xy}+C_2)}{(\mu_x^2+\mu_y^2+C_1)(\sigma_x^2+\sigma_y^2+C_2)} $$

SSIM 값 해석 방법

원본 이미지를 스케일(50%, 30%, 20%, 10%, 5%)별로 축소하면서 SSIM 값이 감소하는 과정을 나타낸 흑백 사진의 비교 예시입니다.

SSIM 값은 -1에서 1 사이의 값을 가지며,

  • 1에 가까울수록 이미지 간 유사성이 매우 높음
  • 0에 가까우면 이미지 간 상관관계가 거의 없음
  • 음수 값은 이미지 간 음의 상관관계를 의미(실제 이미지 처리에서는 매우 드뭅니다)
SSIM 값 범위 이미지 유사성
0.95 ~ 1 매우 높은 유사성
0.75 ~ 0.95 높은 유사성
0.5 ~ 0.75 중간 유사성
0 ~ 0.5 낮은 유사성
-1 ~ 0 유사성 없음(부정적 관계)

4. MSSIM(Mean SSIM)이란?

MSSIM은 SSIM을 전체 이미지가 아닌 작은 지역(Window Patch)으로 나누어 평가하는 방법입니다. MSSIM은 아래 수식과 같이 정의됩니다.

$$ MSSIM(x,y)=\frac{1}{M}\sum_{j=1}^{M}SSIM(x_j,y_j) $$

  • M은 Window Patch의 총 개수
  • 이를 통해 이미지의 국소적 품질 변화까지 반영 가능합니다.

5. SSIM 활용 분야

SSIM은 다음과 같은 다양한 영상처리 분야에서 사용됩니다.

  • 영상 압축 알고리즘 평가
  • 이미지 복원 및 화질 향상 평가
  • 딥러닝 및 컴퓨터 비전 모델 성능 평가

6. SSIM의 장단점

장점

  • 인간의 시각적 인지를 잘 반영
  • 구조적 유사성을 효과적으로 평가 가능
  • 직관적이며 이해하기 쉬움

단점

  • 미세한 텍스처나 컬러의 미세 차이를 잘 감지하지 못함
  • 특정 영역이 균일한 값으로 채워질 때 정확한 평가가 어려움

7. 결론

SSIM은 인간의 시각 인지 특성을 잘 반영하는 평가 지표로, 단순히 픽셀 단위로 측정하는 PSNR보다 실제 시각적 품질 평가에서 더 신뢰성 있는 결과를 제공합니다. MSSIM과 같이 지역적인 평가를 활용하면 더욱 정밀한 평가가 가능합니다. 다양한 영상처리 분야에서 필수적인 품질 평가 기준으로 널리 활용되고 있습니다.