DV 2주차

통계와 시각화



September 14, 2022

!pip install opencv-python
import cv2 
import matplotlib.pyplot as plt 
import pandas as pd
import numpy as np

- 히스토그램 이퀄라이제이션(https://en.wikipedia.org/wiki/Histogram_equalization)

이미지 자료 다운로드

!wget https://upload.wikimedia.org/wikipedia/commons/0/08/Unequalized_Hawkes_Bay_NZ.jpg
img = cv2.imread('Unequalized_Hawkes_Bay_NZ.jpg')
img.shape  # 가로, 세로 픽셀, 채널(빨,녹,파..)
(683, 1024, 3)
이미지 자료의 이해

비밀1: 이미지는 사실 숫자들의 집합이다.

- 예시1

_img1 = np.array([0,30,90,120,150,180,210,240,255]).reshape(3,3)
array([[  0,  30,  90],
       [120, 150, 180],
       [210, 240, 255]])
plt.imshow(_img1, cmap='gray')
- 예시2

_img2 = np.array([0,20,40,60,80,100,120,140,160]).reshape(3,3)
array([[  0,  20,  40],
       [ 60,  80, 100],
       [120, 140, 160]])
plt.imshow(_img2, cmap='gray')
- 예시3

_img3=np.concatenate([_img1, _img2], axis=1)
array([[  0,  30,  90,   0,  20,  40],
       [120, 150, 180,  60,  80, 100],
       [210, 240, 255, 120, 140, 160]])
plt.imshow(_img3, cmap='gray')
비밀2: 칼라이미지는 red + green + blue 의 조합으로 표현가능 (다른방식도 가능)

- 예시1

r[:3,:3,0] = 255   
g[:3,2:,1] = 255 
b[2:,:,2] = 255
plt.imshow(r+g+b)   # 빛의 3원색..색의 3원색
- 예시2: R,G,B를 같은 비율로 섞으면 무채색이 된다.

r = np.array([0]*25*3).reshape(5,5,3) 
g = np.array([0]*25*3).reshape(5,5,3) 
b = np.array([0]*25*3).reshape(5,5,3) 
r[:3,:3,0] = 80   
g[:3,2:,1] = 80
b[2:,:,2] = 80 
- 예시3

(683, 1024, 3)
img_red = img * 0
img_green = img * 0
img_blue = img * 0
img_red[...,0] = img[...,0]
img_green[...,0] = img[...,1]
img_blue[...,0] = img[...,2]
히스토그램 이퀄라이제이션

- 이미지를 rgb로 각각 분리하고 각 색깔들의 히스토그램을 그려보자.

img_red[:,:,0].shape  # 위 699392 = 683 * 1024
(683, 1024)
  • 히스토그램 그림1
_fig = plt.hist(img_red[:,:,0].reshape(-1),bins=255, range=[0,255])
# 위의 숫자 보기 싫으니까 걍 _fig로 받으면 그림만 나온다.
# 빨간색 말고 그린, 블루도 다 같은 모양의 그림이 나옴

  • 히스토그램 그림 2
  • 120~200 사이에 값이 몰려있음
  • 그런데 컴퓨터가 표현가능한 색은 0~244..
  • 만약에 120-200까지의 분포된 모양은 그대로 유지하면서 range를 0-255까지 늘린다면?

- 분포의 모양은 대략적으로 유지하면서 값을 퍼트리자

img2_red = cv2.equalizeHist(img[...,0])
(array([59973., 57426., 82721., 73706., 61999., 76539., 72114., 72030.,
        72601., 70283.]),
 array([  0. ,  25.5,  51. ,  76.5, 102. , 127.5, 153. , 178.5, 204. ,
        229.5, 255. ]),
히스토그램이 평평해졌네?

_fig=plt.hist(img2_red.reshape(-1), bins=255, range=(0,255))

- red말고 다른채널에도 이와 같은 변환을 정의한다면?

img2=np.stack([img2_red,img2_red,img2_red],axis=-1)   # 색깔 3개 합치기 위해서
(683, 1024, 3)
plt.imshow(img) #원래이미지
히스토그램 이퀄라이제이션 (흑백버전)

img_black =  cv2.imread('Unequalized_Hawkes_Bay_NZ.jpg',0)
# 컴마하고 0하면 흑밸처리된다
(683, 1024)
img_black2 = cv2.equalizeHist(img_black)
HE(Histogram Equalization)을 이용하여 아래주소에 저장된 이미지의 명암비를 보존하라


!wget https://raw.githubusercontent.com/guebin/2021DV/master/_notebooks/hw_img.png
hw = cv2.imread('hw_img.png')
(531, 468, 3)
hw_2 = cv2.equalizeHist(hw[...,0])
(531, 468)
