딥상어동의 딥한 생각

왜 로그 스케일을 사용하는가?

by 딥상어동의 딥한생각

목차

 

1. 지진 강도(로그 스케일 예시)
2. 왜 그래프를 그리는가?
3. 우리가 거리를 지각하는 방식
4. 지도에서 거리를 지각하는 방식
5. 로그 스케일이 더 멀리 볼 수 있는 이유

 

1. 지진 강도(로그 스케일 예시)

 

흔히, 지진 강도가 1이다, 2이다, 3이다와 같은 얘기를 들어보셨을 겁니다. 1과2, 4와5 절대적인 숫자 차이는 같습니다. 하지만, 두 차이가 실제로 같지 않다는 건 누구나 알고 계실겁니다. 1과2의 차이보다 4와5의 차이가 더 큽니다. 그럼에도, 이렇게 표기하는 이유는 무엇일까요?

 

2. 왜 그래프를 그리는가?

 

여기서 잠깐, 우리가 그래프를 그리는 이유에 대해서 생각해봅시다. 그래프를 그리는 이유는 차이를 드러내기 위해서 입니다.

 

x_values = np.arange(5)
y_values = np.ones(5)
plt.plot(x_values, y_values);

 

 

예를 들어, 굳이 이런 그래프를 그리고 싶으시지는 않을 겁니다. 왜냐하면, X축에 따라 Y값에 아무런 차이가 없기 때문입니다. 

 

3. 우리가 거리를 지각하는 방식

 

지금 이 글을 읽는 당신과 제가 10m 거리에 있다고 생각해봅시다. 사이에 벽이 있다면, 우리는 서로를 바라볼 수 있을 겁니다. 하지만, 제가 부산에 당신이 서울에 있다면, 우리는 서로를 바라볼 수 있을까요? 시력이 5억 정도 되는 외계인이 나타나지 않는 이상 저희는 서로를 바라볼 수 없을 겁니다. 

 

4. 지도가 거리를 지각하는 방식

 

하지만, 

 

 

서로는 볼 수 없어도 네이버지도에서는 부산과 서울의 거리가 어느 정도인지 대략적으로 알 수 있죠. 왜일까요? 실제 거리를 축소하여 나타냈기 때문입니다. 

 

https://www.wikiwand.com/ko/%EC%B6%95%EC%B2%99

 

축척 | Wikiwand

축척 은 실제의 거리를 지도 상에 축소하여 표시하였을 때의 축소 비율을 의미한다.

www.wikiwand.com

 

축척이라고 하죠. 실제 거리를 축소시킨 비율을 의미합니다. 어쨋든, "넓은 범위의 전체"를 보기 위해서는 실제 거리를 축소시킬 필요가 있습니다.

 

x_values = [1, 2, 3, 4, 5]
y_values = [10, 1000, 2000, 3000, 1000000000]
plt.scatter(x_values, y_values);

 

 

대각선 오른쪽 끝의 한 점만 제외하고 나머지 점들은 y값의 차이가 없어 보이죠?

 

x_values = [1, 2, 3, 4]
y_values = [10, 1000, 2000, 3000]
plt.scatter(x_values, y_values);

 

 

하지만 말입니다. 이상치 하나만 제거해주면 나머지 점들 사이에도 값의 차이가 있다는 것을 알 수 있습니다. 

 

그렇다면, 위와 같은 점들을 한 번에 나타내기 위해서는 어떻게 해야할까요?

 

5. 로그 스케일이 더 멀리 볼 수 있는 이유

 

이를 위해서는 로그 스케일을 사용해야 합니다.

 

x_values = [1, 2, 3, 4, 5]
y_values = [10, 1000, 2000, 3000, 1000000000]
fig, ax = plt.subplots()
ax.scatter(x_values, y_values)
ax.set_yscale('log')

 

 

Y축을 로그스케일로 변환하며 앞선, 그림에 비해 점들 간의 차이가 두드러진게 보이시나요? 왜 로그 스케일을 사용하여서 이렇게 점들 간의 차이가 두드러지게 되었을까요?

 

왜냐하면, 로그스케일은 상대적인 비율을 나타내기 때문입니다.

 

예를 들어, 1과2 그리고 2와3의 차이를 생각해봅시다. 절대적인 차이는 얼마인가요? 1로 둘다 같죠. 하지만, 비율로 생각해봅시다! 

 

2는 1에 비해 2배 증가한 값입니다.
하지만, 3은 2에 비해 1.5배 증가한 값입니다.

 

이 차이가 이해가시나요?

 

 

Y축의 로그스케일은 10의 n승으로 표시되어 이는데요. 이를 밑이 10인 로그 스케일로 환산했을 때 100과 10의 차이는 1입니다. 하지만, 절대적인 차이는 90이죠. 이처럼, 90이라는 절대적인 차이를 1이라는 값으로 줄여서 표현할 수 있는 겁니다. 

 

핵심 내용 두 가지를 정리하며 글을 마치겠습니다.

 

1. 로그 스케일은 상대적인 비율 차이를 나타낸다.
2. 절대적인 차이가 상대적인 비율로 줄어든 만큼 더 넓은 범위의 값을 나타낼 수 있다.
3. 로그 스케일의 수치는 비율 차이로 해석해야 한다.

 

블로그의 정보

딥상어동의 딥한생각

딥상어동의 딥한생각

활동하기