유클리디안 거리(Euclidean Distance)란 무엇인가?
1. 유클리디안 거리란?
유클리디안 거리(Euclidean Distance)는 두 점 사이의 “직선 거리”를 측정하는 수학적 척도입니다. 이는 우리가 일상적으로 사용하는 “직선 거리” 개념과 동일하며, 가장 간단하고 직관적인 거리 계산 방법 중 하나입니다. 이 개념은 피타고라스의 정리에서 유래하며, 2차원뿐만 아니라 n차원 공간에서도 적용됩니다.
2. 유클리디안 거리 공식
두 점 $𝑃(𝑥_1, 𝑦_1)$와 $𝑄(𝑥_2, 𝑦_2)$ 사이의 유클리디안 거리는 다음과 같이 계산됩니다:
\[d(P,Q) = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2}\]일반화된 공식 (n차원 공간)
n차원 공간에서 두 점 $P(x_1, x_2, …, x_n)$과 $Q(y_1, y_2, …, y_n)$ 사이의 유클리디안 거리는 다음과 같습니다:
\[d(P,Q) = \sqrt{\sum\limits_{i=1}^n (x_i - y_i)^2}\]3. 유클리디안 거리의 특징
- 직선 거리: 두 점 사이의 최단 거리를 측정합니다.
- 대칭성: $d(P, Q) = d(Q,P)$ (두 점 사이의 거리는 방향에 영향을 받지 않음).
- 비음성성: 거리는 항상 0 이상이며, $d(P, Q) = 0$은 두 점이 같은 경우입니다.
- 직관적 이해: 실생활에서 가장 익숙한 거리 개념입니다.
4. 유클리디안 거리의 사용 사례
1) 데이터 분석
유클리디안 거리는 데이터의 유사성을 측정하는 데 사용됩니다. 예를 들어, 클러스터링 알고리즘(예: K-평균)에서 데이터 포인트 간 거리를 계산하여 유사한 그룹으로 묶습니다.
2) 컴퓨터 비전
이미지 픽셀 값을 벡터로 변환한 후, 유클리디안 거리를 사용해 두 이미지의 유사도를 측정합니다.
3) 추천 시스템
유클리디안 거리를 사용하여 사용자 선호도를 벡터로 표현하고, 유사한 선호도를 가진 사용자 간 거리를 계산하여 추천 항목을 도출합니다.
4) 로봇 공학
로봇이 특정 좌표에서 목표 지점까지 이동해야 할 때, 유클리디안 거리를 활용하여 최단 경로를 계산합니다.
5. 유클리디안 거리의 한계
- 스케일 문제
- 각 축의 값 범위가 다를 경우(예: 키와 몸무게), 특정 축이 결과에 과도한 영향을 줄 수 있습니다. 이를 방지하려면 데이터를 정규화(Scaling)해야 합니다.
- 고차원 공간에서의 비효율성
- 차원이 증가하면 거리 계산의 효율성이 떨어지며, 모든 점이 유사한 거리를 가지는 “차원의 저주(Curse of Dimensionality)” 문제가 발생할 수 있습니다.
- 비선형 데이터 처리 한계
- 데이터 간 관계가 비선형적일 경우, 단순 유클리디안 거리로는 유사성을 제대로 측정하지 못할 수 있습니다.
6. 유클리디안 거리 계산 예제
2차원 공간에서
점 $A(2, 3)$와 $B(5,7)$의 유클리디안 거리:
\[d(A, B) = \sqrt{(5 - 2)^2 + (7 - 3)^2} = \sqrt{3^2 + 4^2} = \sqrt{9 + 16} = 5\]3차원 공간에서
점 $A(1, 2, 3)$과 $B(4, 6, 8)$의 유클리디안 거리:
\[d(A, B) = \sqrt{(4 - 1)^2 + (6 - 2)^2 + (8 - 3)^2} = \sqrt{3^2 + 4^2 + 5^2} = \sqrt 50 \approx 7.07\]7. 유클리디안 거리와 다른 거리 척도 비교
|거리 척도|설명|특징| |—|—–|—–| |유클리디안 거리|두 점 간의 직선 거리|직관적이고 간단한 거리 계산| |맨해튼 거리|수직 및 수평 선에 따라 이동한 거리|도시 거리처럼 직선 이동 제한| |코사인 유사도|두 벡터 간의 각도 기반 유사성 측정|방향이 중요한 겨우 유용| |마할라노비스 거리|데이터 분포를 고려한 거리|통곚거 분석에서 자주 사용|
결론
유클리디안 거리는 가장 단순하면서도 강력한 거리 측정 방법 중 하나입니다. 특히 데이터 간의 유사성을 빠르게 계산하고, 다양한 애플리케이션에서 유용하게 사용됩니다. 그러나 데이터의 스케일이나 고차원 문제를 다룰 때는 추가적인 전처리나 다른 거리 척도와의 조합이 필요할 수 있습니다.