[선형대수] 벡터의 크기와 거리

2022. 12. 4. 15:20TIL💡/Linear Algebra

벡터의 크기(norm)

벡터의 시작점과 끝점 거리를 벡터의 크기라고 한다.

즉, 벡터의 크기 = 벡터의 길이 = 벡터의 norm = |v| = ||v||

 

ord = 1: L1을 사용하며, 컴퓨터비전에서 주로 쓴다.

x = [1, 2, 3]일 때  ||x|| = 1 + 2 + 3

 

ord = 2: L2를 사용하며, K-means clustering과 K-nearest neighbor 알고리즘에서 주로 쓴다.

x = [1, 2, 3]일 때 ||x|| = sqrt(1 + 2 + 3)

 

벡터의 거리/유사도

벡터의 거리(distance)는 두 벡터 간 거리를 의미한다.

예를 들어 개체 간 에 비슷한 정도를 나타낼 때는 벡터의 거리를 사용한다.

그렇다면 거리는 왜 중요할까?

거리는 일종의 유사도 개념이기 때문이다. 거리가 가까울수록 그 특성들이 비슷하다는 의미이기 때문에, 인공지능의 K-Nearest neighbor 같은 알고리즘에서도 널리 사용된다.

 

즉, 거리는 두 데이터가 얼마나 같은지를 나타내는 척도이다.

거리를 어덯게 측정하느냐에 따라 데이터의 유사도 정도가 달라질 수 있기 때문에 유사도 측정이 매우 중요하다.

유사도를 측정하는 기법은 다음과 같이 다양하기 때문에 상황에 맞는 적절한 기법을 선택하는 것이 중요하다.

 

Vector distance

  • Euclidean distance
  • Manhattan distance
  • Cosine distance

코사인 벡터

- 두 벡터의 방향이 같을수록 벡터가  비슷하다고 간주하여 두 벡터 간의 각인 코사인 값을 코사인 유사도라고 한다.

코사인 값은 각도가 0일 때 가장 크므로 두 벡터가 같은 방향을 가리키고 있으면 코사인 유사도가 최댓값 1을 갖는다.

 

 두 벡터가 이루는 각이 작을수록 유사도가 높고, 각이 클수록 유사도가 낮다.

 

 

행렬의 영 공간

행렬의 영 공간(null space)은 행렬 A와 벡터 x를 곱했을 때 그 결과가 0이 되는 모든 열 벡터 x의 집합을 의미한다.

즉 선형 방정식 A_x = 0의 해들이 이루는 공간을 의미한다.

 

 

참고

-http://www.findmean.com/%EC%88%98%ED%95%99/%EB%B2%A1%ED%84%B0/%EB%B2%A1%ED%84%B0%EC%9D%98-%EB%82%B4%EC%A0%81/

- https://wikidocs.net/24603