행렬 곱셈 이해하기: AI 및 머신 러닝의 기본 개념

행렬 곱셈의 기초

행렬 곱셈의 핵심은 두 개의 행렬을 포함합니다: 하나는 크기가 \(3 \times 2\)인 행렬과 다른 하나는 크기가 \(2 \times 3\)인 행렬입니다. 첫 번째 행렬의 열 수(2)가 두 번째 행렬의 행 수(2)와 일치하기 때문에 이 두 행렬의 곱셈이 가능합니다. 이 규칙의 준수는 곱셈이 유효하기 위해 필수적입니다.

기억해야 할 주요 규칙

차원 호환성: 첫 번째 행렬의 열 수가 두 번째 행렬의 행 수와 같아야 합니다. 우리의 예시에서는 둘 다 2로, 곱셈이 가능합니다.
순서가 중요함: 행렬 곱셈은 교환 법칙이 성립하지 않습니다. 첫 번째 행렬을 두 번째 행렬과 곱하면, 두 번째 행렬을 첫 번째 행렬과 곱할 때와는 형태와 내용이 모두 다른 결과가 나옵니다. 구체적으로:
- \(3 \times 2\)에 \(2 \times 3\)을 곱하면 \(3 \times 3\) 행렬이 됩니다.
- 반대로, \(2 \times 3\)에 \(3 \times 2\)을 곱하면 \(2 \times 2\) 행렬이 됩니다.

이러한 차이는 행렬을 곱하는 순서의 중요성을 강조합니다.

곱셈 행렬 계산하기

두 행렬의 곱을 계산하려면 다음 단계를 따르세요:

행과 열 식별하기: 첫 번째 행렬의 행과 두 번째 행렬의 열을 가져옵니다.
곱셈 및 합산: 결과 행렬의 각 요소에 대해, 행과 열의 해당 요소를 곱한 후 합산합니다.

단계별 예제

다음 행렬을 고려해보세요:

\[ A = \begin{bmatrix} 2 & 5 \\ 1 & 3 \\ 4 & 6 \\ \end{bmatrix}_{3 \times 2}, \quad B = \begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ \end{bmatrix}_{2 \times 3} \]

곱 \(C = A \times B\)을 찾기 위해, 행렬 \(C\)의 각 요소에 대해 다음과 같은 계산을 따르세요:

첫 번째 행, 첫 번째 열:
\[ (2 \times 1) + (5 \times 4) = 2 + 20 = 22 \]
첫 번째 행, 두 번째 열:
\[ (2 \times 2) + (5 \times 5) = 4 + 25 = 29 \]
첫 번째 행, 세 번째 열:
\[ (2 \times 3) + (5 \times 6) = 6 + 30 = 36 \]

나머지 행과 열에도 같은 방법을 적용하면 완전한 곱셈 행렬을 얻을 수 있습니다:

\[ C = \begin{bmatrix} 22 & 29 & 36 \\ 13 & 17 & 21 \\ 28 & 38 & 48 \\ \end{bmatrix}_{3 \times 3} \]

파이썬에서 행렬 곱셈 구현하기

NumPy와 같은 라이브러리는 행렬 연산을 단순화하지만, 기본 과정을 이해하는 것이 유익합니다. 다음은 외부 라이브러리를 사용하지 않고 간단한 파이썬 구현 예제입니다:

# Define the matrices
A = [
    [2, 5],
    [1, 3],
    [4, 6]
]

B = [
    [1, 2, 3],
    [4, 5, 6]
]

# Dimensions
fr, fc = 3, 2  # A is 3x2
sr, sc = 2, 3  # B is 2x3

# Initialize the result matrix with zeros
C = [[0 for _ in range(sc)] for _ in range(fr)]

# Perform multiplication
for i in range(fr):
    for j in range(sc):
        for k in range(fc):
            C[i][j] += A[i][k] * B[k][j]

# Display the result
for row in C:
    print(row)

# Define the matrices

A = [

[2, 5],

[1, 3],

[4, 6]

]

B = [

[1, 2, 3],

[4, 5, 6]

]

# Dimensions

fr, fc = 3, 2 # A is 3x2

sr, sc = 2, 3 # B is 2x3

# Initialize the result matrix with zeros

C = [[0 for _ in range(sc)] for _ in range(fr)]

# Perform multiplication

for i in range(fr):

for j in range(sc):

for k in range(fc):

C[i][j] += A[i][k] * B[k][j]

# Display the result

for row in C:

print(row)

Output:

[22, 29, 36]
[13, 17, 21]
[28, 38, 48]

[22, 29, 36]

[13, 17, 21]

[28, 38, 48]

이 스크립트는 행과 열을 반복하여 두 행렬을 곱함으로써 필요한 곱셈과 덧셈을 수행하여 곱셈 행렬을 형성합니다.

결론

행렬 곱셈은 겉보기에는 단순해 보이지만, AI 및 머신 러닝에서 강력한 도구입니다. 이는 신경망과 데이터 변환에 사용되는 다양한 알고리즘의 기초가 됩니다. 그 원리를 이해하고 직접 구현할 수 있는 능력은 보다 복잡한 수학적 개념과 기술 응용을 이해하는 데 도움을 줍니다.

위에서 시연한 것처럼 행렬 곱셈의 메커니즘을 깊이 파고들면서, 학습자들은 AI 및 머신 러닝 분야에서 발전하기 위한 탄탄한 기초를 구축할 수 있습니다.

S04L03 – 행렬 곱셈