제1원리에서 출발하는 다변수 미적분
함수 f: Rⁿ → R는 벡터를 입력으로 받아 하나의 숫자를 돌려줍니다. 기계학습을 움직이는 대표적인 예는 손실입니다. 네트워크의 모든 가중치를 입력하면, 지금 얼마나 잘못하고 있는지를 알려 주는 하나의 숫자가 나옵니다. 학습 전체는 결국 이 함수의 가장 낮은 지점을 찾아가는 과정입니다.
입력이 두 개일 때는 실제로 그림으로 나타낼 수 있습니다. z = f(x, y)는 하나의 곡면, 즉 xy-평면 위에 떠 있는 언덕과 골짜기의 풍경입니다. 각 (x, y)에서의 높이가 바로 함수의 값입니다.
방 안의 공기를 상상해 보세요: 어느 지점에 서든 온도계는 정확히 하나의 온도를 읽습니다. 이것은 숨겨진 형태의 함수 f: R² → R입니다: 위치 (x, y)가 들어가면, 단일 숫자(그곳의 따뜻함)가 나옵니다. 방 전체가 라디에이터 근처에서는 더 높고 창문 옆에서는 더 낮은 따뜻하고 시원한 구역들의 풍경이 됩니다.