Funções f: Rⁿ → R

Cálculo multivariável a partir dos primeiros princípios

Uma função f: Rⁿ → R recebe um vetor e devolve um único número. O exemplo que move o machine learning é a loss: passa-lhe todos os pesos da rede e recebes um número que diz quão mal ela se está a sair. Todo o treino é uma caça pelo ponto mais baixo desta função.

Para duas entradas consegues visualizá-la: z = f(x, y) é uma superfície, uma paisagem de colinas e vales a flutuar acima do plano xy. A altura em cada (x, y) é o valor da função.

Imagine o ar numa sala: fique num ponto qualquer e um termómetro lê exatamente uma temperatura. Isso é uma função f: R² → R disfarçada: entra uma posição (x, y), e sai um único número (o calor nesse local). A sala inteira torna-se uma paisagem de áreas quentes e frias, mais alta perto do radiador, mais baixa junto à janela.

Onde isto aparece no MLQuando vês uma curva de loss descer durante o treino, estás a ver uma caminhada através de uma destas superfícies. A loss L(w₁, …, wₙ) é uma função Rⁿ → R sobre o espaço de pesos, com n na casa dos milhões ou milhares de milhões, e a curva no teu ecrã é apenas uma sombra unidimensional dessa caminhada. As imagens de 'mínimos planos vs. agudos' que os investigadores debatem são literalmente…

▶ Funções f: Rⁿ → R

← Vetores & Geometria de Rⁿ Funções f: Rⁿ → Rᵐ →