Saltar al contenido principal

Videos de RedesNeuronales

Videos etiquetados con "RedesNeuronales"

RedesNeuronales 1 videos

Alinear y Memorizar: La Clave del Aprendizaje en Redes Neuronales Profundas
16:23

Alinear y Memorizar: La Clave del Aprendizaje en Redes Neuronales Profundas

Este estudio explora una alternativa eficiente y biológicamente plausible a la retropropagación para entrenar redes neuronales profundas, conocida como Alineación de Retroalimentación Directa (DFA). A pesar de su éxito en modelos como los Transformers, la DFA falla notablemente en redes convolucionales, y este trabajo busca desentrañar el porqué de esta discrepancia. La investigación propone una nueva teoría que describe el aprendizaje con algoritmos de alineación de retroalimentación. Se demuestra que el aprendizaje se desarrolla en dos fases distintas: una fase inicial de 'alineación', donde el modelo ajusta sus pesos para alinear el gradiente aproximado con el gradiente real de la función de pérdida, seguida de una fase de 'memorización', en la que el modelo se centra en ajustar los datos para minimizar el error. Este proceso de 'alinear y luego memorizar' no solo explica por qué la DFA converge naturalmente a soluciones que maximizan la alineación del gradiente, sino que también ofrece una explicación para su fallo en las redes neuronales convolucionales. Los hallazgos, respaldados por experimentos numéricos, muestran cómo este mecanismo opera secuencialmente desde las capas inferiores hasta las superiores de la red, abriendo nuevas vías para entender y mejorar los algoritmos de aprendizaje profundo. Link al paper: https://arxiv.org/pdf/2011.12428 Autores del estudio: Maria Refinetti, Stéphane d'Ascoli, Ruben Ohana, Sebastian Goldt Apoyanos en https://www.patreon.com/audioarxiv Unete en https://discord.gg/vKRmFhg4YQ #Ciencia de la computación #InteligenciaArtificial #MachineLearning #RedesNeuronales #DeepLearning #FeedbackAlignment

hace 4 días 5