Saltar al contenido principal

Videos de predicción de tokens

Videos etiquetados con "predicción de tokens"

predicción de tokens 1 videos

LLAMA CPP ⚙️ Domina los Parámetros de Sampleo para un LLM PERFECTO
14:06

LLAMA CPP ⚙️ Domina los Parámetros de Sampleo para un LLM PERFECTO

Descubre cómo funcionan los parámetros de sampleo en los modelos de lenguaje y aprende a configurarlos para optimizar las respuestas de tu IA. En este video analizamos a fondo los ajustes de sampleo, tomando como referencia llama.cpp y LM Studio, aunque estos conceptos aplican a la mayoría de los cargadores de modelos como vLLM. Exploramos la naturaleza de los LLM como predictores de tokens y cómo el contexto influye en la generación de cada palabra. Explicamos detalladamente el impacto de la temperatura en la creatividad y la precisión, la función del Top K para limitar el rango de tokens probables y las diversas penalizaciones por repetición (repeat penalty, presencia y frecuencia) para evitar que el modelo caiga en bucles infinitos. Finalmente, discutimos cómo adaptar estos ajustes según la tarea, ya sea para razonamiento complejo o para la escritura de código. 📝 Índice: 00:00:00 Introducción a los parámetros de sampleo 00:00:51 Funcionamiento del contexto y predicción de tokens 00:03:12 Aleatoriedad vs Probabilidad en las respuestas 00:04:43 La Temperatura y la creatividad del modelo 00:07:31 Top K y la limitación de tokens 00:08:17 Prevención de repeticiones y bucles (Penalty) 00:10:35 Parámetros adicionales en llama.cpp 00:12:00 Configuración según el tipo de uso (Código vs Texto) #inteligenciaartificial #LLM #llamaCPP #LMStudio #MachineLearning #IA #PromptEngineering #Tecnologia Contacto: nichonauta@gmail.com Web: nichonauta.com URL del Directo Completo: https://www.youtube.com/watch?v=WTYkns3r7h8

hace 1 mes 67