Transformers y atención: la idea central en una página

La arquitectura transformer cambió todo, pero la idea central es más simple de lo que crees.

Lena Kovacs

5 de February de 2025

⏱ 8 min de lectura Compartir 𝕏

NLP & LLMs

El transformer fue introducido en 2017 en "Attention Is All You Need" y se convirtió en la base de GPT, BERT y prácticamente todos los modelos de lenguaje modernos.

El problema con las RNN

Antes de los transformers, los modelos de secuencia procesaban el texto de izquierda a derecha, un token a la vez.

La atención

Para cada token, la atención calcula una suma ponderada de todos los demás tokens.

Topics: NLP & LLMs Intermedio

Escrito por

Lena Kovacs

Contributor at AlgoArtifica.

Enjoyed this article?

Aprende IA, un correo a la vez

Un correo por semana. Gratis, siempre. Sin spam.

Gratis para siempre · Sin spam · Cancela cuando quieras · Respetamos tu privacidad.