Hacia un marco (o framework) para el diseño de agentes docentes
Seis dimensiones, cuatro momentos y una espiral: propuesta en versión beta de un marco pedagógico para diseñar agentes de IA en docencia universitaria. Del propósito al ecosistema, del corpus a la memoria. Un marco que invierte el orden: primero la pedagogía, luego la técnica.
Seis dimensiones, cuatro momentos, una espiral (versión beta 0.1)
Fernando Santamaría · IAforTeachers · abril de 2026
Un marco pedagógico se publica en beta cuando quien lo propone sabe dos cosas a la vez: que ya tiene forma suficiente para resultar útil a otros, y que todavía no tiene cierre suficiente para proclamarse terminado. Lo que sigue es exactamente eso. Una arquitectura para el diseño de agentes de inteligencia artificial en docencia universitaria, construida durante meses de práctica, escritura y error, que comparto en este estado intermedio porque creemos que se beneficiará más de la crítica temprana que del perfeccionamiento solitario. El marco tiene tres componentes: seis dimensiones de configuración, cuatro momentos del ciclo de trabajo y una figura en espiral que los articula. Ninguno de los tres es definitivo.

El final silencioso del promptismo
Durante casi tres años, la formación del profesorado en inteligencia artificial giró en torno a una sola pregunta. ¿Cómo formulamos mejor nuestras instrucciones? Toda la producción editorial, los cursos, los talleres, las guías ministeriales: alrededor de afinar la entrada a la máquina. La hipótesis implícita era que una instrucción bien escrita resolvería la distancia entre lo que el docente necesita y lo que el modelo puede ofrecer.
Esa hipótesis ya no alcanza. Karpathy (2025) reformuló el problema con una claridad que conviene citar literalmente: la ingeniería de contexto es el arte y la ciencia de llenar la ventana de contexto con exactamente la información correcta para el siguiente paso. La instrucción, en ese esquema, apenas ocupa un 0,2 % del espacio disponible. El resto, el 99,8 %, es contexto: documentos, memoria, criterios, herramientas conectadas. Y ahí es donde se juega la calidad del resultado.
Sin embargo, la ingeniería de contexto, con ser un avance conceptual sustancial, tampoco capta del todo lo que los docentes avanzados ya están haciendo cuando construyen agentes. La ingeniería de contexto sigue siendo una lógica del prompt ampliado: cómo llenar mejor una ventana para una interacción. Lo que describimos aquí es otra cosa. Es cómo construir un colaborador estable que persiste entre sesiones, aprende de su uso, sedimenta criterio y evoluciona sobre versiones sucesivas. La unidad de análisis ya no es la instrucción, ni siquiera el contexto. Es el ecosistema agéntico que se ha estado construyendo con los skills, memoria, MCPs y otros componentes.
Qué cambia al cambiar de unidad de análisis
El cambio es mayor de lo que parece. Lo resumimos en una oposición que conviene tener presente mientras se lee el resto del artículo.

En la ingeniería de instrucciones, cada interacción es una isla. El docente vuelve a cargar el contexto en cada apertura. La inteligencia artificial olvida al cerrar la pestaña. No hay acumulación entre sesiones. El trabajo invertido en explicar la asignatura, la cohorte o el criterio de evaluación se gasta: se consume y desaparece. La relación con la máquina es transaccional.
En la ingeniería agéntica, el objetivo se declara una vez. El ecosistema se monta una vez. La memoria persiste. La retroalimentación se sedimenta. Cada versión del agente parte de una base más madura que la anterior. El trabajo no se gasta, se capitaliza. La relación con la máquina se parece más a un acuerdo con un colaborador junior al que se forma durante meses que a una conversación con un asistente.
Esta diferencia, formulada así, parece pedagógica en abstracto. No lo es. Tiene consecuencias concretas sobre el tiempo del docente, sobre la calidad del acompañamiento al estudiante y sobre la voz autoral que sobrevive, o no, a la mediación tecnológica.
Un marco en borrador
Propongo un marco de seis dimensiones que se configuran a lo largo de cuatro momentos, representado gráficamente como una espiral.
Las seis dimensiones son: propósito, identidad, criterio, corpus, memoria y acción. Cada dimensión responde a una pregunta distinta sobre el agente. No son etapas secuenciales, son caras de un mismo diseño.
Los cuatro momentos son: objetivo, ecosistema, puesta en marcha e iteración. Son los tiempos del ciclo de trabajo. A diferencia de las dimensiones, sí tienen orden, aunque no uno lineal: el ciclo se repite.
La espiral expresa lo que une ambos. En cada vuelta del ciclo, las seis dimensiones vuelven a configurarse a la luz de la experiencia acumulada. La figura concéntrica captura la estructura; la espiral captura el movimiento. No son figuras alternativas, son la misma figura vista en dos ejes.
Las seis dimensiones

Propósito. La pregunta central es: ¿qué problema pedagógico resuelve este agente? (Gráfica 1) La respuesta obliga a precisar qué valor pedagógico se preserva, se amplifica o se libera. Automatizar tareas no es un propósito. Garantizar retroalimentación individual dentro de las 72 horas en cohortes de más de 60 estudiantes, sí lo es. Sostener la voz autoral del docente en las interacciones asincrónicas cuando el volumen impide escribirlas una a una, también. La diferencia no es cosmética.
Para formular un propósito bien fundamentado, conviene analizar cuatro factores del contexto de la asignatura. El contexto pedagógico: qué se enseña, en qué nivel, con qué metodología y bajo qué normativa. Los actores y relaciones: estudiantes, colegas, coordinadores, instituciones; quién interactúa con el agente y en qué posición. Los recursos y capacidades: con qué infraestructura técnica, tiempo y competencia digital cuenta el docente para construir y mantener el ecosistema. La evidencia y mejora: qué señales permitirán saber, durante el uso, si el agente cumple su propósito o debe reconfigurarse.
Este análisis previo conecta con la tradición del alineamiento constructivo de Biggs y Tang (2011) y con el diseño inverso de Wiggins y McTighe (2005): primero se define qué aprendizaje se quiere proteger; luego se diseña el agente que lo hace posible. No al revés.
Primero se protege el aprendizaje; después se diseña el agente.

Identidad. (Gráfica 2) La pregunta es quién es este agente y, sobre todo, qué no hará. La identidad tiene cuatro componentes que conviene declarar por separado: el rol y mandato (qué función ejerce el agente dentro de la asignatura), los límites éticos (qué principios rigen su actuación), lo que no hará (la lista explícita de acciones prohibidas) y la voz y tono (el registro comunicativo que el agente debe sostener con los estudiantes). Este cuarto componente se subestima habitualmente, pero determina si el agente suena como el docente o como una máquina genérica.
Un agente docente bien identificado no emite calificaciones definitivas, no sustituye la decisión del docente, no inventa referencias cuando no las tiene, no simula certeza cuando la evidencia es escasa. Estos límites no son cortapisas defensivas: son constitutivos de la identidad pedagógica del agente. Un colaborador que no sabe dónde termina su mandato es un colaborador peligroso.
Un agente bien identificado sabe ayudar, y también sabe detenerse.

Criterio. (Gráfica 3) La pregunta es con qué criterio pedagógico decide el agente cuando tiene que decidir. Esta es la dimensión que convierte a un agente genérico en un agente docente. Un asistente generalista puede redactar un comentario sobre un ensayo. Un agente con criterio sabe que, en tu asignatura y en tu cohorte, un ensayo se evalúa primero por claridad argumentativa, después por uso de fuentes y en tercer lugar por registro académico. El criterio se materializa en cuatro elementos que conviene documentar: las rúbricas internas (criterios de evaluación específicos de la asignatura), la jerarquía de evidencia (qué tipo de argumento o fuente tiene más peso), las reglas de decisión (qué hace el agente ante casos ambiguos) y las prioridades pedagógicas (qué valores del docente deben orientar cualquier decisión en caso de conflicto entre criterios).
Explicitarlos para el agente obliga, como efecto secundario útil, a explicitarlos para uno mismo. Muchos docentes descubren, al documentar el criterio de su agente, que nunca lo habían formulado con precisión.
Lo decisivo no es que el agente escriba bien, sino que juzgue con criterio pedagógico.

Corpus. (Gráfica 4) La pregunta es qué conoce este agente y desde qué documentos trabaja. El corpus es el conjunto curado de documentos con los que trabaja: bibliografía, guías docentes, normativas, rúbricas, entregas anteriores anonimizadas, plantillas de comunicación. Es aporte deliberado del docente, y debería crecer con parsimonia, siguiendo el principio que Schluntz y Zhang (2024) formulan con sobriedad: el conjunto más pequeño posible de elementos de alta señal. La evidencia de Liu et al. (2024), que muestra degradación del rendimiento en contextos sobrecargados, refuerza una intuición pedagógica antigua: más información no produce mejor aprendizaje.
Más información no siempre mejora al agente; un corpus preciso suele rendir mejor.

Memoria. (Gráfica 5) La pregunta es qué aprende el agente con el tiempo. A diferencia del corpus, que es aporte deliberado del docente, la memoria es sedimento del uso: se construye con la práctica, no se aporta al inicio. Recoge correcciones, preferencias, ajustes y reglas sedimentadas introducidas sesión a sesión. El docente trabaja con el agente, detecta una desviación, corrige, y esa corrección queda registrada en un archivo de memoria al que el agente consulta antes de la siguiente tarea. Con el tiempo, la memoria captura la voz práctica del docente de un modo que ningún documento inicial podría anticipar.
En el día uno la memoria está vacía; en el mes seis contiene criterio sedimentado.

Acción. La pregunta es qué puede ejecutar este agente y dónde debe detenerse. Es la dimensión más visible y la que más fácilmente se sobredimensiona. Incluye las competencias ejecutables del agente y las herramientas externas a las que accede mediante el protocolo de contexto del modelo, conocido como MCP: correo, calendario, aula virtual, gestor bibliográfico, repositorio. El diseño acertado no consiste en maximizar la autonomía, sino en establecer umbrales de supervisión graduados en tres niveles: tareas autónomas (preparar borradores, buscar referencias, redactar avisos), tareas con aprobación previa (enviar correos, publicar calificaciones, comunicar al estudiante), y tareas que nunca deberían delegarse (decisiones académicas definitivas, mediación en conflictos, juicios sobre integridad académica). La frontera es política pedagógica, no parámetro técnico. Y debe declararse.
Los cuatro momentos del ciclo
Las seis dimensiones no se diseñan en orden. Se configuran atravesando cuatro momentos que sí tienen secuencia, aunque se repiten.

Momento uno · objetivo. Se declara un propósito pedagógico inicial, provisional, poco exigente. No se busca la formulación definitiva, sino una suficientemente clara para orientar lo que viene. El objetivo puede ser amplio: gestionar la asignatura, acompañar a los estudiantes, sostener la calidad de la retroalimentación. Ya se refinará. La trampa en este momento es el perfeccionismo: docentes que no ponen en marcha nada porque no han acabado de definir el propósito. El marco sostiene lo contrario: el propósito se refina mejor con un prototipo funcionando que con una declaración sin uso.
Momento dos · ecosistema. Se construye la infraestructura que hará posible al agente. Se integran los complementos, los servidores MCP, las memorias y los repositorios documentales. Se conectan las herramientas externas que la asignatura necesita. Se prepara el archivo de identidad, el archivo de memoria, la estructura documental del corpus. Esta es la fase que en mi práctica personal consume más tiempo inicial y que, paradójicamente, menos se suele discutir en la literatura pedagógica. Sin embargo, es donde se juega casi todo. Un ecosistema mal montado impide que cualquier diseño pedagógico posterior funcione; uno bien montado hace posible propósitos que ni siquiera se habían imaginado al declarar el objetivo inicial. Kauffman (2000) llamó a esto el espacio adyacente posible: lo que se puede concebir como útil está condicionado por lo que se ha hecho técnicamente posible.
Momento tres · puesta en marcha. Se usa el agente con estudiantes reales, trabajos reales, correos reales. No se trata de un piloto controlado sino de un despliegue con las cautelas razonables. Las seis dimensiones, que hasta ahora existían como configuración declarada, empiezan a producir evidencia. El propósito se contrasta con el uso real. La identidad se confronta con casos límite que no se habían previsto. El criterio revela lagunas. El corpus muestra carencias. La memoria comienza a llenarse. La acción muestra sus fronteras reales. Todo lo que parecía claro en el papel se vuelve más rico y, también, más problemático.
Momento cuatro · iteración. Se recoge la experiencia del momento tres y se vuelve a configurar el agente. No se tira nada, se refina. El propósito se afina. La identidad se precisa en los casos que no se habían previsto. El criterio se amplía con las reglas que la práctica reveló. El corpus se depura (a veces se reduce, lo que es una buena señal). La memoria se limpia de ruido. La acción se reajusta en sus umbrales. Y el ciclo vuelve a empezar, pero ya no desde cero: desde una versión superior del agente.
La figura: concéntrica en su estructura, espiral en su movimiento
Aquí hay un matiz que conviene retener porque resume lo más propio del marco. Las seis dimensiones se representan bien como círculos concéntricos: están siempre presentes, se contienen mutuamente, ninguna puede eliminarse sin colapsar las demás. Esa es la estructura del agente. Pero el trabajo con el agente no es concéntrico, es espiral: cada vuelta del ciclo de cuatro momentos produce una versión del agente, y esa versión es la base desde la que arranca la siguiente vuelta. La espiral asciende, porque cada versión parte de más madurez. Pero no se cierra, porque nunca hay una versión definitiva.
La figura del círculo concéntrico describe el estado. La figura de la espiral describe el proceso. Las dos son necesarias, y las dos son la misma figura vista desde ángulos distintos: la sección de la espiral es el círculo concéntrico; la proyección temporal del círculo es la espiral.
Esta dualidad importa porque resuelve un malentendido frecuente. A quien llega al marco esperando un esquema lineal le parecerá confuso. A quien llega esperando un esquema estático le parecerá inestable. No es ni uno ni otro. Es un esquema iterativo con estructura fija: la estructura asegura que ninguna dimensión se pierde entre vueltas; la iteración asegura que ninguna dimensión se fosiliza.
Un caso de uso: gestión de la asignatura
Conviene aterrizar el marco con un caso. Tomamos uno genérico para no particularizar en exceso: la gestión integral de una asignatura universitaria a lo largo de un semestre.

Objetivo (momento uno). El docente declara, en un archivo de identidad del agente, un propósito provisional: asistir en la gestión de la asignatura, desde la retroalimentación de entregas hasta la comunicación con estudiantes y la coordinación con colegas. Treinta palabras, no más.
Ecosistema (momento dos). Se monta el entorno. Se conectan los servidores MCP relevantes: aula virtual, correo, calendario, gestor bibliográfico, almacenamiento de archivos. Se prepara el archivo de identidad con el rol del agente y su lista de límites. Se estructura una carpeta documental con la guía docente, la rúbrica general, las lecturas obligatorias, las plantillas de comunicación frecuentes. Se inicializa un archivo de memoria vacío.
Puesta en marcha (momento tres). Comienza el semestre. El agente asiste en preparar borradores de retroalimentación de las primeras entregas. El docente revisa, corrige, publica. En cada corrección, anota en el archivo de memoria la regla que emerge. El agente tiende a ser demasiado condescendiente con argumentos circulares; a partir de ahora, cuando detecte circularidad, debe señalarla. El agente prepara borradores de correo a estudiantes que no entregan; el docente afina el tono. Y así durante las primeras semanas. El agente produce, el docente corrige, la memoria sedimenta.
Iteración (momento cuatro). A mitad de semestre, se hace balance. El propósito sigue siendo pertinente, pero se ha descubierto un uso no previsto: el agente es especialmente útil para preparar avisos de convocatoria a sesiones síncronas. Se añade ese uso al propósito. La identidad se amplía con dos límites que la práctica reveló. El corpus se depura eliminando plantillas que no se usaron. La memoria se limpia de entradas redundantes. La acción se reajusta: lo que al principio requería aprobación previa, ahora que el agente ha demostrado criterio, puede ejecutarse con revisión posterior. Y arranca la segunda mitad del semestre con una versión claramente superior a la inicial.
El semestre siguiente, el ciclo vuelve a empezar. Pero el punto de partida ya no es el cero, es el agente que quedó al final del semestre anterior. Esa es la espiral.
El semestre siguiente no se parte de cero: se parte del agente que quedó al final del semestre anterior.
El diferencial: trabajo que se gasta, trabajo que se capitaliza
Lo que distingue a este marco de la ingeniería de instrucciones clásica no es técnico, es económico y pedagógico a la vez. Cada minuto invertido en un prompt se gasta: resuelve una interacción y desaparece. Cada minuto invertido en configurar una dimensión del agente se capitaliza: alimenta todas las interacciones futuras de esa dimensión.
Esto tiene una consecuencia sobre el horizonte temporal del trabajo docente con inteligencia artificial. Quien trabaja con prompts invierte cada semana el mismo esfuerzo de contextualización, porque cada semana empieza desde cero. Quien trabaja con ecosistemas agénticos invierte mucho al inicio, poco en el medio y casi nada al final, porque la infraestructura acumulada hace el trabajo por él. En términos de Allen (2012), que reconceptualizó el diseño instruccional en su modelo SAM frente al falsamente secuencial ADDIE, la curva del esfuerzo es exactamente opuesta.
Este es, creemos, el argumento más fuerte para adoptar el marco. No porque sea más sofisticado, sino porque es más sostenible. Un docente que dedica una hora semanal durante veinte semanas a afinar su agente, al final del semestre ha construido un colaborador que le ahorrará decenas de horas en los semestres siguientes. Un docente que dedica una hora semanal durante veinte semanas a escribir prompts, al final del semestre ha escrito veinte prompts y no le queda nada. El esfuerzo es el mismo; el resultado, incomparable.
Qué hace falta para que este marco sea útil
Un marco pedagógico en versión beta no es útil por lo que afirma sino por lo que invita a probar. Pedimos tres cosas concretas a quien se interese por esta propuesta.
Primera: usarlo como lista de comprobación, no como secuencia de pasos. Antes de desplegar un agente docente, preguntarse si las seis dimensiones están configuradas. Si alguna falta, reconocerlo y decidir conscientemente si se aplaza o si se improvisa.
Segunda: llevar bitácora de las iteraciones. Qué cambió entre la vuelta uno y la vuelta dos, qué reglas se sedimentaron en memoria, qué se eliminó del corpus. La documentación del ciclo es lo que convierte la práctica individual en conocimiento transmisible.
Tercera: devolver retroalimentación al marco. Esta propuesta está en beta por una razón: esperamos que su uso real la modifique. Las dimensiones pueden ser siete en lugar de seis, los momentos pueden ser cinco en lugar de cuatro, la figura espiral puede no ser la más clara. Lo que pedimos es que quien lo pruebe lo cuestione con argumento.
Por qué versión beta
Beta no es borrador. Borrador significa todavía no sé lo que quiero decir. Beta significa ya sé lo que quiero decir, pero aún no sé si funciona para quien no soy yo. La diferencia es importante.
Este marco funciona en mi práctica. Lo comparto ahora, no cuando esté pulido, porque creemos que el pulido de un marco pedagógico sin uso externo es sospechoso. Los marcos se refinan usándolos, no puliéndolos en soledad. La comunidad docente que trabaja con inteligencia artificial en educación superior es suficientemente amplia y crítica como para mejorarlo mucho más rápido de lo que yo podría mejorarlo solo.
El marco, en suma, será tan bueno como las correcciones que reciba. Invitamos a quien lo pruebe a enviar sus observaciones, sus casos, sus contraejemplos. En la próxima versión estarán recogidas las aportaciones que hayan resistido la discusión.
Recibe la versión completa del marco en PDF
Este artículo presenta el marco del diseño agéntico docente con sus gráficas y referencias. Si quieres trabajarlo con calma, he preparado una edición descargable de 22 páginas con las nueve gráficas en alta resolución, las seis dimensiones desarrolladas, los cuatro momentos de la espiral y la bibliografía completa en APA 7.ª edición.
La edición incluye además tres anexos que no están en el artículo publicado:
- A · Plantilla editable para configurar las seis dimensiones en un ecosistema propio.
- B · Ejemplo aplicado a una asignatura universitaria real.
- C · Lista de preguntas de autoevaluación para situar tu propio punto de partida.
Al cerrar esta entrega, el marco seguirá evolucionando. Si lo estás aplicando en tu contexto y encuentras algo que conviene corregir o extender, escribe. La siguiente versión se alimenta de esas lecturas.
Referencias
Biggs, J., & Tang, C. (2011). Teaching for quality learning at university (4.ª ed.). Open University Press.
Karpathy, A. [@karpathy]. (2025, 18 de junio). +1 for "context engineering" over "prompt engineering"… [publicación en X]. https://x.com/karpathy/status/1937902205765607626
Kauffman, S. (2000). Investigations. Oxford University Press.
Laurillard, D. (2012). Teaching as a design science: Building pedagogical patterns for learning and technology. Routledge. https://doi.org/10.4324/9780203125083
Liu, N. F., Lin, K., Hewitt, J., Paranjape, A., Bevilacqua, M., Petroni, F., & Liang, P. (2024). Lost in the middle: How language models use long contexts. Transactions of the Association for Computational Linguistics, 12, 157–173. https://doi.org/10.1162/tacl_a_00638
Schluntz, E., & Zhang, B. (2024, 19 de diciembre). Building effective agents. Anthropic. https://www.anthropic.com/research/building-effective-agents
Wiggins, G., & McTighe, J. (2005). Understanding by design (2.ª ed.). ASCD.