Saltar al contenido principal
alejoxtd.

// biblioteca / fundamentos

Claude y la familia Anthropic: cómo funciona el modelo que uso

Anthropic diseñó Claude con una premisa distinta: seguridad primero, desde el entrenamiento. Te explico qué significa eso y cómo se organiza la familia de modelos.

17 de mayo de 2026 · 13 min lectura · fundamentos · Claude · Anthropic · Constitutional AI · modelos

// en este artículo

Cuando empecé a trabajar en serio con modelos de IA, probé varios. GPT-4, Gemini, modelos open source de Meta. Todos tienen capacidades distintas y contextos donde brillan más.

Terminé construyendo Deviam sobre Claude por razones específicas que te voy a explicar. No es un argumento de marketing — es una descripción de diferencias técnicas y de diseño que importan cuando construyes sistemas que van a tomar decisiones reales.


Quién es Anthropic y de dónde viene

Anthropic fue fundada en 2021 por Dario Amodei, Daniela Amodei, y varios investigadores que venían de OpenAI. La tesis fundacional es que la seguridad de los sistemas de IA es un problema técnico que debe resolverse desde el diseño, no parchearse después.

La empresa publica investigación sobre seguridad, interpretabilidad (la capacidad de entender qué hacen los modelos por dentro) y alineamiento. Parte de esa investigación la mencioné en la entrada anterior: el paper de Constitutional AI (arxiv: 2212.08073) es de Anthropic.

Esto no significa que los modelos de Anthropic sean infalibles ni que otras empresas no se preocupen por la seguridad. Significa que Anthropic ha elegido hacer de eso su diferenciador principal, y eso se refleja en cómo están entrenados los modelos Claude.


Constitutional AI: la premisa de diseño que hace diferente a Claude

Los modelos de lenguaje entrenados solo con predicción de texto aprenden a ser fluidos y plausibles, pero no necesariamente seguros o útiles de formas que alineen con lo que los humanos realmente quieren.

El enfoque estándar para corregir esto es RLHF (Reinforcement Learning from Human Feedback, aprendizaje por refuerzo con retroalimentación humana): humanos evalúan respuestas del modelo y sus preferencias se convierten en señal de entrenamiento.

Anthropic desarrolló una variante llamada RLAIF (Reinforcement Learning from AI Feedback, aprendizaje por refuerzo con retroalimentación de IA) bajo el nombre de Constitutional AI. La idea:

  1. Se define una "constitución" — un conjunto de principios escritos en lenguaje natural. Cosas como: "elige la respuesta que sea más útil y honesta", "elige la respuesta que sea menos probable de causar daño", "elige la respuesta que sea más respetuosa de la autonomía del usuario".

  2. El modelo genera respuestas a preguntas potencialmente problemáticas.

  3. El propio modelo evalúa sus respuestas contra los principios de la constitución y las revisa.

  4. Estas revisiones se usan como datos de entrenamiento adicionales.

El resultado es un proceso que reduce la dependencia de evaluadores humanos para cada iteración, escala mejor, y produce modelos que son más consistentes en seguir principios éticos — no porque los sigan como reglas externas, sino porque los internalizaron durante el entrenamiento.

El paper original de Constitutional AI (Bai et al., 2022) está publicado y es accesible. Anthropic también publica los principios constitucionales que usa. Eso es poco habitual en el sector.

Constitutional AI: ciclo generar-evaluar-revisarCiclo de cuatro etapas de Constitutional AI (IA Constitucional): 1. Genera respuesta (modelo borrador), 2. Evalúa contra principios constitucionales, 3. Revisa y mejora mediante autocrítica, 4. Produce datos de entrenamiento de preferencia IA a IA, llamado RLAIF. El ciclo genera modelos más seguros y alineados sin etiquetado humano intensivo.Genera respuestamodelo borradorEvalúa contraprincipios constitucionalesRevisa y mejoraautocrítica guiadaDatos de entrenamientopreferencia IA→IA (RLAIF)Consti-tuciónBai et al. 2022 · arxiv 2212.08073 · Anthropic

La familia Claude: Haiku, Sonnet y Opus

Claude no es un modelo único. Es una familia de modelos con diferentes equilibrios entre velocidad, coste y capacidad.

Claude Haiku es el modelo más rápido y económico. Está diseñado para tareas que necesitan respuesta casi instantánea: clasificación de textos, respuestas cortas, operaciones de alta frecuencia en pipelines (cadenas de procesamiento automatizadas).

Claude Sonnet es el equilibrio entre capacidad y velocidad. Es el modelo que uso para la mayoría del trabajo cotidiano en Deviam: redacción, análisis, código, coordinación entre agentes. Tiene suficiente capacidad para manejar tareas complejas sin el coste computacional del modelo más potente.

Claude Opus es el modelo de máxima capacidad. Está diseñado para tareas que requieren razonamiento profundo, análisis de documentos largos, o decisiones estratégicas donde la calidad importa más que la velocidad.

Esta estructura de tres niveles no es exclusiva de Anthropic — OpenAI tiene una estructura similar con GPT-4o mini, GPT-4o, y o1/o3. La lógica es la misma: no todas las tareas necesitan el modelo más potente, y usar el modelo apropiado para cada tarea es una decisión de diseño importante tanto por coste como por latencia.


Claude 4: la generación actual

En mayo de 2026, Anthropic lanzó Claude 4 — la generación actual de modelos. Las mejoras principales respecto a generaciones anteriores incluyen mayor precisión en razonamiento, mejor manejo de instrucciones largas y complejas, y capacidades expandidas de uso de herramientas.

Opus 4.6 introduce una capacidad que tiene implicaciones directas para el trabajo con agentes: una ventana de contexto (context window — la cantidad de texto que el modelo puede leer y tener "en mente" al mismo tiempo) de hasta 1 millón de tokens en versión beta.

Para dar dimensión a esa cifra: 1 millón de tokens son aproximadamente 750.000 palabras. Eso equivale a varios libros completos, o a la transcripción completa de cientos de reuniones de trabajo. La capacidad de mantener todo ese contexto activo al mismo tiempo abre posibilidades para análisis de repositorios de código enteros, proyectos de investigación extensos, o sistemas de agentes que necesitan memoria de largo plazo.

Evolución de la ventana de contexto: de 4K a 1 millón de tokensDiagrama de barras horizontales comparando la ventana de contexto de cuatro modelos de lenguaje. GPT-3 en 2020 tenía aproximadamente 4 mil tokens. GPT-4 en 2023 alcanzó 32 mil. Claude 3 en 2024 llegó a 200 mil. Claude Opus 4.6 en mayo de 2026 alcanza 1 millón de tokens en beta. Las barras usan escala logarítmica visual.ventana de contexto (tokens)GPT-32020~4KGPT-4202332KClaude 32024200KClaude Opus 4.620261M betaescala logarítmica visual · 1M = 250 veces GPT-3

Por qué la ventana de contexto importa en la práctica

Imagina que estás analizando un contrato de 80 páginas. Un modelo con ventana de contexto pequeña tiene que "dividirlo" en fragmentos, analizar cada fragmento, y luego intentar sintetizar. El modelo puede perder referencias cruzadas entre cláusulas que están en fragmentos diferentes.

Un modelo con 1 millón de tokens de contexto puede leer el contrato completo de una vez y responder preguntas sobre él sin perder ninguna referencia.

El mismo principio aplica cuando Deviam coordina un sistema de 19 agentes. El agente coordinador necesita mantener en contexto: el estado de cada subagente, el progreso de la tarea, el historial de decisiones tomadas, y las instrucciones originales. Más contexto = menos pérdida de información entre pasos = sistemas más coherentes y confiables.


Cómo Claude maneja la incertidumbre

Una de las diferencias que noté cuando empecé a usar Claude sistemáticamente: el modelo es más explícito sobre los límites de su conocimiento que otros modelos que probé.

Esto está relacionado con el entrenamiento. La constitución de Anthropic incluye principios sobre honestidad y calibración — el modelo está entrenado para expresar incertidumbre cuando la tiene, y para no afirmar cosas con más confianza de la que tiene evidencia para respaldar.

Esto no significa que Claude no alucine. Lo hace. Todos los modelos lo hacen en algún grado. Pero la frecuencia y el patrón de las alucinaciones varía entre modelos, y los sistemas que construyo en Deviam están diseñados para tener eso en cuenta: ningún output de un agente va a producción sin al menos una capa de verificación.

La confianza ciega en cualquier modelo de IA es un error de diseño. Lo que el entrenamiento de Anthropic hace es reducir la probabilidad de errores silenciosos — casos donde el modelo se equivoca pero lo hace con una confianza que no da señales de alarma.


Claude vs otros modelos: lo que importa para construir sistemas

Cuando construyo sistemas con agentes de IA, hay tres características que más importan para que el sistema funcione bien:

Seguimiento de instrucciones. La capacidad del modelo de seguir instrucciones complejas con múltiples condiciones, sin ignorar partes de ellas o interpretarlas de forma creativa cuando no debería. Los modelos Claude tienen benchmarks consistentemente altos en esto.

Consistencia entre llamadas. Un sistema que usa un modelo varias veces seguidas necesita que las respuestas sean coherentes entre sí. Un modelo que cambia de opinión sobre el mismo problema entre llamadas introduce errores difíciles de depurar.

Calibración de la incertidumbre. Como mencioné: un modelo que reconoce cuándo no sabe algo es más fácil de usar en sistemas robustos que uno que siempre responde con la misma confianza.

Ningún modelo es perfecto en las tres. Lo que hace que Claude sea mi elección principal para Deviam es que estos tres puntos están tratados de forma más explícita en su proceso de diseño y entrenamiento que en la mayoría de alternativas.


Los system prompts: cómo se personaliza el comportamiento de Claude

Cuando usas Claude a través de una aplicación — o cuando yo lo uso dentro de Deviam — hay normalmente un system prompt (instrucción de sistema, texto que aparece antes de la conversación del usuario y define el contexto, el rol, y las restricciones del modelo para esa sesión).

El system prompt de un agente de Deviam podría decir algo así: "Eres Ares, el agente constructor del equipo de software. Tu rol es implementar código según especificaciones. Nunca tomas decisiones arquitecturales sin consultar a Athena. Siempre verificas que el código que escribes pasa los tests antes de declararlo completo."

Esas instrucciones no están codificadas en el modelo — están en el system prompt que se envía en cada llamada. El modelo las sigue porque fue entrenado para seguir instrucciones del sistema. Pero siguen siendo instrucciones en lenguaje natural, y el modelo las interpreta con flexibilidad.

Esto es diferente del software clásico donde las reglas están compiladas en el código. Aquí las reglas son texto, y el modelo las sigue de forma estadísticamente confiable pero no con garantía absoluta. Es una distinción que importa cuando diseñas sistemas.

Flujo de procesamiento de Claude: prompt de sistema, mensaje de usuario, respuestaDiagrama de flujo. A la izquierda dos entradas: prompt de sistema con instrucciones del desarrollador, y mensaje del usuario. Ambas entradas convergen en Claude, que procesa la información. Claude genera una respuesta a la derecha.flujo de procesamientoPrompt desistemainstruccionesdel desarrolladorMensajedel usuariopregunta osolicitudClaudeprocesointernoRespuestatexto generadopor el modelocontexto completoClaude no recuerda conversaciones anteriores · cada llamada es independiente

Cómo Anthropic documenta sus modelos

Anthropic publica model cards y system cards — documentos que describen las capacidades, limitaciones, y comportamientos de seguridad de sus modelos. Son públicos en la web de Anthropic.

Esto incluye información sobre los benchmarks en los que se evaluaron los modelos, los comportamientos que se intentó evitar, y los casos conocidos donde el modelo puede fallar.

La publicación de esta documentación no es universal en el sector. Es una señal de qué tipo de empresa es Anthropic: una donde la transparencia sobre los sistemas que construye es parte de la propuesta de valor, no solo del marketing.

Para quien quiera entender en profundidad el modelo que está usando, los model cards son el punto de partida correcto. Son documentos técnicos pero accesibles para cualquier persona con motivación de leerlos.


Tres cosas que la mayoría de personas no saben sobre Claude

Los modelos tienen fecha de corte de conocimiento. Claude fue entrenado con datos hasta cierta fecha. No sabe lo que pasó después. Cuando le preguntas sobre eventos recientes, puede equivocarse o simplemente no saber. La ventana de contexto ayuda si le das información actualizada en la conversación, pero no reemplaza el conocimiento de entrenamiento.

El tamaño del modelo no determina todo. Claude Haiku en muchas tareas simples produce resultados comparables o mejores que Opus en velocidad y coste. Usar siempre el modelo más grande porque "es mejor" es un error de diseño que tiene coste real en tiempo y dinero.

El mismo modelo puede responder diferente a la misma pregunta. Los modelos tienen un parámetro llamado temperatura (control sobre cuánta aleatoriedad se introduce en las respuestas — temperatura alta produce respuestas más variadas, temperatura baja produce respuestas más deterministas). Aplicaciones bien diseñadas ajustan la temperatura según la tarea: baja para análisis, más alta para brainstorming.


La próxima pieza del puzzle

Hasta aquí tienes un modelo claro de qué es Claude: un transformer entrenado con Constitutional AI, con una familia de modelos de diferente capacidad y coste, que sigue instrucciones en lenguaje natural con alta confiabilidad pero sin garantía absoluta.

En la siguiente entrada expando el mapa: más allá de Claude y los LLMs, ¿qué otras arquitecturas de IA existen? ¿Qué tipo de problemas resuelve cada una? Hay modelos que procesan imágenes, modelos que trabajan con secuencias conceptuales en lugar de palabras, modelos diseñados específicamente para ejecutar acciones en el mundo.

El panorama es más diverso de lo que parece desde afuera.


Fuentes

  • Bai et al., Constitutional AI: Harmlessness from AI Feedback (2022) — arxiv: 2212.08073. El paper fundacional del entrenamiento de Claude.
  • Anthropic model cards y system cards — anthropic.com (documentación oficial de capacidades y limitaciones por modelo).
  • Anthropic news, Introducing Claude 4 (mayo 2026) — anuncio oficial del lanzamiento de la generación actual.
  • Anthropic news, Claude Opus 4.6 with 1M token context (mayo 2026, beta) — ventana de contexto extendida.
  • Vaswani et al., Attention Is All You Need (2017) — arxiv: 1706.03762. Arquitectura base de todos los modelos Claude.

Siguiente entrada: Ocho tipos de IA: el mapa completo de arquitecturas

¿Te sirve? Llévate los procesos canon en PDF.

Te lo mando al email · sin spam · te bajas en un click.

// fuentes

Documento canonical interno: _wiki/biblioteca_research_athena_d30_v1.md