2.3 Principales LLMs y cuando usarlos

Wishlist Share
Share Course
Page Link
Share On Social Media

About Course

💼 Recursos del video

• Tablero de Canva con análisis comparativo de modelos: https://www.canva.com/design/DAGrljqoCUQ/kL4F_pHqQ5dEgpsaSxzf2Q/view?utm_content=DAGrljqoCUQ&utm_campaign=designshare&utm_medium=link2&utm_source=uniquelinks&utlId=h1d90e6c2a5

• Plantilla JSON de workflow con múltiples modelos: https://drive.google.com/file/d/1JdDuomoAXbv9SSDJxPGWlrOlQJ8Fxg3W/view?usp=sharing • LM Arena – Plataforma de comparación de modelos: https://lmarena.ai/

• OpenRouter – API unificada para todos los modelos: https://openrouter.ai/

• LLM Stats – Sitio donde aparecen rankings de modelos de IA: https://llm-stats.com/

• Documento de investigación de sitios web que comparan diversos llm: https://useful-beast-698.notion.site/Plataformas-Principales-de-Rankings-de-IA-Por-Kevin-Belier-22cee6bc93a380148ef0fbad7476bdd4

 


 

En julio de 2025, el panorama de modelos de IA cambió dramáticamente. Grok 4 de xAI acaba de destronar a Gemini 2.5 Pro como el modelo líder en rankings independientes, logrando un score revolucionario de 15.9% en ARC-AGI-2 — casi el doble del siguiente mejor modelo comercial.

Pero aquí está la verdad que nadie te cuenta: el mejor modelo no siempre es el que necesitas.

Los 5 Factores Que Determinan Tu Elección

1. Propósito del Agente

¿Necesitas un científico que razone con precisión o un creativo que genere ideas fuera de la caja?

  • Para análisis exactos: Claude Opus, O1-Pro

  • Para contenido creativo: GPT-4o, Claude 3.5 Sonnet

  • Para conversaciones: Claude 3.5 Sonnet, GPT-4o

2. Capacidades Específicas

💡 Tip profesional: No todos los modelos soportan herramientas (tools). Verifica compatibilidad antes de diseñar tu workflow.

  • Velocidad: Gemini 2.5 Flash, GPT-4o Mini

  • Multimodalidad: GPT-4o, Gemini 2.5 Pro

  • Privacidad: DeepSeek, Llama (auto-hospedados)

3. Presupuesto

Los costos varían dramáticamente. Grok 4 cuesta $3 por millón de tokens, mientras que DeepSeek cuesta solo $0.15 — una diferencia de 2000%.

4. Soporte de Herramientas

🖊️ Concepto clave – Tools: Funciones que permiten al modelo ejecutar acciones específicas como búsquedas web, cálculos o consultas a bases de datos.

No todos los modelos ejecutan herramientas con la misma eficiencia. GPT-4o y Claude Opus lideran en este aspecto.

5. Requisitos de Privacidad

Para datos sensibles, considera modelos auto-hospedados como Llama o DeepSeek que puedes ejecutar en tu propio servidor.

La Estrategia Profesional: OpenRouter

👽 Hack de productividad: Usa OpenRouter para acceder a todos los modelos con una sola API key. OpenRouter actúa como un "buffet de modelos" donde puedes elegir el óptimo para cada tarea sin cambiar credenciales.

En lugar de gestionar múltiples APIs, configura OpenRouter una vez y experimenta con más de 400 modelos. Esto te permite:

  • Optimizar costos: Usa modelos baratos para tareas simples

  • Maximizar calidad: Reserva modelos premium para análisis críticos

  • Failover automático: Si un proveedor falla, OpenRouter redirige a otro

Sitios Sobre los Rankings

LM Arena y Artificial Analysis mantienen rankings actualizados donde puedes comparar modelos por inteligencia, velocidad y precio. Pero recuerda: los benchmarks no siempre reflejan el rendimiento en tu caso de uso específico.

💡 Estrategia ganadora: Usa LM Arena para hacer "batallas" entre modelos con tus prompts reales antes de decidir.

El futuro pertenece a quienes saben cuándo usar cada herramienta. Mientras otros discuten cuál modelo es "el mejor", tú estarás construyendo sistemas que usan el modelo correcto para cada tarea.


🎯 Práctica

En el siguiente enlace encontrarás la evaluación de este módulo, la cual deberás contestar sin ayuda de la IA. Dicha evaluación tiene la intención de autoevaluar tu progreso y determinar si has entendido todo lo visto en este módulo.

‼️ Instrucciones importantes: este documento no se puede editar, para hacerlo debes crear una copia en tu propio espacio de Google Drive:

Como copiar documento.gif

https://docs.google.com/document/d/11Z1LiouSeMWFrFySyJm_e0LRrmS_X_Zx-sDjD9MJ128/edit?usp=sharing

Show More

Student Ratings & Reviews

No Review Yet
No Review Yet