About Course
Cómo Consumir Información de tu Base de Datos Vectorial: Question and Answer Chain vs AI Agent
💼 Recursos del video
• JSON workflow completo: https://drive.google.com/file/d/1H_7f0TLbVWKBvI3L3nrFwbjPjz32j5xo/view?usp=sharing
• API Telegram Bot Father: https://core.telegram.org/bots/api
Recuerdo cuando implementé mi primer sistema RAG con n8n hace unos meses. Como muchos principiantes, usaba solo el AI Agent para todo, pensando que "más complejo = mejor". Después descubrí que estaba desperdiciando hasta 60% más tokens de lo necesario.
La realidad es que n8n te da dos caminos distintos para consumir tu base de datos vectorial, y elegir el correcto puede significar la diferencia entre un chatbot lento y costoso, o una solución eficiente que genera dinero real.
🖊️ Concepto clave – RAG (Retrieval Augmented Generation): Técnica que combina la recuperación de información específica desde bases de datos vectoriales con la generación de respuestas contextualmente relevantes por modelos de lenguaje.
Los Dos Caminos: Question and Answer Chain vs AI Agent
Question and Answer Chain: El Especialista
Úsalo cuando: Necesitas consultas directas y rápidas a tu base de datos vectorial dentro de un flujo automatizado.
Ventajas:
-
Velocidad superior: 60% más rápido que AI Agent para consultas simples
-
Menor consumo de tokens: Sin overhead de razonamiento complejo
-
Procesamiento en lotes: Perfecto para workflows con múltiples elementos
-
Integración fluida: Se conecta perfectamente en flujos de email, webhooks, etc.
AI Agent: El Conversador
Úsalo cuando: Necesitas mantener conversaciones bidireccionales con contexto y memoria.
Ventajas:
-
Memoria conversacional: Recuerda interacciones anteriores
-
Razonamiento complejo: Puede usar múltiples herramientas y tomar decisiones
-
Experiencia humana: Respuestas más naturales y contextualmente apropiadas
-
Escalabilidad: Maneja sesiones múltiples independientes
⚠️ Error costoso: El 80% de usuarios solo usan AI Agent para todo, gastando hasta 300% más en tokens. La clave está en usar Question and Answer Chain para consultas directas y AI Agent solo para conversaciones.
Configuración Profesional con Supabase
Supabase combina bases de datos relacionales PostgreSQL con capacidades vectoriales usando pgvector, eliminando la necesidad de infraestructura separada. Esto significa:
Paso 1: Configurar Vector Store
Nodo: Supabase Vector Store
Modo: Retrieve Documents (As Vector Store for Chain/Tool)
Tabla: documents (donde tienes tus embeddings)
Modelo Embedding: Mismo que usaste para insertar
Paso 2: Conectar Question and Answer Chain
Modelo: OpenAI Chat Model (GPT-4 Mini para pruebas)
Retriever: Vector Store Retriever → Supabase Vector Store
System Prompt: "Eres un asistente especializado en..."
👽 Hack de IA: Usa Claude para generar el system prompt perfecto: "Créame un system prompt para un asistente que responde preguntas sobre [tu tema] usando un tono [profesional/casual] dirigido a [tu audiencia]"
Memoria Conversacional: El Diferenciador Competitivo
Para conversaciones reales, necesitas memoria. Aquí es donde Supabase vuelve a brillar:
PostgreSQL Chat Memory
No olvides que para crear la credencial de este nodo es necesario ir a la sección "connect" en tu base de datos y desplegar la seccion de "view parameters" de "Transaction pooler"
Host: Pegar como aparece en esta sección
Database: dejar en postgres
User: Pegar como aparece en esta sección
Password: El password que creaste cuando iniciaste el proyecto
Port: Pegar como aparece en esta sección
Tabla: Se crea automáticamente (n8n_chat_histories)
Session ID: Unique para cada usuario (ej: chat ID de Telegram)
Context Window: 5-10 interacciones (balance perfecto costo/contexto)
Esta configuración te permite:
-
Conversaciones persistentes: Usuarios pueden retomar conversaciones días después
-
Personalización: El AI "recuerda" preferencias y contexto del usuario
-
Optimización de costos: Solo carga contexto relevante, no todo el historial
⚠️ Sobre la expiración de una base de datos en supabase: En el plan gratuito de Supabase, los proyectos se pausan automáticamente después de 1 semana de inactividad. Esto significa que si no hay actividad (como llamadas a la API, acceso a la base de datos, etc.) durante ese período, el proyecto se suspende temporalmente.
La Diferencia Entre Aficionado y Profesional
Aficionado: Usa solo AI Agent, no optimiza costos, respuestas genéricas
Profesional:
-
Usa Question and Answer Chain para consultas directas en flujos
-
Usa AI Agent solo para conversaciones que requieren memoria
-
Optimiza tokens con system prompts específicos
-
Implementa memoria conversacional para experiencias superiores
-
Mide y optimiza rendimiento continuamente
🎯 Práctica
En el siguiente enlace encontrarás la evaluación de este módulo, la cual deberás contestar sin ayuda de la IA. Dicha evaluación tiene la intención de autoevaluar tu progreso y determinar si has entendido todo lo visto en este módulo.
‼️ Instrucciones importantes: este documento no se puede editar, para hacerlo debes crear una copia en tu propio espacio de Google Drive:
https://docs.google.com/document/d/1DWJJukgDtc9lrfqR6M1kLllFSxtHqy7S7hSbzoWHelk/edit?usp=sharing
Artículos y recursos recomendados:
Retrieval-Augmented Generation Market Report 2025