3.2 Consumo de información en RAG

Wishlist Share
Share Course
Page Link
Share On Social Media

About Course

Cómo Consumir Información de tu Base de Datos Vectorial: Question and Answer Chain vs AI Agent

💼 Recursos del video

• JSON workflow completo: https://drive.google.com/file/d/1H_7f0TLbVWKBvI3L3nrFwbjPjz32j5xo/view?usp=sharing

• API Telegram Bot Father: https://core.telegram.org/bots/api


Recuerdo cuando implementé mi primer sistema RAG con n8n hace unos meses. Como muchos principiantes, usaba solo el AI Agent para todo, pensando que "más complejo = mejor". Después descubrí que estaba desperdiciando hasta 60% más tokens de lo necesario.

La realidad es que n8n te da dos caminos distintos para consumir tu base de datos vectorial, y elegir el correcto puede significar la diferencia entre un chatbot lento y costoso, o una solución eficiente que genera dinero real.

🖊️ Concepto clave – RAG (Retrieval Augmented Generation): Técnica que combina la recuperación de información específica desde bases de datos vectoriales con la generación de respuestas contextualmente relevantes por modelos de lenguaje.

Los Dos Caminos: Question and Answer Chain vs AI Agent

Question and Answer Chain: El Especialista

Úsalo cuando: Necesitas consultas directas y rápidas a tu base de datos vectorial dentro de un flujo automatizado.

Ventajas:

  • Velocidad superior: 60% más rápido que AI Agent para consultas simples

  • Menor consumo de tokens: Sin overhead de razonamiento complejo

  • Procesamiento en lotes: Perfecto para workflows con múltiples elementos

  • Integración fluida: Se conecta perfectamente en flujos de email, webhooks, etc.

AI Agent: El Conversador

Úsalo cuando: Necesitas mantener conversaciones bidireccionales con contexto y memoria.

Ventajas:

  • Memoria conversacional: Recuerda interacciones anteriores

  • Razonamiento complejo: Puede usar múltiples herramientas y tomar decisiones

  • Experiencia humana: Respuestas más naturales y contextualmente apropiadas

  • Escalabilidad: Maneja sesiones múltiples independientes

⚠️ Error costoso: El 80% de usuarios solo usan AI Agent para todo, gastando hasta 300% más en tokens. La clave está en usar Question and Answer Chain para consultas directas y AI Agent solo para conversaciones.

Configuración Profesional con Supabase

Supabase combina bases de datos relacionales PostgreSQL con capacidades vectoriales usando pgvector, eliminando la necesidad de infraestructura separada. Esto significa:

Paso 1: Configurar Vector Store

Nodo: Supabase Vector Store
Modo: Retrieve Documents (As Vector Store for Chain/Tool)
Tabla: documents (donde tienes tus embeddings)
Modelo Embedding: Mismo que usaste para insertar

Paso 2: Conectar Question and Answer Chain

Modelo: OpenAI Chat Model (GPT-4 Mini para pruebas)
Retriever: Vector Store Retriever → Supabase Vector Store
System Prompt: "Eres un asistente especializado en..."

👽 Hack de IA: Usa Claude para generar el system prompt perfecto: "Créame un system prompt para un asistente que responde preguntas sobre [tu tema] usando un tono [profesional/casual] dirigido a [tu audiencia]"

Memoria Conversacional: El Diferenciador Competitivo

Para conversaciones reales, necesitas memoria. Aquí es donde Supabase vuelve a brillar:

PostgreSQL Chat Memory

No olvides que para crear la credencial de este nodo es necesario ir a la sección "connect" en tu base de datos y desplegar la seccion de "view parameters" de "Transaction pooler"

image.png

 


Host: Pegar como aparece en esta sección
Database: dejar en postgres
User: Pegar como aparece en esta sección
Password: El password que creaste cuando iniciaste el proyecto
Port: Pegar como aparece en esta sección

Tabla: Se crea automáticamente (n8n_chat_histories)
Session ID: Unique para cada usuario (ej: chat ID de Telegram)
Context Window: 5-10 interacciones (balance perfecto costo/contexto)

Esta configuración te permite:

  • Conversaciones persistentes: Usuarios pueden retomar conversaciones días después

  • Personalización: El AI "recuerda" preferencias y contexto del usuario

  • Optimización de costos: Solo carga contexto relevante, no todo el historial

⚠️ Sobre la expiración de una base de datos en supabase: En el plan gratuito de Supabase, los proyectos se pausan automáticamente después de 1 semana de inactividad. Esto significa que si no hay actividad (como llamadas a la API, acceso a la base de datos, etc.) durante ese período, el proyecto se suspende temporalmente.

 

La Diferencia Entre Aficionado y Profesional

Aficionado: Usa solo AI Agent, no optimiza costos, respuestas genéricas

Profesional:

  • Usa Question and Answer Chain para consultas directas en flujos

  • Usa AI Agent solo para conversaciones que requieren memoria

  • Optimiza tokens con system prompts específicos

  • Implementa memoria conversacional para experiencias superiores

  • Mide y optimiza rendimiento continuamente


🎯 Práctica

En el siguiente enlace encontrarás la evaluación de este módulo, la cual deberás contestar sin ayuda de la IA. Dicha evaluación tiene la intención de autoevaluar tu progreso y determinar si has entendido todo lo visto en este módulo.

‼️ Instrucciones importantes: este documento no se puede editar, para hacerlo debes crear una copia en tu propio espacio de Google Drive:

Como copiar documento.gif

 

https://docs.google.com/document/d/1DWJJukgDtc9lrfqR6M1kLllFSxtHqy7S7hSbzoWHelk/edit?usp=sharing


Artículos y recursos recomendados:

Retrieval-Augmented Generation Market Report 2025

Supabase Vector Database Integration Guide

n8n Advanced AI Documentation

Conversational AI Market Growth Report

Show More

Student Ratings & Reviews

No Review Yet
No Review Yet