
RAG inteligente y autónomo
Motor de búsqueda semántica + IA conversacional sobre tus documentos. Todo local, con sincronización automática, múltiples dominios y evaluación de calidad integrada.
Compatible con OpenAI, Claude, DeepSeek y Ollama · Sin costes ocultos
* Privacidad total garantizada al usar Ollama u otros proveedores locales. Con OpenAI, Claude o DeepSeek los datos se procesan en sus servidores bajo sus propias políticas de privacidad.
4 proveedores LLM · 3 proveedores de embeddings
Evaluación automática · Faithfulness · Relevancy
No somos el RAG más potente del mercado.
Somos el RAG que un pequeño negocio sí puede implementar hoy: local, útil y sin arruinar el presupuesto.
CerebrIA está pensado para equipos que necesitan consultar documentación, procesos y conocimiento interno con IA, pero no pueden asumir costes altos por usuario, por token o por infraestructura compleja.
Si necesitas resultados reales con inversión razonable, este es tu punto de partida.
Potente motor de conocimiento local
Ingesta, organización y consulta inteligente con arquitectura profesional
Múltiples formatos
PDF, Word (.docx), Markdown. Chunking inteligente con tamaño y solapamiento configurables.
Dominios y etiquetas
Organización jerárquica. Asignación automática mediante IA y búsqueda semántica por categorías.
Modo agéntico
El LLM usa herramientas integradas: <<SEARCH>>, <<READ_CHUNK>> y más. Hasta 5 rondas por consulta.
Evaluación LLM-as-Judge
Métricas automáticas: Faithfulness, Relevancy, Context Precision. Historial completo por sesión.
Watchdog + Task Scheduler
Sincronización continua de carpetas vigiladas. Modo headless --sync para programación automática.
Pipeline RAG de 6 pasos
Descomponer → Buscar → Reformular → Sintetizar → Revisar → Completar. Los pasos 5 y 6 se activan con el modo agéntico.
Historial y sesiones
Sesiones persistentes con atribución de fuentes y puntuación de similitud. Exportación a Markdown y PDF.
Multi-proveedor
OpenAI, Claude, DeepSeek y Ollama. Cambia de LLM o de proveedor de embeddings en cualquier momento desde configuración.
Bases de conocimiento remotas
Conecta con bases vectoriales alojadas remotamente: las que provee la propia aplicación o instancias de terceros a las que tengas acceso. Consulta conocimiento centralizado sin necesidad de almacenarlo en local.
Elige tu stack de IA
Combina libremente LLM y embeddings de distintos proveedores. Cambia de opción en cualquier momento sin necesidad de reingestión de documentos.
Modelos de lenguaje
OpenAI
gpt-5-mini por defecto. Compatible con gpt-5.2 y otros modelos actuales de la API de OpenAI.
Claude · Anthropic
claude-sonnet-4-6 por defecto. Ideal para razonamiento complejo y documentación técnica.
DeepSeek
deepseek-chat. Alto rendimiento a coste reducido, ideal para consultas en volumen.
Ollama · Local
Cualquier modelo compatible con Ollama. Inferencia 100% local, sin clave API ni coste por token.
Proveedores de embeddings
OpenAI Embeddings
text-embedding-3-small · 1 536 dims. Equilibrio óptimo entre calidad y coste.
DeepSeek Embeddings
1 024 dimensiones. Ideal para un stack uniforme con DeepSeek como LLM, a coste mínimo.
Ollama · Local
Cualquier modelo de embeddings servido por Ollama. Detección automática de dimensiones. Privacidad total.
LLM y embeddings son independientes: puedes combinar libremente cualquier proveedor LLM con cualquier proveedor de embeddings.
Razonamiento humano de 6 pasos
Cada consulta sigue un pipeline avanzado para respuestas precisas y fundamentadas. Los pasos 5 y 6 se activan con el modo agéntico habilitado.
Descomponer
El LLM genera sub-queries específicas a partir de la pregunta original.
Buscar
Búsqueda semántica en Qdrant con filtrado por dominio/etiqueta.
Reformular
Si los resultados son débiles, se reformula la query y se reintenta.
Sintetizar
Generación de respuesta coherente con todo el material recuperado.
Revisar
Compara la respuesta con el plan original para detectar huecos de información.
Completar
Búsqueda específica adicional y regeneración final si se detectan huecos.
Qdrant vector DB
Búsqueda sub-milisegundo
Faithfulness ≥ 0.85
Métrica objetivo
Contexto deslizante
Últimos 10 turnos
Chunk top-K: 8
Umbral similitud 0.30
Sincronización automática sin intervención
Carpetas vigiladas + escaneos programados mantienen tu base de conocimiento siempre actualizada
Watchdog en tiempo real
Detección automática de nuevos ficheros, modificaciones y eliminaciones. Sin duplicados gracias a hash SHA-256.
Task Scheduler integrado
Modo headless cerebria.exe --sync. Logs detallados y resumen persistente en settings.
Estadísticas de sync
Nuevos, modificados, eliminados, errores y duración. Última ejecución visible en UI.
Calidad de documento garantizada
Refinamiento inteligente para OCR ruidoso y resúmenes automáticos
Refinamiento automático
Modos: Off / Auto (solo ruidosos) / Always. Detección de ruido mediante heurísticas LLM con umbral configurable (0.40).
Chunking avanzado
Tamaño 2 000 caracteres, overlap 300. Limpieza de saltos de línea excesivos y normalización de texto.
Evaluación de calidad
Puntuación de ruido (umbral 0.40). Opción de saltar summarización en documentos ya refinados.
Listo para usar en tu entorno
Aplicación embebida que se inicia y se detiene con cerebria.exe. Internamente usa Blazor autocontenido, con Qdrant embebido y sin dependencias externas. Compatible también con instancias Qdrant remotas.