Guía de configuración

Configura CerebrIA desde cero

Tanto si quieres privacidad total con Ollama como si prefieres la potencia de OpenAI o Claude, esta guía te lleva de la mano paso a paso. No se necesitan conocimientos técnicos previos.

Ollama · IA 100% local

Sin internet, sin cuentas, sin costes por uso. Tus datos nunca salen de tu ordenador.

¿Qué es Ollama? Es un programa que instala y ejecuta modelos de IA directamente en tu PC o Mac, igual que instalarías cualquier otra aplicación. Una vez instalado, CerebrIA lo usa de forma transparente.

Requisitos mínimos del sistema

16 GB RAM mínimo
32 GB recomendado
5-15 GB espacio libre
por modelo descargado
CPU moderna
GPU opcional pero mejora mucho la velocidad
Windows 10/11
macOS o Linux también
Para RAG de trabajo (no solo pruebas): recomendamos empezar en modelos 7B o superiores. Por debajo de 7B, la calidad suele ser insuficiente para respuestas fiables sobre documentos reales.

Recomendación práctica de hardware (RAG local)

Mínimo útil (7B)
CPU potente + 32 GB RAM
GPU recomendada
16 GB VRAM para 20B-27B cuantizados
NVIDIA
RTX 5060 Ti 16 GB o superior
AMD
RX 9070 o superior (válida)

Referencia: para ir realmente holgado, una RTX 4090 o una RX 7900 XTX van muy bien, pero normalmente se salen del perfil de presupuesto objetivo.

Instalación paso a paso

1

Descarga Ollama

Abre tu navegador y ve a ollama.com. Haz clic en el botón de descarga para Windows (o tu sistema operativo).

Web oficial https://ollama.com/download

Es software libre y de confianza. El instalador pesa aproximadamente 80 MB.

2

Instala Ollama

Ejecuta el instalador descargado (OllamaSetup.exe). El instalador es sencillo: acepta los términos y haz clic en "Install". No necesitas cambiar ninguna opción.

Ollama se instala como un servicio en segundo plano. Verás su icono en la barra de tareas (cerca del reloj). No necesitas abrirlo manualmente, arranca solo con Windows.
3

Descarga un modelo de lenguaje (LLM)

Abre el Símbolo del sistema (busca "cmd" en el menú inicio) o PowerShell y ejecuta:

Terminal — copia y pega este comando ollama pull llama3.2

Esto descarga el modelo Llama 3.2 (3B parámetros, ~2 GB). Es un modelo excelente para empezar.

Modelos recomendados según tu hardware
ModeloPerfilRAM/VRAM sugeridaCalidad RAG
llama3.1:8bMínimo útil32 GB RAM · GPU opcional●●●○○

La descarga puede tardar varios minutos según tu conexión. El progreso se muestra en la terminal.

4

Descarga un modelo de embeddings

Los embeddings son necesarios para que CerebrIA entienda el contenido de tus documentos. Descarga el modelo recomendado para Ollama:

Terminal ollama pull bge-m3

bge-m3 ofrece muy buen equilibrio para búsqueda semántica multilingüe. Si priorizas ligereza, nomic-embed-text sigue siendo una alternativa válida.

Importante: Una vez que ingieras documentos con un modelo de embeddings concreto, cambiar de modelo requiere reingestar todos los documentos desde cero. Elige bien desde el principio (ver guía de embeddings).
5

Verifica que Ollama funciona

Abre tu navegador y ve a:

Comprobación en navegador http://localhost:11434

Si ves el texto "Ollama is running", ¡todo está listo!

Si no ves ese mensaje, abre el Símbolo del sistema y ejecuta ollama serve para iniciar el servicio manualmente.
6

Configura CerebrIA para usar Ollama

En CerebrIA, ve a Configuración → Proveedor de IA y selecciona:

Proveedor LLM Ollama
URL de Ollama http://localhost:11434
Modelo LLM llama3.2 (o el que hayas descargado)
Proveedor Embeddings Ollama
Modelo Embeddings bge-m3
API Key No necesaria · Dejar vacío
¡Listo! CerebrIA ya puede funcionar completamente offline. Todos tus documentos y conversaciones se procesan en tu propio ordenador.

OpenAI · GPT-5.x

El proveedor más popular. Excelente equilibrio entre calidad, velocidad y facilidad de uso.

¿Qué es una API Key? Es una contraseña especial que OpenAI te da para que sus modelos de IA puedan usarse desde aplicaciones como CerebrIA. Necesitas una cuenta y un método de pago, pero el coste es muy bajo: procesar un documento típico cuesta menos de 0,01 €.

Obtener tu API Key de OpenAI

1

Crea una cuenta en OpenAI

Ve a la plataforma de desarrollo de OpenAI:

Abre en el navegador https://platform.openai.com/signup

Puedes registrarte con tu email, o con tu cuenta de Google o Microsoft. Elige la opción que prefieras.

2

Añade un método de pago

Sin crédito, las llamadas a la API no funcionan. Ve a:

En el panel de OpenAI platform.openai.com → Billing → Add payment method

Añade tu tarjeta de crédito/débito. OpenAI solo cobra lo que uses. Te recomendamos configurar un límite de gasto (Usage limits) de 5-10 € al mes para empezar.

Coste orientativo: Ingestar 100 documentos PDF medianos cuesta aproximadamente 0,10 - 0,50 €. Una consulta completa cuesta entre 0,001 y 0,01 €.
3

Genera tu API Key

En el panel de OpenAI, ve a:

Ruta en el panel platform.openai.com → API keys → Create new secret key

Dale un nombre descriptivo (por ejemplo, "CerebrIA") y haz clic en Create secret key.

¡Cópiala ahora! La clave solo se muestra una vez. Empieza por sk-... y tiene unos 50 caracteres. Cópiala y guárdala en un lugar seguro antes de cerrar la ventana.
4

Configura CerebrIA con tu clave

En CerebrIA, ve a Configuración → Proveedor de IA:

Proveedor LLM OpenAI
Modelo LLM gpt-5-mini (recomendado)
API Key OpenAI sk-proj-XXXXXXXXXXXX...
Proveedor Embeddings OpenAI Embeddings
Modelo Embeddings text-embedding-3-small
Modelos LLM objetivo de OpenAI
ModeloVelocidadCosteCalidad
gpt-5.2NormalMedio●●●●●
gpt-5.4NormalAlto●●●●●

Claude · Anthropic

Excepcional para documentación técnica, razonamiento complejo y textos muy largos.

Obtener tu API Key de Anthropic

1

Crea una cuenta en Anthropic

Abre en el navegador https://console.anthropic.com/

Regístrate con tu email. Anthropic puede pedirte verificación por teléfono.

2

Añade créditos

Sin crédito, la API no funciona. Ve a:

En el panel de Anthropic console.anthropic.com → Billing → Add credit

Puedes añadir desde 5 USD. Claude también ofrece una pequeña cantidad de créditos gratuitos al registrarte.

3

Genera tu API Key

Ruta en el panel console.anthropic.com → API Keys → Create Key
La clave empieza por sk-ant-.... Al igual que con OpenAI, cópiala nada más crearla y guárdala en un lugar seguro.
4

Configura CerebrIA

Proveedor LLM Claude · Anthropic
Modelo LLM claude-sonnet-4-6 (recomendado)
API Key Anthropic sk-ant-XXXXXXXXXXXX...
Proveedor Embeddings Elige según tus preferencias (ver guía de embeddings)
Modelos Claude objetivo
ModeloVentana contextoCosteUso ideal
claude-haiku-4.5200K tokensBajoRápido y económico
claude-opus-4.8200K tokensAltoMáxima calidad

DeepSeek

Alto rendimiento a un coste hasta 10× menor que OpenAI. Ideal para uso intensivo.

Obtener tu API Key de DeepSeek

1

Crea una cuenta en DeepSeek

Abre en el navegador https://platform.deepseek.com/sign_up

Regístrate con tu email y verifica tu cuenta.

2

Recarga tu saldo

En el panel de DeepSeek platform.deepseek.com → Top Up

El mínimo es generalmente 2 USD, que dará para miles de consultas.

Coste orientativo: DeepSeek es aproximadamente 10-30 veces más barato que GPT-4. Con 2 USD puedes hacer miles de consultas.
3

Genera tu API Key

Ruta en el panel platform.deepseek.com → API Keys → Create API Key

La clave empieza por sk-.... Cópiala y guárdala.

4

Configura CerebrIA

Proveedor LLM DeepSeek
Modelo LLM deepseek-chat (recomendado)
API Key DeepSeek sk-XXXXXXXXXXXX...
Proveedor Embeddings DeepSeek Embeddings

¿Qué son los embeddings y por qué importan?

La decisión más importante antes de ingestar tus documentos

Explicación sencilla

Imagina que tienes una biblioteca enorme con miles de libros. Para encontrar información, necesitas un índice que entienda el significado de cada párrafo, no solo las palabras exactas.

Los embeddings son ese índice: un proceso que traduce cada fragmento de texto en una lista de números que captura su "significado". Cuando haces una pregunta, CerebrIA convierte tu pregunta en el mismo tipo de números y busca los fragmentos más parecidos.

El modelo de embeddings es el motor que hace esa traducción. Distintos modelos producen distintos tipos de números, y son incompatibles entre sí.

⚠️ Cambiar el modelo de embeddings requiere reingestar todos tus documentos.

Si empiezas con bge-m3 de Ollama y luego cambias a text-embedding-3-small de OpenAI, los números que tenía guardados ya no son válidos. CerebrIA detectará el cambio automáticamente y te pedirá confirmación, pero el proceso de reingestión puede llevar horas si tienes muchos documentos.

Elige bien desde el principio y no cambies salvo que sea necesario.

¿Qué modelo de embeddings elegir?

Ollama · bge-m3 (por defecto)

100% Local
  • Sin coste, sin internet
  • Privacidad total
  • Excelente para búsquedas multilingües
  • Requiere Ollama instalado
  • Ligeramente menor calidad que servicios cloud
Ideal para: privacidad, uso offline, documentos mixtos ES/EN y usuarios con Ollama ya configurado

OpenAI · text-embedding-3-small

Cloud
  • Excelente calidad general
  • Rápido, fiable
  • 1 536 dimensiones, muy preciso
  • Coste por tokens
  • Los datos pasan por servidores de OpenAI
Ideal para: usuarios de OpenAI que ya tienen API key y quieren un stack uniforme

DeepSeek Embeddings

Cloud
  • Muy bajo coste
  • Stack uniforme con DeepSeek LLM
  • Calidad algo inferior a OpenAI
  • Los datos pasan por servidores de DeepSeek
Ideal para: usuarios de DeepSeek que quieren el stack más económico posible

Dimensiones de los modelos de embeddings

Las dimensiones son el "tamaño" del índice. Más dimensiones = más preciso, pero más espacio en disco.

ModeloProveedorDimensionesEspacio por doc.
bge-m3Ollama1 024~4 KB
nomic-embed-textOllama768~3 KB
text-embedding-3-smallOpenAI1 536~6 KB
DeepSeek EmbeddingsDeepSeek1 024~4 KB

Preguntas frecuentes

Respuestas a las dudas más comunes

¿Puedo usar CerebrIA sin internet?

Sí, si usas Ollama como proveedor de LLM y embeddings. Con OpenAI, Claude o DeepSeek necesitas conexión a internet para cada consulta, ya que la IA se ejecuta en sus servidores.

¿Son seguras mis API Keys?

CerebrIA guarda tus claves en el fichero de configuración local de tu ordenador (appsettings.json o similar). Nunca se envían a ningún servidor de CerebrIA. Las claves se usan únicamente para comunicarse directamente con OpenAI/Anthropic/DeepSeek desde tu máquina.

Buenas prácticas: no compartas el fichero de configuración, no subas las claves a GitHub y actívalas o desactívalas desde el panel del proveedor si sospechas que se han comprometido.

Ollama es muy lento en mi PC. ¿Qué puedo hacer?

La velocidad de Ollama depende del hardware. Algunas opciones:

  • Usa un modelo más pequeño: llama3.2:3b en lugar de modelos de 8B o 70B.
  • Si tienes GPU NVIDIA, asegúrate de que Ollama la detecta (instala los drivers CUDA).
  • Cierra otras aplicaciones que consuman RAM mientras usas CerebrIA.
  • Considera usar OpenAI o DeepSeek si la velocidad es prioritaria.
¿Puedo cambiar el LLM sin perder mis documentos?

Sí. Cambiar de LLM (por ejemplo, pasar de OpenAI a Claude) es completamente seguro y no afecta a tus documentos ni a los embeddings. Puedes cambiarlo en cualquier momento desde Configuración.

¿Qué pasa si cambio el modelo de embeddings?

Es la operación más crítica. Si cambias el modelo de embeddings, todos los documentos ya indexados deben ser eliminados y reingresados desde cero. Esto puede tardar desde minutos hasta horas dependiendo del número de documentos.

CerebrIA detecta automáticamente si el modelo configurado no coincide con el del índice y te avisa antes de que ocurra un error. Sigue las instrucciones de la interfaz en ese momento.

He ingresado documentos pero las respuestas no son buenas. ¿Por qué?

Varias causas posibles:

  • Calidad del PDF: PDFs escaneados (imágenes) no se leen bien. Usa el modo de refinamiento automático para limpiar el texto.
  • Modelo muy pequeño: Con Ollama, los modelos de 3B tienen capacidad limitada. Prueba con llama3.1:8b si tu PC lo permite.
  • Pregunta demasiado vaga: Intenta ser más específico, incluye términos clave del documento.
  • Dominio incorrecto: Verifica que estás buscando en el dominio correcto.
¿Cómo sé que Ollama está funcionando?

Abre el navegador y ve a http://localhost:11434. Si ves "Ollama is running", está activo. También puedes comprobar la lista de modelos instalados ejecutando en la terminal:

ollama list

Esto muestra todos los modelos descargados y disponibles.

¿Puedo usar un LLM de un proveedor y embeddings de otro?

Sí. CerebrIA está diseñado exactamente para esto. Por ejemplo, puedes usar:

  • Claude (LLM) + OpenAI text-embedding-3-small (embeddings) — combina lo mejor de ambos
  • Ollama/llama3 (LLM) + OpenAI text-embedding-3-small (embeddings) — LLM local con mejor indexado
  • OpenAI GPT-4 (LLM) + Ollama bge-m3 (embeddings) — ahorra coste en embeddings

La única restricción es que, una vez elegido el modelo de embeddings, no debes cambiarlo sin reingestar los documentos.

¿Mis documentos se guardan en la nube?

No. CerebrIA es una aplicación de escritorio local. Tus documentos, embeddings y base de datos vectorial (Qdrant) se almacenan íntegramente en tu ordenador.

Si usas OpenAI, Claude o DeepSeek, los fragmentos de texto de los documentos sí se envían a sus servidores para generar los embeddings y las respuestas. Si esto no es aceptable, usa Ollama para todo.

¿Todo listo para empezar?

Descarga CerebrIA, elige tu proveedor favorito y empieza a hacer preguntas a tus documentos en minutos.

Volver al inicio Descargar CerebrIA