Guía de configuración

¿Por dónde empiezo?

Elige la opción que mejor se adapte a ti

Quiero privacidad total

Ollama · Todo se procesa en tu ordenador. Sin cuentas, sin API keys, sin costes por uso. Necesitas un PC con al menos 16 GB de RAM.

Recomendado para privacidad

Quiero la mejor calidad

OpenAI GPT-5.x · Modelos de mayor capacidad. Requiere crear una cuenta y añadir método de pago. Pago por uso.

Mejor calidad general

Textos largos y técnicos

Claude · Excelente para documentación extensa, análisis técnico y razonamiento complejo. Requiere cuenta en Anthropic.

Mejor para documentos técnicos

Quiero bajo coste

DeepSeek · Alto rendimiento a fracción del coste de OpenAI. Ideal para uso intensivo. Requiere cuenta en DeepSeek.

Mejor relación calidad/precio

Consejo: Puedes cambiar de proveedor LLM en cualquier momento desde Configuración sin perder ningún documento. El proveedor de embeddings sí tiene implicaciones si lo cambias (ver sección Embeddings).

Ollama · IA 100% local

Sin internet, sin cuentas, sin costes por uso. Tus datos nunca salen de tu ordenador.

¿Qué es Ollama? Es un programa que instala y ejecuta modelos de IA directamente en tu PC o Mac, igual que instalarías cualquier otra aplicación. Una vez instalado, CerebrIA lo usa de forma transparente.

Requisitos mínimos del sistema

16 GB RAM mínimo
32 GB recomendado

5-15 GB espacio libre
por modelo descargado

CPU moderna
GPU opcional pero mejora mucho la velocidad

Windows 10/11
macOS o Linux también

Para RAG de trabajo (no solo pruebas): recomendamos empezar en modelos 7B o superiores. Por debajo de 7B, la calidad suele ser insuficiente para respuestas fiables sobre documentos reales.

Recomendación práctica de hardware (RAG local)

Mínimo útil (7B)
CPU potente + 32 GB RAM

GPU recomendada
16 GB VRAM para 20B-27B cuantizados

NVIDIA
RTX 5060 Ti 16 GB o superior

AMD
RX 9070 o superior (válida)

Referencia: para ir realmente holgado, una RTX 4090 o una RX 7900 XTX van muy bien, pero normalmente se salen del perfil de presupuesto objetivo.

Instalación paso a paso

1

Descarga Ollama

Abre tu navegador y ve a ollama.com. Haz clic en el botón de descarga para Windows (o tu sistema operativo).

                            Web oficial
                            https://ollama.com/download
                        

Es software libre y de confianza. El instalador pesa aproximadamente 80 MB.

2

Instala Ollama

Ejecuta el instalador descargado (OllamaSetup.exe). El instalador es sencillo: acepta los términos y haz clic en "Install". No necesitas cambiar ninguna opción.

Ollama se instala como un servicio en segundo plano. Verás su icono en la barra de tareas (cerca del reloj). No necesitas abrirlo manualmente, arranca solo con Windows.

3

Descarga un modelo de lenguaje (LLM)

Abre el Símbolo del sistema (busca "cmd" en el menú inicio) o PowerShell y ejecuta:

                            Terminal — copia y pega este comando
                            ollama pull llama3.2
                        

Esto descarga el modelo Llama 3.2 (3B parámetros, ~2 GB). Es un modelo excelente para empezar.

Modelos recomendados según tu hardware

llama3.1:8bMínimo útil32 GB RAM · GPU opcional●●●○○

gpt-oss:20bRecomendado32-64 GB RAM · 16 GB VRAM●●●●○

qwen3:27bRecomendado64 GB RAM ideal · 16 GB VRAM mínimo●●●●●

La descarga puede tardar varios minutos según tu conexión. El progreso se muestra en la terminal.

4

Descarga un modelo de embeddings

Los embeddings son necesarios para que CerebrIA entienda el contenido de tus documentos. Descarga el modelo recomendado para Ollama:

                            Terminal
                            ollama pull bge-m3
                        

bge-m3 ofrece muy buen equilibrio para búsqueda semántica multilingüe. Si priorizas ligereza, nomic-embed-text sigue siendo una alternativa válida.

Importante: Una vez que ingieras documentos con un modelo de embeddings concreto, cambiar de modelo requiere reingestar todos los documentos desde cero. Elige bien desde el principio (ver guía de embeddings).

5

Verifica que Ollama funciona

Abre tu navegador y ve a:

                            Comprobación en navegador
                            http://localhost:11434
                        

Si ves el texto "Ollama is running", ¡todo está listo!

Si no ves ese mensaje, abre el Símbolo del sistema y ejecuta ollama serve para iniciar el servicio manualmente.

6

Configura CerebrIA para usar Ollama

En CerebrIA, ve a Configuración → Proveedor de IA y selecciona:

Proveedor LLM Ollama

URL de Ollama http://localhost:11434

Modelo LLM llama3.2 (o el que hayas descargado)

Proveedor Embeddings Ollama

Modelo Embeddings bge-m3

API Key No necesaria · Dejar vacío

¡Listo! CerebrIA ya puede funcionar completamente offline. Todos tus documentos y conversaciones se procesan en tu propio ordenador.

OpenAI · GPT-5.x

El proveedor más popular. Excelente equilibrio entre calidad, velocidad y facilidad de uso.

¿Qué es una API Key? Es una contraseña especial que OpenAI te da para que sus modelos de IA puedan usarse desde aplicaciones como CerebrIA. Necesitas una cuenta y un método de pago, pero el coste es muy bajo: procesar un documento típico cuesta menos de 0,01 €.

Obtener tu API Key de OpenAI

1

Crea una cuenta en OpenAI

Ve a la plataforma de desarrollo de OpenAI:

                            Abre en el navegador
                            https://platform.openai.com/signup
                        

Puedes registrarte con tu email, o con tu cuenta de Google o Microsoft. Elige la opción que prefieras.

2

Añade un método de pago

Sin crédito, las llamadas a la API no funcionan. Ve a:

                            En el panel de OpenAI
                            platform.openai.com → Billing → Add payment method
                        

Añade tu tarjeta de crédito/débito. OpenAI solo cobra lo que uses. Te recomendamos configurar un límite de gasto (Usage limits) de 5-10 € al mes para empezar.

Coste orientativo: Ingestar 100 documentos PDF medianos cuesta aproximadamente 0,10 - 0,50 €. Una consulta completa cuesta entre 0,001 y 0,01 €.

3

Genera tu API Key

En el panel de OpenAI, ve a:

                            Ruta en el panel
                            platform.openai.com → API keys → Create new secret key
                        

Dale un nombre descriptivo (por ejemplo, "CerebrIA") y haz clic en Create secret key.

¡Cópiala ahora! La clave solo se muestra una vez. Empieza por sk-... y tiene unos 50 caracteres. Cópiala y guárdala en un lugar seguro antes de cerrar la ventana.

4

Configura CerebrIA con tu clave

En CerebrIA, ve a Configuración → Proveedor de IA:

Proveedor LLM OpenAI

Modelo LLM gpt-5-mini (recomendado)

API Key OpenAI sk-proj-XXXXXXXXXXXX...

Proveedor Embeddings OpenAI Embeddings

Modelo Embeddings text-embedding-3-small

Modelos LLM objetivo de OpenAI

gpt-5-mini ⭐RápidoBajo●●●●○

gpt-5.2NormalMedio●●●●●

gpt-5.4NormalAlto●●●●●

Claude · Anthropic

Excepcional para documentación técnica, razonamiento complejo y textos muy largos.

Obtener tu API Key de Anthropic

1

Crea una cuenta en Anthropic

                            Abre en el navegador
                            https://console.anthropic.com/
                        

Regístrate con tu email. Anthropic puede pedirte verificación por teléfono.

2

Añade créditos

Sin crédito, la API no funciona. Ve a:

                            En el panel de Anthropic
                            console.anthropic.com → Billing → Add credit
                        

Puedes añadir desde 5 USD. Claude también ofrece una pequeña cantidad de créditos gratuitos al registrarte.

3

Genera tu API Key

                            Ruta en el panel
                            console.anthropic.com → API Keys → Create Key
                        

La clave empieza por sk-ant-.... Al igual que con OpenAI, cópiala nada más crearla y guárdala en un lugar seguro.

4

Configura CerebrIA

Proveedor LLM Claude · Anthropic

Modelo LLM claude-sonnet-4-6 (recomendado)

API Key Anthropic sk-ant-XXXXXXXXXXXX...

Proveedor Embeddings Elige según tus preferencias (ver guía de embeddings)

Modelos Claude objetivo

claude-sonnet-4-6 ⭐200K tokensMedioUso general

claude-haiku-4.5200K tokensBajoRápido y económico

claude-opus-4.8200K tokensAltoMáxima calidad

DeepSeek

Alto rendimiento a un coste hasta 10× menor que OpenAI. Ideal para uso intensivo.

Obtener tu API Key de DeepSeek

1

Crea una cuenta en DeepSeek

                            Abre en el navegador
                            https://platform.deepseek.com/sign_up
                        

Regístrate con tu email y verifica tu cuenta.

2

Recarga tu saldo

                            En el panel de DeepSeek
                            platform.deepseek.com → Top Up
                        

El mínimo es generalmente 2 USD, que dará para miles de consultas.

Coste orientativo: DeepSeek es aproximadamente 10-30 veces más barato que GPT-4. Con 2 USD puedes hacer miles de consultas.

3

Genera tu API Key

                            Ruta en el panel
                            platform.deepseek.com → API Keys → Create API Key
                        

La clave empieza por sk-.... Cópiala y guárdala.

4

Configura CerebrIA

Proveedor LLM DeepSeek

Modelo LLM deepseek-chat (recomendado)

API Key DeepSeek sk-XXXXXXXXXXXX...

Proveedor Embeddings DeepSeek Embeddings

¿Qué son los embeddings y por qué importan?

La decisión más importante antes de ingestar tus documentos

Explicación sencilla

Imagina que tienes una biblioteca enorme con miles de libros. Para encontrar información, necesitas un índice que entienda el significado de cada párrafo, no solo las palabras exactas.

Los embeddings son ese índice: un proceso que traduce cada fragmento de texto en una lista de números que captura su "significado". Cuando haces una pregunta, CerebrIA convierte tu pregunta en el mismo tipo de números y busca los fragmentos más parecidos.

El modelo de embeddings es el motor que hace esa traducción. Distintos modelos producen distintos tipos de números, y son incompatibles entre sí.

⚠️ Cambiar el modelo de embeddings requiere reingestar todos tus documentos.

Si empiezas con bge-m3 de Ollama y luego cambias a text-embedding-3-small de OpenAI, los números que tenía guardados ya no son válidos. CerebrIA detectará el cambio automáticamente y te pedirá confirmación, pero el proceso de reingestión puede llevar horas si tienes muchos documentos.

Elige bien desde el principio y no cambies salvo que sea necesario.

¿Qué modelo de embeddings elegir?

Ollama · bge-m3 (por defecto)

100% Local

Sin coste, sin internet
Privacidad total
Excelente para búsquedas multilingües
Requiere Ollama instalado
Ligeramente menor calidad que servicios cloud

Ideal para: privacidad, uso offline, documentos mixtos ES/EN y usuarios con Ollama ya configurado

OpenAI · text-embedding-3-small

Cloud

Excelente calidad general
Rápido, fiable
1 536 dimensiones, muy preciso
Coste por tokens
Los datos pasan por servidores de OpenAI

Ideal para: usuarios de OpenAI que ya tienen API key y quieren un stack uniforme

DeepSeek Embeddings

Cloud

Muy bajo coste
Stack uniforme con DeepSeek LLM
Calidad algo inferior a OpenAI
Los datos pasan por servidores de DeepSeek

Ideal para: usuarios de DeepSeek que quieren el stack más económico posible

Dimensiones de los modelos de embeddings

Las dimensiones son el "tamaño" del índice. Más dimensiones = más preciso, pero más espacio en disco.

bge-m3 ⭐Ollama1 024~4 KB

nomic-embed-textOllama768~3 KB

text-embedding-3-smallOpenAI1 536~6 KB

DeepSeek EmbeddingsDeepSeek1 024~4 KB

Preguntas frecuentes

Respuestas a las dudas más comunes

¿Puedo usar CerebrIA sin internet?

Sí, si usas Ollama como proveedor de LLM y embeddings. Con OpenAI, Claude o DeepSeek necesitas conexión a internet para cada consulta, ya que la IA se ejecuta en sus servidores.

¿Son seguras mis API Keys?

CerebrIA guarda tus claves en el fichero de configuración local de tu ordenador (appsettings.json o similar). Nunca se envían a ningún servidor de CerebrIA. Las claves se usan únicamente para comunicarse directamente con OpenAI/Anthropic/DeepSeek desde tu máquina.

Buenas prácticas: no compartas el fichero de configuración, no subas las claves a GitHub y actívalas o desactívalas desde el panel del proveedor si sospechas que se han comprometido.

Ollama es muy lento en mi PC. ¿Qué puedo hacer?

La velocidad de Ollama depende del hardware. Algunas opciones:

Usa un modelo más pequeño: llama3.2:3b en lugar de modelos de 8B o 70B.
Si tienes GPU NVIDIA, asegúrate de que Ollama la detecta (instala los drivers CUDA).
Cierra otras aplicaciones que consuman RAM mientras usas CerebrIA.
Considera usar OpenAI o DeepSeek si la velocidad es prioritaria.

¿Puedo cambiar el LLM sin perder mis documentos?

Sí. Cambiar de LLM (por ejemplo, pasar de OpenAI a Claude) es completamente seguro y no afecta a tus documentos ni a los embeddings. Puedes cambiarlo en cualquier momento desde Configuración.

¿Qué pasa si cambio el modelo de embeddings?

Es la operación más crítica. Si cambias el modelo de embeddings, todos los documentos ya indexados deben ser eliminados y reingresados desde cero. Esto puede tardar desde minutos hasta horas dependiendo del número de documentos.

CerebrIA detecta automáticamente si el modelo configurado no coincide con el del índice y te avisa antes de que ocurra un error. Sigue las instrucciones de la interfaz en ese momento.

He ingresado documentos pero las respuestas no son buenas. ¿Por qué?

Varias causas posibles:

Calidad del PDF: PDFs escaneados (imágenes) no se leen bien. Usa el modo de refinamiento automático para limpiar el texto.
Modelo muy pequeño: Con Ollama, los modelos de 3B tienen capacidad limitada. Prueba con llama3.1:8b si tu PC lo permite.
Pregunta demasiado vaga: Intenta ser más específico, incluye términos clave del documento.
Dominio incorrecto: Verifica que estás buscando en el dominio correcto.

¿Cómo sé que Ollama está funcionando?

Abre el navegador y ve a http://localhost:11434. Si ves "Ollama is running", está activo. También puedes comprobar la lista de modelos instalados ejecutando en la terminal:

ollama list

Esto muestra todos los modelos descargados y disponibles.

¿Puedo usar un LLM de un proveedor y embeddings de otro?

Sí. CerebrIA está diseñado exactamente para esto. Por ejemplo, puedes usar:

Claude (LLM) + OpenAI text-embedding-3-small (embeddings) — combina lo mejor de ambos
Ollama/llama3 (LLM) + OpenAI text-embedding-3-small (embeddings) — LLM local con mejor indexado
OpenAI GPT-4 (LLM) + Ollama bge-m3 (embeddings) — ahorra coste en embeddings

La única restricción es que, una vez elegido el modelo de embeddings, no debes cambiarlo sin reingestar los documentos.

¿Mis documentos se guardan en la nube?

No. CerebrIA es una aplicación de escritorio local. Tus documentos, embeddings y base de datos vectorial (Qdrant) se almacenan íntegramente en tu ordenador.

Si usas OpenAI, Claude o DeepSeek, los fragmentos de texto de los documentos sí se envían a sus servidores para generar los embeddings y las respuestas. Si esto no es aceptable, usa Ollama para todo.

¿Todo listo para empezar?

Descarga CerebrIA, elige tu proveedor favorito y empieza a hacer preguntas a tus documentos en minutos.

Volver al inicio Descargar CerebrIA

Configura CerebrIA desde cero

¿Por dónde empiezo?

Quiero privacidad total

Quiero la mejor calidad

Textos largos y técnicos

Quiero bajo coste

Ollama · IA 100% local

Requisitos mínimos del sistema

Recomendación práctica de hardware (RAG local)

Instalación paso a paso

Descarga Ollama

Instala Ollama

Descarga un modelo de lenguaje (LLM)

Modelos recomendados según tu hardware

Descarga un modelo de embeddings

Verifica que Ollama funciona

Configura CerebrIA para usar Ollama

OpenAI · GPT-5.x

Obtener tu API Key de OpenAI

Crea una cuenta en OpenAI

Añade un método de pago

Genera tu API Key

Configura CerebrIA con tu clave

Modelos LLM objetivo de OpenAI

Claude · Anthropic

Obtener tu API Key de Anthropic

Crea una cuenta en Anthropic

Añade créditos

Genera tu API Key

Configura CerebrIA

Modelos Claude objetivo

DeepSeek

Obtener tu API Key de DeepSeek

Crea una cuenta en DeepSeek

Recarga tu saldo

Genera tu API Key

Configura CerebrIA

¿Qué son los embeddings y por qué importan?

Explicación sencilla

¿Qué modelo de embeddings elegir?

Ollama · bge-m3 (por defecto)

OpenAI · text-embedding-3-small

DeepSeek Embeddings

Dimensiones de los modelos de embeddings

Preguntas frecuentes

¿Todo listo para empezar?