La Universidad del Norte cuenta con un vasto corpus normativo (reglamentos estudiantiles, resoluciones, políticas) disperso en cientos de páginas y PDFs. Actualmente, los estudiantes enfrentan dificultades para encontrar respuestas a sus dudas administrativas debido a que los buscadores tradicionales por palabras clave carecen de comprensión semántica. Por otro lado, delegar esta tarea a Modelos de Lenguaje (LLMs) comerciales como ChatGPT es inviable para la institución: expone la privacidad de los datos a terceros, genera costos recurrentes por consulta y corre el riesgo de generar respuestas inventadas ("alucinaciones") sobre temas normativos críticos.
Para resolver esta brecha, nace UNINORMA, un Asistente Virtual conversacional 100% local (On-Premise) basado en la arquitectura RAG (Generación Aumentada por Recuperación) y Modelos de Lenguaje Pequeños (SLM, específicamente Qwen 2.5:1.5b). En lugar de depender de la nube, el sistema recupera fragmentos exactos de una base de datos vectorial local (ChromaDB) y redacta respuestas precisas basadas estrictamente en la documentación oficial de la universidad.
El proyecto abarca el ciclo de vida completo del sistema: desde un pipeline automatizado que extrae y procesa los PDFs normativos (incluyendo OCR), pasando por una API orquestada con LangChain y FastAPI, hasta llegar a una interfaz web moderna en Next.js. Todo el sistema está paquetizado en contenedores Docker y optimizado para ejecutarse en hardware de consumo y dispositivos Edge (Orange Pi).
UNINORMA democratiza el acceso a la información institucional, permitiendo a los estudiantes consultar sus deberes y derechos en lenguaje natural. Su principal innovación es garantizar privacidad absoluta (los datos nunca salen de la red local), costo operativo cero por inferencia y mitigación de alucinaciones, ya que cada respuesta generada incluye la cita exacta y la página del documento fuente utilizado.
| Documento | Descripción |
|---|---|
| Informe.md | Documento principal del proyecto |
| Instalación.md | Guía de instalación, desarrollo y despliegue |
| Desarrollo.md | Detalles técnicos del desarrollo |
| Nombre | GitHub |
|---|---|
| Carlos Mendoza Sandoval | @imcarlosmsX |
| Jesus de la Cruz Bonett | @jesusdlacrz |
| Juan Aragón Amador | @Juanjo1217 |
- Eduardo Zurek Varela
- Augusto Salazar Silva