Francisco Garces-Valencia garceslabs

Garces Labs

Applied AI Systems • GenAI Reliability • Multimodal Evaluation • Agentic Systems

Building reliable AI systems and evaluation frameworks for multimodal and agentic intelligence.

Focus Areas

Agent Reliability & Evaluation Systems
Multimodal AI Infrastructure
Long-Horizon Task Evaluation
AI Coordination Frameworks
Human Feedback Loops
Production AI Quality Systems
Applied LLM Infrastructure

Current Interests

Agentic orchestration systems
Multimodal reasoning reliability
Evaluation pipelines for frontier models
Human-in-the-loop AI systems
Coordination under ambiguity
AI operational scalability

Selected Projects

Multimodal Agent Reliability Framework

Evaluation framework for hallucination detection, uncertainty scoring, multimodal consistency validation, and long-horizon task reliability.

AI Coordination System

Operational framework for release gating, evaluation orchestration, escalation management, and production AI quality workflows.

Research Orchestrator Agent

Research-grade retrieval and reasoning agent focused on evidence synthesis, contradiction detection, source ranking, and citation-aware generation.

Philosophy

Reliable AI systems are not built through model capability alone.

They emerge from strong evaluation frameworks, operational clarity, feedback systems, and coordination between humans and intelligent agents.

Tech Stack

Python FastAPI LLMs Evaluation Systems Agentic Workflows OpenAI APIs Anthropic APIs Multimodal Systems Docker Data Pipelines AI Operations

Connect

LinkedIn: link
Technical writing: coming soon

Provide feedback

Saved searches

Use saved searches to filter your results more quickly