Table of Contents
La IA híbrida ya no es una idea futurista ni un experimento aislado dentro de las empresas. Durante una presentación técnica en el reciente Red Hat Summit, la compañía de tecnología dejó claro que el gran reto actual no es solamente acceder a modelos de inteligencia artificial generativa, sino lograr que funcionen de forma eficiente, segura y rentable dentro de entornos corporativos reales. Desde bancos hasta organizaciones gubernamentales, el foco ahora está en controlar costos, proteger datos privados y desplegar agentes inteligentes capaces de operar de manera autónoma.
La IA generativa es la última iteración de eso, explicó uno de los voceros durante la sesión, recordando que muchas empresas ya venían trabajando desde hace años con analítica, machine learning e IA predictiva. La diferencia, aseguran, es la velocidad a la que evoluciona el ecosistema actual.
El verdadero problema de la IA empresarial: costos, complejidad y control
Aunque herramientas públicas como ChatGPT, Claude o Gemini aceleraron la adopción de la IA generativa, muchas organizaciones comenzaron a encontrar obstáculos cuando intentaron escalar sus proyectos.
Esos costos de token están realmente siendo prohibitivos, señalaron durante la conferencia, haciendo referencia al gasto creciente asociado al uso masivo de modelos comerciales.
A esto se suma otro desafío clave: integrar datos privados corporativos con modelos públicos. En sectores altamente regulados -como banca, defensa o salud- enviar información sensible a servicios externos simplemente no es viable.
Tratamos con muchos clientes que están en industrias reguladas, tienen datos privados y requerimientos de IA soberana, comentaron los expertos de Red Hat.
Por esa razón, la compañía está apostando por una plataforma de IA empresarial diseñada para operar en ambientes híbridos: nube pública, nube privada, infraestructura on-premise e incluso entornos desconectados de internet.
Inferencia optimizada: menos costos y más rendimiento
Uno de los ejes más importantes de la propuesta es la optimización de inferencia, es decir, la capacidad de ejecutar modelos de IA de manera más eficiente.
La empresa destacó el uso de tecnologías como vLLM (Virtual Large Language Model) y LLMD (Large Language Model) para desplegar inferencia distribuida y reducir el costo por token. Según explicaron, esto permite ejecutar modelos grandes utilizando menos recursos y obteniendo mejores tiempos de respuesta.
Reducir los costos de inferencia va a ser un tema común aquí, afirmaron.
Dentro de la demostración, Red Hat mostró cómo las empresas pueden seleccionar distintos niveles de cuantización de modelos como Nemotron 120B (familia de inteligencias artificiales de código abierto desarrolladas por NVIDIA), ajustando el rendimiento según el hardware disponible, incluyendo GPUs NVIDIA y AMD.
La cuantización se ha convertido en un punto estratégico dentro de la IA empresarial porque permite comprimir modelos sin perder demasiada precisión, reduciendo consumo energético y costos operativos.
Modelos as a Service: IA privada con experiencia similar a OpenAI
Otro de los anuncios relevantes fue la llegada de “Modelos as a Service” (MAS) dentro de Red Hat AI 3.4.
La idea es simple: permitir que las empresas publiquen modelos internos como si fueran servicios similares a OpenAI, pero completamente bajo su propio control.
Esto significa que los desarrolladores internos pueden acceder a modelos mediante APIs y llaves privadas, mientras los administradores mantienen visibilidad sobre el consumo de tokens, límites de uso y costos por departamento.
La propuesta busca facilitar la adopción de IA generativa sin depender totalmente de proveedores externos.


Datos privados: la clave para que la IA sea realmente útil
Uno de los mensajes más fuertes de la sesión fue que una IA sin datos empresariales propios termina siendo genérica.
Si no puedes proporcionar tu dato privado al modelo, tu IA es genérica, afirmó uno de los presentadores.
Por eso Red Hat mostró herramientas enfocadas en prompting avanzado, RAG (Retrieval-Augmented Generation) y automatización de pipelines de validación.
El objetivo es ayudar a las empresas a conectar sus modelos con información interna, bases de conocimiento y documentos privados para obtener respuestas más precisas y contextualizadas.
Durante la demostración también se habló sobre AutoML, una nueva función orientada a simplificar el entrenamiento de modelos predictivos.
Esto realmente acelera el proceso por el que se pueden construir esos modelos de IA predictiva, explicaron.
Agentes de IA: la próxima evolución del software empresarial
La parte más ambiciosa de la presentación estuvo enfocada en los agentes inteligentes.
Para Red Hat, los agentes representan la evolución natural del desarrollo de aplicaciones empresariales. Ya no se trata únicamente de chatbots que responden preguntas, sino de sistemas autónomos capaces de ejecutar tareas, consultar bases de datos, interactuar con herramientas externas y tomar decisiones.
El agente va a ser la diferencia entre útil y productivo, resumieron durante la conferencia.
Uno de los ejemplos mostrados fue un sistema bancario donde un agente analizaba automáticamente solicitudes financieras, consultaba ratios de deuda, ejecutaba modelos predictivos y generaba evaluaciones de riesgo sin intervención humana constante.
Eso sí, la compañía insistió en que el futuro de los agentes depende de dos factores críticos: seguridad y trazabilidad.
Necesitamos mayor control sobre estos sistemas, señalaron.
Por ello, integraron herramientas de observabilidad con MLflow para monitorear cada acción ejecutada por los agentes, incluyendo decisiones, consultas y uso de herramientas externas.
Una plataforma pensada para el futuro de la IA híbrida
La visión de Red Hat deja algo claro: el futuro de la inteligencia artificial empresarial no dependerá únicamente de tener el modelo más potente, sino de contar con plataformas capaces de administrar inferencia, datos y agentes de forma segura y eficiente.
La compañía cree que los agentes inteligentes seguirán el mismo camino que recorrieron las aplicaciones cloud-native hace más de una década: pasar rápidamente de una novedad tecnológica a una necesidad empresarial.
Y viendo la velocidad actual del mercado, honestamente, no parece una argumentación descabellada.
🌎 Punto de encuentro
Ahora la gran pregunta es: ¿las empresas realmente están preparadas para darle autonomía real a los agentes de IA dentro de sus operaciones críticas?















