Kueue: La forma más sencilla de gestionar colas de trabajos y recursos en Kubernetes

Kueue es una potente herramienta diseñada para mejorar la gestión de colas de trabajos y recursos dentro de los clústeres Kubernetes. Al ofrecer un conjunto de APIs y un controller, Kueue te permite gestionar eficientemente la ejecución de trabajos, la asignación de recursos y el rendimiento general del clúster.

Kueue es un sistema de colas de trabajos nativo de la nube para aplicaciones por lotes, HPC, AI/ML y similares en un clúster Kubernetes.

Utiliza Kueue para construir un servicio por lotes multi-tenant con cuotas y una jerarquía para compartir recursos entre equipos de tu organización. En función de las cuotas disponibles, Kueue decide cuándo los trabajos deben esperar y cuándo y dónde deben ejecutarse.

Kueue funciona en combinación con el kube-scheduler estándar, el cluster-autoscaler y el resto del ecosistema de Kubernetes. Esta combinación permite a Kueue ejecutarse tanto on-prem como en la nube, donde los recursos pueden ser heterogéneos, fungibles y aprovisionados dinámicamente.

Características Clave para Cargas de Trabajo Optimizadas en Kubernetes

  • Job Management (Gestión de trabajos): Kueue permite la puesta en cola de trabajos priorizados con estrategias flexibles como StrictFIFO y BestEffortFIFO.
  • Resource Management (Gestión de recursos): Logra un reparto equitativo de los recursos e implementa políticas de preemption entre los distintos tenants.
  • Dynamic Resource Reclaim (Recuperación dinámica de recursos): Libera automáticamente la cuota a medida que se completan los pods de trabajo, maximizando la utilización de los recursos.
  • Resource Flavor Fungibility (Fungibilidad de los tipos de recursos): Permite el préstamo de cuotas o preemption en ClusterQueues y Cohorts para una mayor flexibilidad.
  • Amplia gama de integraciones: Integración perfecta con tipos de trabajo populares, como BatchJob, trabajos de entrenamiento Kubeflow, RayJob, RayCluster, JobSet y Pods simples.
  • Información detallada del sistema: Obtén información valiosa sobre el estado de tu sistema a través de métricas Prometheus y Conditions incorporados.

Preparación para producción y soporte robusto

Kueue cuenta con una versión API v1beta1 madura, documentación completa, amplia cobertura de pruebas y verificación de escalabilidad. Con lanzamientos regulares, seguridad robusta y una creciente lista de usuarios en entornos de producción, Kueue es una solución fiable para gestionar tus cargas de trabajo de Kubernetes.

Instalación y uso sencillo

Kueue es compatible con Kubernetes 1.22 y superiores. Instala la última versión sin esfuerzo con un solo comando:

# ¡Comprueba la versión si es necesario!

kubectl apply --server-side -f [https://github.com/kubernetes-sigs/kueue/releases/download/v0.7.0/manifests.yaml

Consulta la documentación de Kueue para obtener guías de instalación detalladas y ejemplos de uso.

Documentation
Powerful, extensible, and feature-packed frontend toolkit. Build and customize with Sass, utilize prebuilt grid system and components, and bring projects to life with powerful JavaScript plugins.

Roadmap

El desarrollo de Kueue está impulsado activamente por los comentarios y contribuciones de la comunidad. En 2023, la hoja de ruta del proyecto prioriza:

  • Preemption cooperativa para cargas de trabajo con checkpointing.
  • Estrategias de asignación de flavors para optimizar la asignación de recursos.
  • Integración con el cluster-autoscaler para el aprovisionamiento garantizado de recursos.
  • Mayor integración con diversas cargas de trabajo personalizadas como Kubeflow, Spark, Ray y herramientas de flujo de trabajo.

Los objetivos a largo plazo incluyen soporte presupuestario, un panel de control fácil de usar y soporte multi-clúster.

Comunidad y soporte

Únete a la vibrante comunidad de Kueue para mantenerte informado, participar en debates y contribuir al desarrollo continuo del proyecto. Conéctate con los mantenedores a través de Slack y la lista de correo para obtener soporte y colaborar.

Empieza a usar Kueue

Kueue ofrece un enfoque simplificado y eficiente para la gestión de colas de trabajos y recursos en Kubernetes. Aprovechando sus potentes funciones, puedes optimizar el rendimiento de tu clúster, garantizar una asignación equitativa de los recursos y agilizar tus procesos de gestión de cargas de trabajo. ¡Instala Kueue hoy mismo y experimenta los beneficios de primera mano!

GitHub - kubernetes-sigs/kueue: Kubernetes-native Job Queueing
Kubernetes-native Job Queueing. Contribute to kubernetes-sigs/kueue development by creating an account on GitHub.
Nicolás Georger

Nicolás Georger

Self-taught IT professional driving innovation & social impact with cybernetics, open source (Linux, Kubernetes), AI & ML. Building a thriving SRE/DevOps community at SREDevOps.org. I specialize in simplifying solutions through cloud native technologies and DevOps practices.