Los marcos de aprendizaje profundo como TensorFlow, PyTorch, Caffe, Torch, Theano y MXNet han contribuido a la popularidad del aprendizaje profundo al reducir el esfuerzo y las habilidades necesarias para diseñar, entrenar y usar modelos de aprendizaje profundo. Fabric for Deep Learning (FfDL, que se pronuncia “violín”) proporciona una forma coherente de ejecutar estos marcos de aprendizaje profundo como un servicio en Kubernetes. La plataforma FfDL utiliza una arquitectura de microservicios para reducir el acoplamiento entre componentes, mantener cada componente simple y tan sin estado como sea posible, aislar las fallas de los componentes y permitir que cada componente se desarrolle, pruebe, implemente, escale y actualice de forma independiente. Aprovechando el poder de Kubernetes, FfDL proporciona un marco de aprendizaje profundo escalable, resistente y tolerante a fallas. La plataforma utiliza una capa de distribución y orquestación que facilita el aprendizaje de una gran cantidad de datos en un período de tiempo razonable en todos los nodos informáticos.