Bridging the Gap Between Machine Learning and Networked Systems

Accès directs

Agenda de l'ENS de Lyon

Résumé :
Les applications de l'apprentissage automatique aux réseaux se sont traditionnellement appuyées sur des modèles entraînés sur des traces de paquets collectés hors ligne, sans prendre en compte le coût du déploiement des modèles en production. En conséquence, il existe un écart entre le développement de modèles statistiques pour les opérations réseau et leur application en pratique. Dans ce manuscrit, nous présentons notre travail visant à développer de nouvelles techniques qui facilitent et rendent plus efficace le développement de modèles fonctionnant dans des déploiements réseau réels. Comme première étape, nous développons des modèles pour inférer des métriques de qualité pour les services de streaming vidéo chiffrés. Nous démontrons que ces modèles sont pratiques et fournissent de nouvelles perspectives sur les relations entre la "vitesse" de l'Internet et la qualité des flux vidéo correspondants. En nous appuyant sur les leçons apprises, nous élaborons de nouvelles solutions qui répondent à divers défis tout au long de la chaîne de développement des modèles : 1) Nous développons une technique pour générer du trafic synthétique pour l'entraînement des modèles. 2) Nous développons des techniques pour explorer des représentations de données tenant compte des coûts et pour entraîner automatiquement les modèles. 3) Nous développons une méthodologie pour atténuer la dégradation des performances des modèles au fil du temps. Globalement, notre travail démontre les avantages d'une approche systématique pour relever les défis qui se posent lors de l'application de l'apprentissage automatique au trafic réseau.

Devant un jury composé de :

Monsieur Mark CROVELLA
Monsieur Marco FIORE
Madame Isabelle CHRISMENT
Madame Isabelle GUÉRIN-LASSOUS
Monsieur Marcelo DIAS DE AMORIM
Monsieur Andrzej DUDA

Abstract :

Applications of machine learning to networking have conventionally relied on models that are trained on offline packet traces, without regard to the cost of deploying the model in production. As a result, there remains a significant gap between the development of statistical models for network operations and their application in practice. In this manuscript, we present our initial work towards the development of new techniques that make it easier and more effective to develop models that work in real-world network deployments. As a first step, we develop new models to infer quality metrics for encrypted streaming video services. We demonstrate the models are practical and provide new insights about the relationships between Internet "speed" and the quality of the corresponding video streams. Building on the lessons learned, we build new solutions that address various challenges across the model development pipeline: 1) We develop a new technique to generate synthetic traffic for training models. 2) We develop new techniques to explore cost-aware data representations and automatically train models. 3) We develop a new methodology to mitigate model performance decay over time. Overall, our work demonstrates the benefits of systematically addressing the challenges that arise when applying machine learning to network traffic.

Defense in front of a jury composed by :

Monsieur Mark CROVELLA
Monsieur Marco FIORE
Madame Isabelle CHRISMENT
Madame Isabelle GUÉRIN-LASSOUS
Monsieur Marcelo DIAS DE AMORIM
Monsieur Andrzej DUDA

Gratuit

Mots clés

Disciplines

Informatique

Accès directs

Outils

Agenda de l'ENS de Lyon

Bridging the Gap Between Machine Learning and Networked Systems