Résumé :
Les applications de l'apprentissage automatique aux réseaux se sont traditionnellement appuyées sur des modèles entraînés sur des traces de paquets collectés hors ligne, sans prendre en compte le coût du déploiement des modèles en production. En conséquence, il existe un écart entre le développement de modèles statistiques pour les opérations réseau et leur application en pratique. Dans ce manuscrit, nous présentons notre travail visant à développer de nouvelles techniques qui facilitent et rendent plus efficace le développement de modèles fonctionnant dans des déploiements réseau réels. Comme première étape, nous développons des modèles pour inférer des métriques de qualité pour les services de streaming vidéo chiffrés. Nous démontrons que ces modèles sont pratiques et fournissent de nouvelles perspectives sur les relations entre la "vitesse" de l'Internet et la qualité des flux vidéo correspondants. En nous appuyant sur les leçons apprises, nous élaborons de nouvelles solutions qui répondent à divers défis tout au long de la chaîne de développement des modèles : 1) Nous développons une technique pour générer du trafic synthétique pour l'entraînement des modèles. 2) Nous développons des techniques pour explorer des représentations de données tenant compte des coûts et pour entraîner automatiquement les modèles. 3) Nous développons une méthodologie pour atténuer la dégradation des performances des modèles au fil du temps. Globalement, notre travail démontre les avantages d'une approche systématique pour relever les défis qui se posent lors de l'application de l'apprentissage automatique au trafic réseau.
Devant un jury composé de :
- Monsieur Mark CROVELLA
- Monsieur Marco FIORE
- Madame Isabelle CHRISMENT
- Madame Isabelle GUÉRIN-LASSOUS
- Monsieur Marcelo DIAS DE AMORIM
- Monsieur Andrzej DUDA
Abstract :
Applications of machine learning to networking have conventionally relied on models that are trained on offline packet traces, without regard to the cost of deploying the model in production. As a result, there remains a significant gap between the development of statistical models for network operations and their application in practice. In this manuscript, we present our initial work towards the development of new techniques that make it easier and more effective to develop models that work in real-world network deployments. As a first step, we develop new models to infer quality metrics for encrypted streaming video services. We demonstrate the models are practical and provide new insights about the relationships between Internet "speed" and the quality of the corresponding video streams. Building on the lessons learned, we build new solutions that address various challenges across the model development pipeline: 1) We develop a new technique to generate synthetic traffic for training models. 2) We develop new techniques to explore cost-aware data representations and automatically train models. 3) We develop a new methodology to mitigate model performance decay over time. Overall, our work demonstrates the benefits of systematically addressing the challenges that arise when applying machine learning to network traffic.
Defense in front of a jury composed by :
- Monsieur Mark CROVELLA
- Monsieur Marco FIORE
- Madame Isabelle CHRISMENT
- Madame Isabelle GUÉRIN-LASSOUS
- Monsieur Marcelo DIAS DE AMORIM
- Monsieur Andrzej DUDA
Gratuit
Disciplines