Evaluation des liens 10 GbE de Grid'5000

Ludovic Hablot, Romaric Guillier, Sebastien Soudan et Pascale Primet

Mots clés: TCP, 10 GbE, Grid'5000, paramètrage de TCP

Aperçu:

L'instrument Grid5000 est destiné à l'étude des problématiques, des solutions et des logiciels de grille pour le calcul et le stockage distribué à large échelle.En 2006, Grid5000 s'est doté d'un réseau privé virtuel composé de liens d'accès à 1 ou 10Gb/s et de longueurs d'onde à 10Gb/s dédiées dans l'infrastructure DWDM de RENATER 4.

Ce rapport présente une étude de l'apport potentiel de cette infrastructure pour les applications distribuées via une évaluation des performances de TCP, protocole prépondérant dans ces applications. Cette étude met d'abord en lumière l'incidence très importante du paramétrage du protocole dans un tel contexte et explique le faible débit observé tant par l'opérateur que par les utilisateurs.En effet, si le comportement de TCP n'est pas maitrisé, les applications ne s'exécutent pas de manière optimale et les résultats peuvent être aléatoires. Les résultats obtenus via un calibrage adéquat ou l'utilisation de flux parallèles sont ensuite présentés. Enfin, plusieurs anomalies de configuration et de comportement de l'infrastructure sont exposées.

Par la suite, en continuant dans le même but, nous allons essayer de comprendre si le contrôle de congestion standard implémenté dans TCP sur la grille est utile ou s'il peut être amélioré en fonction de nos propres conditions. Nous allons également aider à la mise en place d'un système de métrologie. Celui-ci devrait permettre à terme de fournir à tous les utilisateurs un support pour l'exécution ou le diagnostic de leurs applications. Le but est de rendre visible un certain nombre de métriques concernant le réseau qui font pour le moment défaut. Cette métrologie devra être disponible de bout en bout pour que tous les goulots d'étranglement puissent être maitrisés par l'utilisateur.

Résultats:

Mesures des temps RTT entre les différents sites (en ms)

Source
Bordeaux Grenoble Lille Lyon Nancy Orsay Rennes Sophia Toulouse
Destination Bordeaux   16.1 11.59 9.96 12.73 8.86 8.06 10.6 3.95
Grenoble 16.04   12.83 3.3 13.24 15.15 15.22 9.87 11.36
Lille 11.61 12.84   10.16 9.19 4.54 11.23 16.78 18.51
Lyon 9.99 3.28 10.17   10.57 9.27 12.57 7.22 8.70
Nancy 12.72 13.26 9.19 10.57   5.72 11.63 17.19 18.62
Orsay 8.85 15.16 4.53 9.26 5.72   9.03 20.38 12.4
Rennes 8.04 15.22 11.23 12.56 11.63 9.03   19.18 20.65
Sophia 10.60 9.96 16.78 7.22 17.19 20.38 19.17   15.25
Toulouse 3.8 11.61 18.24 8.64 18.66 12.4 20.66 15.86  

Mesures avec le paramètrage par défaut (en Mb/s)

Ces performances ont été obtenues avec l'image par défaut sans paramètrage particulier.

Source
Bordeaux Grenoble Lille Lyon Nancy Orsay Rennes Sophia Toulouse
Destination Bordeaux   58.1 61.8 55.9 81.2 111 76.3 68.9 181
Grenoble 32.3   34 151 39.8 33.7 34.3 52.6 48.4
Lille 53.3 70   53.6 112 199 55.0 44.3 33.9
Lyon 61.5 230 71.2   97.6 106 49.8 100 72.0
Nancy 48.0 162 78.5 52.4   777 54.7 43.3 32.0
Orsay 67.8 54.1 150 58.8 936   68.7 36.2 50.8
Rennes 64.2 33.6 46.6 41.4 45.5 46.5   27.4 26.3
Sophia 47.0 46.1 29.5 67.4 28.9 22.3 25.1   34.0
Toulouse 166 47.6 29.8 65.7 29.7 44.3 26.3 36.3  

Mesures avec une configuration optimisée

Pour réaliser ces mesures, nous avons paramètré les tampons TCP à 4Mo comme indiqué dans le rapport ci dessous.

Source
Bordeaux Grenoble Lille Lyon Nancy Orsay Rennes Sophia Toulouse
Destination Bordeaux   771 725 862 911 884 852 875 685
Grenoble 900   701 925 812 893 787 911 647
Lille 738 838   120 922 848 916 598 579
Lyon 425 912 786   904 740 864 926 730
Nancy 725 851 742 865   854 938 931 622
Orsay 799 866 777 869 936   849 878 523
Rennes 912 831 787 859 914 912   839 651
Sophia 901 839 653 543 611 900 321   694
Toulouse 928 859 784 882 933 923 939 909  

Publications: