| | 1 | = CoriolisCluster = |
| | 2 | |
| | 3 | == Acces == |
| | 4 | |
| | 5 | === Client Terminaux === |
| | 6 | |
| | 7 | Utiliser NXClient version 2 , telechargeable sur http://www.nomachine.com/download.php section NX Client Desktop Edition |
| | 8 | |
| | 9 | Configurer la connection, le nom d'hote est bigone.coriolis-legi.org; Si vous accedez depuis l'exterieur de coriolis il faut cocher la case " Enable SSL for all traffic" dans le menu 'Advanced'. |
| | 10 | |
| | 11 | * De l'interieur, selectionner l'option 'General/LAN'. |
| | 12 | * Pour un clavier francais, utiliser le menu 'Advanced/Keyboard/French(Alternative)' ET si vous avez toujours des problemes sous KDE : |
| | 13 | * tapez la commande setxkbmap fr |
| | 14 | * dans le menu "Control Center" puis "Regional & Accessibility" puis Keyboard Layout choisissez Model 105 Keys et layout France, |
| | 15 | vous devriez avoir un petit drapeau dans la barre de menu en bas a droite pour selectionner votre clavier francais. |
| | 16 | * If the graphical response is slow,select options in the configuration menu of NXclient: |
| | 17 | * Disable !DirectDraw |
| | 18 | * Disble deferred screen update |
| | 19 | |
| | 20 | === Acces données === |
| | 21 | |
| | 22 | L'acces aux données depuis l'exterieur necessite un client scp/ssh , par exemple filezilla |
| | 23 | |
| | 24 | Configurer le client !FileZilla (http://sourceforge.net/project/showfiles.php?group_id=21558) ainsi : |
| | 25 | |
| | 26 | Menu Fichier : gestionnaire de site : Nouveau site |
| | 27 | |
| | 28 | Hote : bigone.coriolis-legi.org |
| | 29 | |
| | 30 | Tpe de serveur : SFTP |
| | 31 | |
| | 32 | compte : normal |
| | 33 | |
| | 34 | nom d'utilisateur etc |
| | 35 | |
| | 36 | |
| | 37 | |
| | 38 | == Espace de stockage == |
| | 39 | |
| | 40 | Une baie de 10TB utile est connectée sous /coriolis/bigone/PROJETS |
| | 41 | |
| | 42 | Les disques partagés des autres PC sont dans /coriolis ; me demander pour ajouter un partage particulier. |
| | 43 | |
| | 44 | == Matlab == |
| | 45 | |
| | 46 | executer matlab depuis un terminal, ou en entrant matlab dans le champ s'affichant apres avoir pressé les touches Alt+F2 |
| | 47 | |
| | 48 | Par defaut, matlab est lancé avec une priorité basse de 10 afin de ne pas perdre de reactivité du système lors de l'execution de longues routines de matlab. |
| | 49 | |
| | 50 | Matlab est installé, le fichier contenant les paths n'est pas modifiable , si vous desirez ajouter vos propres repertoires il faut creer votre propre A COMPLETER |
| | 51 | |
| | 52 | == Gestionnaire de jobs == |
| | 53 | |
| | 54 | === SGE Sun Grid Engine === |
| | 55 | |
| | 56 | Il existe diferentes files d'attentes (queue) : civ.q pour les calculs civ et fast.q pour les calculs interactifs. |
| | 57 | |
| | 58 | La soumission sur civ.q par |
| | 59 | {{{ |
| | 60 | qsub -q civ.q script_sge_a_executer |
| | 61 | }}} |
| | 62 | ajoute le script en fin de liste d'attente |
| | 63 | |
| | 64 | La soumission sur fast.q par |
| | 65 | {{{ |
| | 66 | qrsh -q fast.q commande_a_executer |
| | 67 | }}} |
| | 68 | distribue immediatement la commande , ATTENTION au retour de la commande, il est possible que la soumission echoue et dans ce cas la commande n'est pas executée. |
| | 69 | |
| | 70 | Etat des differentes files d'attente: |
| | 71 | {{{ |
| | 72 | qstat -f |
| | 73 | }}} |
| | 74 | |
| | 75 | verifier que le systeme tourne: |
| | 76 | {{{ |
| | 77 | echo "date > /coriolis/bigone/tmp/hostn"|qsub -q civ.q |
| | 78 | }}} |
| | 79 | |
| | 80 | check which nodes are working properly |
| | 81 | {{{ |
| | 82 | wwlist |
| | 83 | }}} |
| | 84 | |
| | 85 | Liste des jobs d'un utilisateur : |
| | 86 | {{{ |
| | 87 | qstat -u username |
| | 88 | }}} |
| | 89 | |
| | 90 | Nombre de jobs : |
| | 91 | {{{ |
| | 92 | qstat -u username | wc -l |
| | 93 | watch qstat -u username | wc -l |
| | 94 | }}} |
| | 95 | |
| | 96 | Impression de l'ID des jobs : |
| | 97 | {{{ |
| | 98 | qstat -u flor|grep job_| awk -F" " '{print$1}' |
| | 99 | }}} |
| | 100 | |
| | 101 | Changement priorité de ces jobs : |
| | 102 | {{{ |
| | 103 | for i in `qstat -u flor|grep job_| awk -F" " '{print$1}'`;do qalter -p 100 $i;done |
| | 104 | }}} |
| | 105 | |
| | 106 | Supprimer les jobs en erreur: |
| | 107 | qmod -c civ.q |
| | 108 | |
| | 109 | Supprimer tous les jobs en attente : |
| | 110 | {{{ |
| | 111 | qstat | cut -f 1 -d ' '| tail -n +3 | xargs qdel |
| | 112 | }}} |
| | 113 | |
| | 114 | === Integration de MPI === |
| | 115 | |
| | 116 | Nous avons integrer lam-mpi dans sge , le path de lam est /usr/local/lam-7.1.2 |
| | 117 | |
| | 118 | Pour lancer un job mpi il faut specifier le parallel environnement "lam"<br/> |
| | 119 | Par exemple : |
| | 120 | {{{ |
| | 121 | qsub -q lam.q -pe lam 20 /coriolis/bigone/PROJETS/063D3C/run2/j1.job |
| | 122 | }}} |
| | 123 | va lancer le jo j1.job sur 20 slots , dans la queue lam.q en utilisant le "pe" lam. |
| | 124 | |
| | 125 | En bypassant sge il faut : |
| | 126 | {{{ |
| | 127 | /usr/local/lam-7.1.2/bin/lamboot -v -ssi boot rsh /usr/local/lam-7.1.2/etc/hostList.ALL |
| | 128 | mpirun -np 20 /CIVX/bin/civ3d3c -p /coriolis/bigone/PROJETS/063D3C/run2/1.xml |
| | 129 | }}} |
| | 130 | |
| | 131 | == Calculs == |
| | 132 | |
| | 133 | |
| | 134 | Calculs CIV : utiliser la fonction/bouton BATCH pour que vos jobs soient traités sur le cluster; pour visualiser l'etat de la file d'attente, vous pouvez dans une fenetre terminal utiliser les fonctions : |
| | 135 | pour afficher toute la file : |
| | 136 | {{{ |
| | 137 | qstat -q civ.q |
| | 138 | }}} |
| | 139 | |
| | 140 | pour afficher vos jobs dans la file : |
| | 141 | {{{ |
| | 142 | qstat -q civ.q -u username |
| | 143 | }}} |
| | 144 | |
| | 145 | pour compter le nombre de jobs en attente : |
| | 146 | {{{ |
| | 147 | qstat -q civ.q | grep w | wc -l |
| | 148 | }}} |
| | 149 | |
| | 150 | pour afficher les jobs en erreur : |
| | 151 | {{{ |
| | 152 | qstat -q civ.q | grep Eqw |
| | 153 | }}} |
| | 154 | |
| | 155 | pour compter le nombre de jobs en erreur : |
| | 156 | {{{ |
| | 157 | qstat -q civ.q | grep Eqw | wc -l |
| | 158 | }}} |
| | 159 | |
| | 160 | pour avoir des informations sur un job en erreur |
| | 161 | {{{ |
| | 162 | qstat -j job_number |
| | 163 | }}} |
| | 164 | |
| | 165 | == Monitoring == |
| | 166 | |
| | 167 | Ganglia permet de suivre l'utilisation des ressources disques, memoire et CPU : http://bigone/ganglia |
| | 168 | |
| | 169 | Froggy enregistre et trace la temperature, pression et humidité : http://bigone/froggy |
| | 170 | |
| | 171 | La baie de disque est accessible sur http://10.0.0.252 (depuis le cluster uniquement!), toutes les operations d'administrations peuvent etre effectuées par cette interface. |
| | 172 | |
| | 173 | Deouis bigone, pour voir le statut des noeuds : |
| | 174 | {{{ |
| | 175 | wwlist |
| | 176 | }}} |
| | 177 | |
| | 178 | |
| | 179 | |
| | 180 | == TODO == |
| | 181 | |
| | 182 | Cups et imprimante |
| | 183 | |
| | 184 | Nut |
| | 185 | |
| | 186 | ACL |
| | 187 | |
| | 188 | == !WareWulf == |
| | 189 | |
| | 190 | Image des noeuds dans /vnfs/default/ |
| | 191 | |
| | 192 | creation de l'image |
| | 193 | {{{ |
| | 194 | wwvnfs --build 2.6.18-3diskless |
| | 195 | }}} |
| | 196 | |
| | 197 | creation de l'initrd : |
| | 198 | {{{ |
| | 199 | wwmkinitrd 2.6.18-3diskless -v |
| | 200 | }}} |