mardi 30 octobre 2012
Troubles Clustering Windows 2003
Cet article n'est pas de Microsoft, c'est à partir de dans-le-champ les techniciens qui travaillent avec des groupes dans des situations du monde réel. Au Synergy Phoenix nous sommes contactés régulièrement pour aider les entreprises locales (petites et grandes) avec un regroupement aide dont elles ont besoin. Dans ce cas, le client dispose de 7 serveurs Windows 2003 Dell, chacun avec le NIC Broadcom double standard qui vient avec 1-U serveurs de nos jours. Comme vous le savez, ces interfaces réseau peut être "Associé" pour former une seule et même interface. Le client veut faire de leur environnement de production existant en tolérant aux pannes que possible. Ces 7 nouveaux serveurs sont nouveaux et sont configurés dans un environnement de laboratoire. Chaque exécutant Windows 2003 standard.
Qu'est-ce que nous devons travailler avec:
Ils ont deux contrôleurs de domaine Active Directory dédiés pour, ils courent le DNS pour la résolution de noms ci à la fois internes et externes. Leurs enregistrements domaines zones seront accueillis ici, ils deviendront ns1 et ns2.
Ils ont deux serveurs Web, les serveurs et trois COMPLUS. Plus tard, ils mettront en œuvre leurs clusters SQL, mais nous n'allons pas entrer dans cela ici.
Jusqu'à présent, c'est une configuration simple. Ils veulent avoir fait équipe du NIC, ayant NIC1 partir de chaque serveur branché sur switch-1, et NIC2 branché sur switch-2. Compte tenu d'un interrupteur à l'échec. Ils auront un câble cross-over entre les deux appareils permettant soit NIC à l'échec. Chaque détecteur peut être branché dans sa propre pare-feu / routeur, mais la passerelle sur chaque serveur sera mis à principalement pointer vers le FW que leur switch-1 est branché, on ajoute une IP de la passerelle deuxième avec une métrique différente pour permettre une défaillance du pare-feu primaire. Chaque pare-feu est connecté à un FAI différent et possède une adresse IP différente externe configuré. Cela permet ns2 d'être un fournisseur de services Internet IP-2, ce qui permet un échec complet de la première FAI. En ayant tous les enregistrements d'hôte sur ns2 pointant vers IP à partir du deuxième fournisseur d'accès permet à l'échec complet de tout un pan de leur ligne.
C'est la mise en page. Une fois que nous obtenons de configuration AD et DNS configuré, nous faisons équipe et configurer la carte réseau du. Tirez un peu de bouchons pour tester la théorie de la mise en place et nous sommes confiants que tout est bien. Nous avons donc maintenant à configurer et à tester le cluster.
Le pôle:
Étant donné que nous n'avons pas un équilibreur de charge réseau, nous avons pour équilibrer la charge entre les serveurs Web et les serveurs COMPLUS par voie d'équilibrage de la charge réseau Microsoft. Nous procédons à l'interface de gestion NTLB de regrouper les serveurs Web. Chacun des deux serveurs convergent dans la grappe sans accroc. Quand nous essayons de même sur les serveurs COMPLUS il ne va pas aussi bien.
Le problème:
Nous ajoutons complus1 à la grappe. Il ajoute bien évidemment le fait, il est le seul membre de la grappe. Il dit: «convergence» pour un moment, puis se met au vert. Nous nous efforçons d'ajouter complus2 au cluster et il est dit "convergence" pour toujours, il ne converge. Il reste dans l'état de «convergence» pour plus de 30 minutes, rafraîchir après rafraîchissement, d'arrêt et de démarrage, pause, d'essayer quelque chose. Nous ne pouvons pas obtenir le deuxième noeud à converger. Nous essayons complus3 ajout et obtenir le même résultat. Nous revenons sur nos pas, la vérification DNS pour la résolution interne des deux serveurs eux-mêmes et le cluster IP, tout semble bon. Nous essayons de faire un ping tous les nœuds, tout le monde semble faire un ping de chaque autre amende. IPConfig montre l'adresse IP de cluster sur chacun des serveurs COMPLUS. NTLB est lié à chaque "Team" interface. Recherche de support de Microsoft, ils insistent qu'il ya un problème avec la carte réseau. Donc, nous procédons à unteam et essayer chaque carte individuellement. Comme nous revenons sur nos pas, nous trouvons le même problème quelle que soit la carte réseau qui est que nous utilisons sur n'importe quel système. Sur un coup de tête, nous supprimer les clusters chaque réinitialisation, et ajouter complus2 premier. Ensuite, nous ajoutons complus3 à la grappe. Et ils «convergent» en quelques secondes. Essayer d'ajouter complus1 échoue. Donc, nous avons isolé le problème à un seul serveur.
La solution:
Il s'avère que NTLB a été lié sur complus1, il a été lié à chaque carte (tous deux membres de «l'équipe»). Une fois que nous re-équipe du NIC et supprimer NTLB de NIC1 et nic2, le serveur converge dans le cluster sans problème.
Résumé:
Lorsque le regroupement assurez-vous de ne sélectionner que le service NTLB sur l'une des plus NIC utilisé en tant que cluster. Aucune autre carte aurait NTLB lié à elle. Alors que nous continuons avec notre configuration proposée, tout fonctionne bien. Tous les tests sont concluants et on dirait qu'ils ont un grand défaut environnement de production tolérante. Appelle les clusters SQL, l'exécution de deux clusters SQL sur un SAN EMC en direct, sans aucune tolérance pour les temps d'arrêt, ce doit être un plaisir. Jusque-là ......
Inscription à :
Publier les commentaires (Atom)
Aucun commentaire:
Enregistrer un commentaire