Derrière ce titre provocateur se cache un triste constat : je ne peux recommander aucune marque de PC. Pourquoi ? Parce qu'on assiste à une "tabletisation", c'est à dire un prix bas destiné à vendre en masse, avec des composants sous-dimensionnés, plein de crapwares préinstallés et pas de choix de l'OS.
Secure boot c'est génial, c'est du pain béni pour Microsoft et les constructeurs. On vous impose Windows 10, l'OS qui n'a pas de mode sans échec, et on ne vous fourni pas les CD. En cas de problème faites une restauration système ce qui remettra tous les crapwares que vous avez désinstallé pendant des heures. Oui, exactement comme sur les tablettes et smartphones.
En poussant l'idée plus loin, je dirais même que le dépannage de machines est devenu chiant. Avant on avait des pannes matérielles, des demandes d'évolution (ajout de RAM ou SSD), des nettoyages de virus. Aujourd'hui le dépannage ça se résume à dézombifier des machines, l'utilisateur ayant installé n'importe quoi il se retrouve avec une avalanche d'adwares et de services non désirés. Et donc le boulot consiste à les nettoyer sachant que Windows est l'un des seuls OS en 2016 qui ne peut désinstaller que 1 logiciel à la fois de manière PUTAIN D'EXTRÊMEMENT LENTE. Sérieusement on a 8GB de RAM, des CPU 8 coeurs, des SSD, et pourtant DÉSINSTALLER UN LOGICIEL SUR WINDOWS EST TOUJOURS UN CALVAIRE.
Ah oui et depuis quelques mois j'ai constaté beaucoup de problèmes avec les mises à jour de Windows 7, Windows Update ne les trouve plus ou l'installation échoue (après de longues minutes voire heures bien entendu). De là à y voir un complot de Microsoft qui veut une fois de plus vous forcer à manger du Windows 10, il n'y a qu'un pas que je franchis. Des heures et des heures passées à bidouiller le registre, renommer des dossiers dans System32 en espérant que cela débloque Windows Update.
Faire du dépannage informatique aujourd'hui c'est comme un mécanicien automobile qui passerait sa journée à bricoler des voitures lowcost qui n'avancent pas car le moteur est sous-dimensionné et alourdit par des pièces de fonte que l'utilisateur aurait ramassé involontairement sur la route.
La solution ? Taper dans les gammes PRO des constructeurs (et encore, pas tous) car on a du matériel un peu plus sérieux, un OS moins crapwarisé et un peu plus de souplesse (secure boot désactivable, voir retour au BIOS). Malheureusement c'est un peu moins accessible et plus cher, mais il serait temps que les gens comprennent qu'acheter une tablette à 50€ et un PC à 150€ est une mauvaise idée et ne sert qu'à alimenter un marché qui s'est emballé et finira par exploser en laissant un tas de gens sur le bord de la route. Faites des achats plus raisonnés et choisissez des marques sérieuses, oubliez le lowcost. Et au passage utilisez LINUX l'un des derniers OS qui n'envoie pas vos données sur internet et ne vous force pas à migrer vers la version supérieur : Ubuntu ou Mint si vous débutez, Manjaro ou Fedora si vous voulez un truc très à jour, Debian ou Mageia si la stabilité est un point important pour votre utilisation.
Mon blog a pour sous-titre "le sysadmin qui raconte des histoires". Voici donc le récit d'une nuit passée au datacenter pour remettre en fonctionnement nos serveurs suite à une coupure électrique.
Dans la nuit du 30 Juin au 1er Juillet 2015 un important incident électrique a eu lieu dans l'Ouest de la France, impactant de nombreuses villes en Bretagne et dans les Pays de Loire. J'étais d'astreinte cette nuit là et je ne parvenais pas à dormir en raison de la chaleur (38°c en fin de soirée).
0h00. Je constate que plusieurs de nos serveurs ne répondent pas : absence de ping et pas d'accès IPMI / iDRAC donc impossible de faire quoi que ce soit à distance. Je dois donc me rendre en urgence au datacenter.
01h00. Arrivé sur place je croise d'autres techniciens venus eux aussi réparer leurs serveurs. J'entre mais n'ayant pas le code pour ouvrir la baie je suis obligé d’appeler mon collègue. Celui ci me le fourni et me propose de venir me filer un coup de main : vu la situation j'accepte. Une fois la baie ouverte je fais un contrôle visuel des voyants, tout est au vert, la raison de la panne est donc plus profonde. En branchant un PC sur le switch de la baie je fais un premier diag et je constate que les machines virtuelles sont toutes en carafe ainsi que deux serveurs physiques. Je note aussi que les quelques équipements fonctionnels ont un uptime d'à peine une heure, il y a donc eu un redémarrage général (non prévu).
01h30. J'ai trouvé la cause du non démarrage des VMs : le datastore iSCSI est offline. Heureusement je parviens à le remonter rapidement : le daemon iscsi-target était arrêté sur le SAN. Après l'avoir lancé je remonte les VMs, tout passe sauf quelques vieux serveurs Windows qui affichent des BSOD. Je charge une iso win2k3 puis tente des chkdsk mais rien à faire. Mon collègue est arrivé et a emmené de quoi tenir : des gâteaux et de l'eau. Nous attaquons donc ensemble le diagnostic de ces VMs Windows qui ne veulent pas démarrer et comprenons qu'il faut les mettre sur même serveur Xen qu'avant leur exctinction. En effet notre infra Xen est composée de 3 serveurs reliés à un datastore et les VMs peuvent démarrer dessus au choix. Cela ne pose pas de problèmes pour Linux, en revanche un vieux Windows n'aime pas. Nous faisons donc plusieurs essais jusqu'à trouver le serveur qui leur convient, nous paramétrons ensuite Xen pour que ces VMs précisent ne puisse démarrer que sur celui-là.
03h00. Les machines virtuelles sont maintenant fonctionnelles mais pas certains serveurs physiques, nous cherchons donc la raison. En fait un switch réseau a perdu partiellement sa configuration, probablement parce qu'elle n'a pas été sauvegardée dans la flash. En effet si vous avez fait du Cisco vous savez probablement qu'il y a plusieurs niveaux de sauvegarde de la configuration : le running-config (effacé au redémarrage) et le startup-config (permanent). Après avoir réaffecté les VLANs aux bons ports, les serveurs physiques repassent enfin en UP, sauf un.
03h30. Sur ce serveur réticent nous branchons un écran + clavier et constatons qu'il est bloqué au niveau de Grub. Après avoir booté un LiveCD de Gparted nous lançons une réparation du RAID1 logiciel qui est cassé à l'aide de mdadm. Mais la reconstruction ne suffit pas, Grub refuse toujours de booter. Nous démarrons alors à nouveau sur le LiveCD et faisons un chroot pour réinstaller Grub, à coup de update-grub et grub-install (sur sda puis sdb). Cette fois ça fonctionne !
04h30. Échange téléphonique avec le CTO qui nous aide à vérifier que tous les services sont bien rétablis. Nous corrigeons les derniers problèmes existants.
6h00. Nous partons nous coucher pour pouvoir attaquer la journée à 09h00. En ouvrant la porte de sortie du datacenter je constate qu'il fait jour et que le sol est humide alors que j'y suis rentré de nuit sous une chaleur étouffante. J'aperçois aussi d'autres techniciens aller et venir avec des serveurs sous le bras, nous ne sommes donc pas les plus malchanceux.
Résumé : Une brève coupure électrique a provoqué l’extinction puis l'allumage de nos équipements. 1 serveur physique a cassé son RAID1, le datastore pour Xen n'a pas correctement démarré, et le switch a perdu partiellement sa configuration. Malgré la fatigue nous avons gardé la tête froide, aidés par l'adrénaline et les gâteaux. Nous avons résisté à cette épreuve du feu, en équipe, et avons gagné 1 journée de repos en compensation.
Le HP Proliant Gen8 G1610T format micro tour est un petit serveur en forme de cube ayant la particularité d'offrir 4 baies de disque. Il est totalement silencieux avec une consommation électrique maîtrisée et est proposé à un prix abordable. Il existe en version Intel Celeron ou Intel Xeon, la première étant trouvable à moins de 300 euros (j'ai eu le miens à 226€ neuf chez Amazon en Septembre). Ce n'est pas si cher si on le compare à un NAS Synlogy d'autant qu'on a droit à du hardware beaucoup plus intéressant :
CPU Intel Celeron G1610T (double cœur, 64 bits, virtualisation)
2GB de RAM ECC (extensible)
2 cartes réseau gigabit
iLo (KVM IP)
Un emplacement PCI Express 16x format low profile.
Consommation en idle et sans disques de ~30W
Silencieux
On a donc un vrai serveur sur lequel on peut mettre l'OS de son choix et faire de la virtualisation.
Après avoir mis 8GB de RAM ECC ainsi que 4 disques de 1To dans les baies, j'ai installé FreeNAS sur une clé USB. Au démarrage le ventilateur souffle fort (puisqu'on a affaire à un vrai serveur) mais il ralenti progressivement pour devenir quasiment inaudible. C'est simple : ce serveur fait moins de bruit qu'une Bbox Sensation fibre.
Je connaissais déjà un peu FreeNAS mais il y a quelques années encore je n'étais pas très familier avec ZFS et FreeBSD. Aujourd'hui je le suis beaucoup plus et je découvre donc à quel point ce produit est bon. Quelle joie d'avoir à portée de main les outils pour gérer un zpool, programmer des scrub périodiques, des snapshots avec durée de rétention, des dataset, des périphériques block...
Bien entendu FreeNAS est orienté NAS donc au delà de ZFS on a les fonctionnalités de partage Windows, UNIX et Apple ainsi qu'une gestion complète des utilisateurs (intégration LDAP ou AD possible).
Les sysadmin FreeBSD seront ravis de noter la présence des jails. Si vous voulez que votre NAS fasse office de serveur DNS, il suffit de créer une jail qui tournera sur FreeBSD 9.3 et dans laquelle vous pourrez configurer named. Backuppc ? Idem, une jail avec les ports qui vont bien (ou pkg).
Pour le stockage j'ai testé deux configurations :
4 disques en raidz-1, similaire à du RAID5 : 3TB utiles
2 disques en mirror + 2 disques en mirror, similaire à du RAID10 : 2TB utiles.
La première configuration semble la plus avantageuse car elle offre la plus grosse capacité de stockage mais souffre de mauvaises performances en écriture sans que je comprenne réellement pourquoi (bloqué à 30Mo/s). Refaire le zpool avec 3 disques + 1 spare règle le problème mais c'est dommage d'avoir un disque inutilisé. Il faut noter aussi que beaucoup de sysadmin déconseillent le raidz-1/RAID5 en raison de la reconstruction stressante en cas de changement de disque. Cet excellent article résume la situation. La deuxième configuration en mirror+mirror n'offre que 2TB de stockage (50%) mais fonctionne mieux et la maintenance est facilitée. Voici mon zpool de stockage "data" :
[root@freenas] ~# zpool status
pool: data
state: ONLINE
scan: scrub repaired 0 in 1h38m with 0 errors on Wed Jan 20 03:38:41 2016
config:
NAME STATE READ WRITE CKSUM
data ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
gptid/094171e0-69d3-11e5-81a0-d0bf9c46b918 ONLINE 0 0 0
gptid/0a481bb7-69d3-11e5-81a0-d0bf9c46b918 ONLINE 0 0 0
mirror-1 ONLINE 0 0 0
gptid/0b1b6253-69d3-11e5-81a0-d0bf9c46b918 ONLINE 0 0 0
gptid/0bf02931-69d3-11e5-81a0-d0bf9c46b918 ONLINE 0 0 0
errors: No known data errors
Explication : le zpool data est composé de deux vdev additionnés : mirror-0 et mirror-1. Chaque mirror est composé de deux disques qui, comme leur nom l'indique, sont en miroir (comme du RAID1). Notez qu'il n'y a pas de "stripping" comme dans le RAID10 entre mirror-0 et mirror-1, les données sont écrites là où il y a de la place. L'avantage est qu'on peut avoir deux vdev de taille différente. Par exemple mirror-0 pourrait faire 1TB et mirror-1 faire 2TB, le zpool aurait donc une taille de 1+2 = 3TB là où un RAID10 s'alignerait sur le plus petit et n'aurait donc que 2TB disponibles. ZFS permet aussi de remplacer les disques au fur et à mesure et augmenter la taille du stockage, le tout à chaud. Pour la petite histoire, je l'ai déjà fait sur un serveur de production en remplaçant des disques de 2TB par des 4TB, le zpool est passé de 4 à 6 puis à 8TB.
La compression lz4 est activée par défaut dans FreeNAS car avantageuse en terme de stockage mais aussi de performances. En effet le coût CPU est faible et la réduction du nombre de blocs physiquement écrits et lus améliore la rapidité.
En conclusion le HP Proliant G1610T est le serveur que j'attendais depuis des années. Silencieux, peu gourmand mais néanmoins véloce, il a tout d'un grand surtout les baies de disque qui permettent de faire du stockage. Associé à FreeNAS, il bat toutes les solutions propriétaires du marché et se révèle beaucoup plus souple pour un sysadmin comme moi qui ne jure que par les produits qui offrent un vrai accès root.