L'Infrastructure Technique du DistriLab


Une infra en cours d'évolution


L'infrastructure du DistriLab est pour l'instant composée du regroupement un peu hétéroclite de ce que mose et 12b hébergent chacun de leur coté. (voir la page Historique du DistriLab)

Une migration de ces hébergements vers une infrastructure commune plus cohérente est en préparation et sera réalisée courant 2022.

L'infrastructure courante

Serveurs et systèmes d'exploitation


Il y a :
- 4 serveurs VPS que mose loue chez Scaleway
- 2 serveurs dédiés que 12b loue dans un data center
- 4 serveurs que 12b fais tourner chez lui
- un serveur chez Hetzner financé par le canard refractaire

Les serveurs dédié de 12b sont sous Debian GNU/Linux v10 (Buster) et utilisent l'hyperviseur ProxMox VE pour gérer des machines virtuelles KVM et des conteneurs LXC.
Les machines virtuelles et conteneurs sont sous Debian GNU Linux v10 (Buster) ou v11 (Bullseye)

Les VPS de mose sont sous Debian GNU/Linux v8 (Jessy) ou v9 (Stretch)

Les serveurs que 12b fais tourner chez lui sont sous Debian v10 (Buster).
ProxMox VE est utilisé sur certains de ces serveurs pour gérer des machines virtuelles KVM et des conteneurs LXC. Les machines virtuelles et conteneurs étant sous Debian GNU Linux v10 (Buster) ou v11 (Bullseye)
OpenMediaVault est utilisé sur les autres qui servent de NAS sur lesquels sont stockés des sauvegardes des serveurs.

Sauvegardes et reprise d'activité


Les services hébergés ne sont pas tous sauvegardés dans les règles de l'art :
- certains ne sont sauvegardé que manuellemùent, quand mose et 12b y pensent. (c'est a dire pas souvent)
- certains sont sauvegardé toutes les nuit via rsync par un des NAS qui sont chez 12b. Mais il n'y a pas d'historisation des sauvegardes (seule la dernière version est conservée)
- Les machines virtuelles et conteneur LXC qui sont sous proxmox sur les serveurs que 12b loue en datacenter sont sauvegardées une fois par semaine, sur le disque du serveur hôte, et les deux dernieres sauvegardes sont conservées.
- Les machines virtuelles et conteneur LXC qui sont sous proxmox sur les serveurs que 12b fais tourner chez lui sont sauvegardées une fois par jour, sur le disque du serveur hôte, et les deux dernieres sauvegardes sont conservées. De plus une réplication de toutes les machines virtuelles et conteneurs est également réalisée sur un deuxième serveur toute les 15 minutes.

Les procédures de reprise d'activité ne sont pas bien formalisées et ne sont pas testées régulièrment.

Les sauvegardes et les procedure de reprise d'activité sont un des gros chantier en cours du DistriLab.

Instrumentation, surveillance et alertes


A une époque mose avait mis en place un système de monitoring basé sur elasticsearch, kibana, metricbeat et heartbeat. Mais ce système s'est avéré peu pratique a utiliser et à été abandonné.
Un nouveau système doit être mis en place pendant la migration vers la nouvelle infrastructure mutualisée.
Pour l'instant la surveillance et les alertes sont faites par les utilisateurs qui signalement aux admin sys quand quelque chose ne fonctionne pas bien.

Automatisation


Ansible est utilisé pour automatiser certaines taches d'admnistration. Mais son utilisation n'est pas encore généralisé à tout ce qu'il est possible d'automatiser. C'est encore un chantier en cours.

Feuille de route infrastructure 2022


Nous sommes en train de définir la stratégie de consolidation de l'infrastructure 2022.

Serveurs et systèmes d'exploitation


Sauvegardes et reprise d'activité


Instrumentation, surveillance et alertes


Automatisation