
Prise de poste immédiate -
Site Reliability Engineer (SRE) qui jouera un rôle central dans la conception, le déploiement et le maintien opérationnel des environnements de nos clients et de nos infrastructures internes.
Entreprise spécialisée dans la digitalisation et l'optimisation des processus de connaissance et d'évaluation des tiers, tout en garantissant la conformité réglementaire. Actuellement, plus de 500 entreprises, notamment des établissements financiers, des fintech et de grandes entreprises, utilisent nos solutions quotidiennement pour évaluer leurs clients et fournisseurs.
En tant que SRE, tu contribueras à la conception, au déploiement et à la maintenance des environnements de nos clients ainsi que de nos environnements internes. Ton expertise et ton savoir-faire seront essentiels dans le choix des technologies et de l'architecture, dans le but d'améliorer en permanence la qualité et la fiabilité des systèmes.
Tes missions incluront :
- Développer les logiciels et les processus nécessaires pour assurer le bon fonctionnement des services.
- Collecter et analyser des métriques essentielles, telles que la disponibilité, le temps moyen de résolution des pannes, et générer de nouveaux indicateurs si nécessaire. Intégrer ces éléments aux tableaux de bord de surveillance et de reporting.
- Suivre de près l'amélioration de la disponibilité et des performances des applications, services, systèmes et infrastructures. Créer de nouvelles alertes pour détecter les anomalies et comprendre les causes profondes des défaillances système.
- Concevoir et déployer des architectures d'automatisation, d'alerte, d'auto-réparation et d'autres technologies pour faciliter la gestion de l'environnement.
- Créer et tenir à jour la documentation relative aux processus, à l'automatisation, à l'infrastructure, aux ressources et aux services.
- Des interventions hors des heures de bureau peuvent être nécessaires.
Voici quelques-unes des technologies et outils utilisés :
- Réseau : pfSense, OpenVPN, WireGuard
- Technologies : vSphere, RabbitMQ, stack ELK, Redis, PHP, Java, MySQL, Ansible, Docker
- Outils : Teams (Office 365), Notion, Gitlab, GitlabCI, Zabbix, Bat, Bash, Powershell
- Maîtrise de l'administration des environnements Windows Server et Linux (Ubuntu, pfSense).
- Maîtrise des réseaux : IPv4/v6, pare-feu, routage, NAT, VPN (openVpn,