Cédric GUADALUPE
Data Engineer · Tech Lead
Compétences
Big Data
Hadoop Hive Spark Apache NiFi Flume
Cloud
GCP BigQuery Dataflow Composer Azure AWS
Intelligence Artificielle
Machine Learning Deep Learning TensorFlow PySpark
Programmation
Python Java SQL Spring Boot PHP Bash
Sécurité & DevOps
Jenkins GitLab CI Terraform Docker
Expériences
Orange — Data Engineer / Tech Lead
Depuis 2021 · Orange France / DSI / DATA-IA
Hybridation On Premise & GCP
- Participation active aux Proofs of Concept (POCs) sur les nouvelles solutions cloud Azure et AWS
- Réalisation de POCs pour évaluer et tester ces solutions cloud afin d'identifier leur pertinence pour les projets en cours (GDC Connected / AWS / Azure)
- Mise en place d'une chaîne de chargement de données BigQuery en utilisant GCS, Composer et Dataflow
- Intégration continue Jenkins (on premise) et GitLab CI + Terraform (GCP)
- Chargement automatisé de +4 000 tables sur GCP, +4 000 on premise et +100 milliards de lignes chargées par jour
- Expertise en intégration des solutions On Premise / GCP pour optimiser les processus de chargement et améliorer la performance globale
- Migration des Use-cases DMZ vers GCP et rénovation technique
- Référent Technique NiFi et de l'ensemble des chaînes de collecte DATA-IA
- Mise en place de dashboards de suivi des coûts cloud avec actions d'optimisation
Orange — Big Data Engineer
2016 — 2021 · Orange France / DTSI / DS BI
Développement des Frameworks d'alimentation Hub Data (+2 000 flux entrants, +100 flux sortants)
- Développement d'outils Python pour générer des tables et transformer les données
- Optimisation des étapes de chargement Hive et Java
- Développement et industrialisation de l'alimentation streaming avec NiFi et Flume
Développement de Use Cases sur le Hub Data
- Hub Data Erable : collecte des logs d'applications mobiles (OMOI, OTVP, Mon Réseau) pour calculer des indicateurs restitués sur Tableau Server
- Historique Interventions : récupération des comptes-rendus d'intervention des techniciens via une API Spring Boot
- Use-case Adresse : croisement des adresses clients avec les référentiels IGN et Fantoir (Ministère des Finances) pour corriger 42C dans le cadre du déploiement Fibre, basé sur un algorithme de Machine Learning PySpark (TF-IDF + Distance) et une API Spring Boot
Axigate — Développeur JAVA GWT
Septembre 2015 — Décembre 2015 · Paris 14ème
Développement d'un Système d'Information de Santé :
- Utilisation du Framework Google Web Toolkit et Spring Data JPA
- Mise en place de l'intégration continue et des tests automatisés avec Jenkins et Gatling
Orange — Développeur SI
2012 — 2015 · Orange France / DTSI / DQD
Développement au Département de la Qualité des Données :
- Application de planification et de suivi d'activités développée en PHP et Bootstrap
- Référentiel documentaire pour indexer et archiver l'ensemble des documents de DQD
- ETL : DMExpress / Talend — Scripts : Bash / Perl / PL-SQL
- Bases SGBD : MySQL / Oracle / SQLite / MongoDB
Orange — Expert Technique National (Niveau 3)
2010 — 2012 · Orange FRANCE / UAT IDF
Expert au sein de l'EANH (Expertise-Assistance-National-Home) :
- Rétablir les services internet et mobile des clients Orange
- Piloter et aider les téléconseillers niveau 2
- Tester les nouveaux services et produits d'Orange afin de référencer les nouveaux processus de Commande/Livraison et les communiquer aux équipes métiers
Diplômes & Certifications
| Année | Diplôme / Certification | Établissement |
|---|---|---|
| 2022 | Certification Data Science | École Polytechnique — Paris |
| 2012–2015 | Diplôme d'Ingénieur — Spécialité Systèmes d'Information | CNAM — Paris |
| 2014 | Stage International | Staffordshire University — Royaume-Uni |
| 2010–2012 | BTS Informatique Industrielle (IRIS) | CFA Dorian — Paris |
| 2010 | BAC STI Électronique | Lycée Newton — Clichy |
Formations
| Période | Formation |
|---|---|
| 2024–2025 | Azure — Parcours Data Engineer (12 modules) |
| 2021–2025 | GCP — Parcours Core Infrastructure (8 modules) + Data Engineer (8 modules) |
| 2023 | Deep Learning avec TensorFlow |
| 2019 | Machine Learning — Zenika |
| 2018 | Agilité et DevOps — Octo |
| 2017 | Concours du Meilleur Développeur de France — 66ème général · 16ème Java |
| 2016 | Spark Java & Scala — Octo |
Autres
Distinctions & Engagements
- 🏅 Membre des experts DTSI — Orange
- 🏟️ Volontaire JO Paris 2024
Centres d'intérêt : Bricolage · Veille technologique · Cinéma