Cédric GUADALUPE
Data Engineer
Compétences
- Big Data :
- Hive
- Hadoop
- Spark
- Google Cloud Platform :
- BigQuery
- Dataflow
- Composer
- Amazon Web Services
- Java
- Python
- Apache NiFi
- SQL
Expériences
Orange - Data Engineer depuis 2016
Expérience de Hybridation On Premise et GCP :
- Mise en place d'une chaîne de chargement de données BigQuery en utilisant GCS, Composer et Dataflow
- Chargement automatisé de 3000 tables sur GCP et 4000 sur on premise
- Expertise en matière d'intégration des solutions on premise et GCP pour optimiser les processus de chargement de données et améliorer la performance globale.
Contribution au développement des frameworks d'alimentation Hub Data, gérant plus de 2000 flux entrants et sortants
- Mise en œuvre des outils de génération de tables et de transformation de données en utilisant Python
- Amélioration des processus de chargement Hive et Java pour une performance optimale
- Industrialisation de l'alimentation en streaming en utilisant NiFi et Flume
Développement et mis en œuvre des use-cases sur le Hub Data :
- Collecte de logs d'applications mobiles pour le calcul et la restitution de indicateurs sur Tableau Server
- Historique Interventions qui collecte les comptes-rendus d'intervention des techniciens via une API développée en Spring Boot
- Use-case Adresse qui effectue la correction des référentiels en croisant les adresses clients Orange avec les référentiels d'IGN et de Fantoir (Ministère des Finances) en utilisant un algorithme de machine learning en PySpark (TfIDF + Distance) et une API développée en Spring Boot.
Axigate - Développeur Java GWT de 2015 à 2016
Développement d’un Système d’Information de Santé : - Utilisation du Framework Google Web Toolkit et Spring Data JPA - Mise en place de l’intégration continue et des tests automatisés avec Jenkins et avec Gattling
Orange - Développeur SI de 2012 à 2015
- Développement de sites Intranet :
- Développement Web : HTML5 / CSS3 / PHP5 / jQuery / BootStrap
- Administration Système : VMS / AIX / Linux
- Développement d’outils de comparaison
- ETL : DMExpress / Talend
- Script : Bash / Perl / GemBase / PL/SQL
- Mise en place de base SGBD : MySQL / Oracle / SQLite / MongoDB
Orange - Expert Technique niveau 3 de 2010 à 2012
Expert National au sein de l’EANH (Expertise-Assistance-National-Home) Activités Principales :
Résoudre des nouvelles problématiques (SAV) Rétablir les services clients (Commande/Livraison) Piloter les télé-conseillers niveaux 2
Activité Ponctuelle :
Tester les nouveaux services et produits d’Orange
Diplômes/Certifications
- 2022 - Certification Data Science - Ecole Polytechnique
- 2015 - Diplôme d'ingénieur Informatique spécilité Système d'Informations - Conservatoire National des Arts et Métiers (CNAM, Paris)
- 2014 - Stage internationnal - Université Staffordshire (Royaume-uni)
- 2012 - BTS Informatique et Réseaus (IRIS) - CFA Dorian (Paris)
- 2010 - BAC STI Electronique - Lycée Newton (Clichy)
Formations
- 2023 - Deep Learning avec TensorFlow
- 2019 - Machine Learning par Zenika
- 2018 - Agilité et Devops par Octo
- 2017 - Concours du Meilleurs de Développeur de France - Classement Général 66ème et Java 16ème
- 2016 - Spark Java & Scala par Octo