Sundara vel SELVARAJ svelselvaraj@gmail.
com
Data Engineer Île-de-France
À la recherche d'opportunités CDI en ingénierie des données pour +33 752395567
appliquer 5+ ans d'expérience dans le domaine des données afin
de concevoir, mettre en œuvre, déployer et maintenir les systèmes @sundara-vel-selvaraj
de traitement des données de manière robuste, scalable, sécurisé
et performante rendant l’entreprise Data Intelligente. @sundaravelss
FORMATIONS EXPÉRIENCES PROFESSIONNELLES
2019 Consultant Lead Data Engineer Oct 2022- Présent
Master en science des données et
BNP Paribas
Analytique (Bac +5)
• Conception et création d’une plateforme de données centralisée - DATAHUB
École Pour l'Informatique et les Techniques
pour consolider, fédérer et valoriser des data assets massifs, pour des cas
Avancées (EPITA), Paris
d'utilisation tels que le reporting, l'analytics et Machine learning
2015 • Mise en place d’une application d’intégration provenant de différentes
Baccalauréat en génie – EEE (Bac +3)
sources et de divers formats dans le Datahub Raw Layer
Anna University, India
• Développement des applications Spark pour appliquer les règles métier,
CORE COMPETENCES enrichir, transformer les données selon les spécificités métier
• Migration vers Cloud infrastructure avec Kubernetes, Object Storage, Spark
• Langages de programmation : Python, as a service et Airflow as a service
Scala, Java, SQL • Optimisation des performances, Sécurité, Data Management et
• Bases de données : MySQL, Postgres, gouvernance
MongoDB, Elastic, Cassandra Environnement Technique : Kafka, Spark, Hadoop, Oozie, Kubernetes, Airflow,
• Big Data: Kafka, Spark, Hadoop, Airflow, IBM COS, Minio, Scala, Python, SQL, Dremio, AB initio, Gitlab , Jenkins, JIRA
Beam
• Cloud Data Tools: AWS Glue, Bigquery, GCP Consultant Data Engineer Oct 2021-Sept 2022
Dataflow, Dataproc, Pub/Sub Credit Agricole
• Data Governance: Atlas, Datahub, Abinitio • Mise en place de pipelines de traitement de données de bout en bout, de
• BI outils: Tableau, Dataiku l’ingestion à l’exposition
• Devops: Git, Docker, Kubernetes, Ansible, • Extraction de données de différentes sources (S3, Teradata, Kafka etc) et
Terraform, Jenkins, Gitlab CI, MLOps développement de pipeline de traitement de données avec Spark
• Cloud: AWS, GCP • Qualité des données, tests, intégration continue et déploiement (CI/CD)
• Web: Django, Fastapi Environnement Technique : Kafka, Spark, MapR, AWS S3, PostgresSQL, SQL,
• Frameworks: Pyspark, Selenium, Java, Agile, Git, Jenkins, Gitlab CI
Tensorflow, Pytorch
• OS: Windows XP, Linux, Bash Consultant Data Engineer/ Data Scientist Jan 2021-Sept 2021
• Machine Learning: Regression, Technip Energies, Paris
Classification, Dimensionality Reduction, • Conception et création de plateforme ETL avec kafka et AWS Glue
Clustering, Ensemble learning • Elaboration du modèle de machine learning pour data mining
• Neural Networks: CNN, RNN, Faster R-CNN, • Mise en place de pipelines CI/CD pour automatiser le déploiement, les
LSTM, Transformer, Bert tests, et la validation
• Développement: Agile • Industrialisation sur cloud AWS avec l’outil d’Infrastructure as code
Environnement Technique : Terraform, Ansible, Kafka, Python, Django,
APTITUDES PERSONNELLES ELK, Pytorch, AWS Glue, Docker, Git , Github, MLOps
Data Engineer/ Data Scientist Jul 2020 - Jan 2021
Adaptabilité Espirt d’équipe Kaisens Data, Paris
Résolution de problème Esprit critique • Conception et mise en place d’une architecture de flux d’alimentation
Curiosité intellectuelle de données basée sur Kafka, Airflow et Spark
Solides compétences en communication
• Développement d'outils d'API de Web scraping
• Élaboration des modèles d'IA pour l'analyse du harcèlement en temps réel
LANGUES • Mise en production des modelés Machine Learning
Environnement Technique : Kafka, Spark, Airflow, Python, Django, SQL,
French - Professionnel FastApi, MongoDB, Pytorch, Bert, Gitlab CI, Docker, Kubernetes, Selenium
Anglais - Courant
Tamoul - Courant
CERTIFICATIONS
CENTRES D'INTÉRÊT • Google Cloud Professional Data Engineer GCP-2023
• Databricks Apache Spark Associate Databricks -2022
acquérir de nouvelles compétences criquet • AWS Cloud Practitioner AWS - 2021