Big Data Engineering

Course Features

Course Details

Big Data ENGINEERING GIN5L08
Enseignant:
Email:
Durée totale du cours: 45 H
Semestre : 5
Option : Ingénierie logicielle
Nombre de crédits : 3
Option ingénierie des connaissances
Nombre de crédits : 2
Modules spécialisés Modules de base Sciences et techniques de l'ingénierie Préparation à la carrière professionnelle
X
 
Nombre dheures Activités hors classe
45 38
  Code        : GIN5L08                   Big Data Engineering                                                                   Volume Horaire : 1h30 Cours intégrés & 1h30 Travaux pratiques (par semaine)

Sommaire

Ce plan de cours vise à fournir une base solide en ingénierie Big Data, en mettant l'accent sur la compréhension des concepts, la maîtrise des outils et des technologies, ainsi que l'application pratique dans des projets réels. Les évaluations, les devoirs et les projets pratiques tout au long du cours aideront les étudiants à renforcer leurs compétences et à se préparer à des carrières dans le domaine du Big Data et de l'ingénierie logicielle.

Objectifs d’apprentissage et compétences visées

Le cours de Big Data Engineering a pour objectif de fournir aux étudiants les compétences nécessaires pour comprendre, concevoir, développer et gérer des solutions Big Data dans un contexte professionnel. À la fin du cours, les étudiants devraient être capables de :
  • Comprendre les concepts fondamentaux du Big Data, y compris les volumes de données massifs, la variété des données, la vélocité des données, la véracité des données et la valeur des données (les 5V).
  • Analyser les défis et les opportunités associés au Big Data dans les domaines de l'ingénierie logicielle.
  • Maîtriser les outils et les technologies couramment utilisés dans le traitement des données massives, tels que Hadoop, Spark, Kafka, et les bases de données NoSQL.
  • Concevoir des architectures Big Data robustes et évolutives pour répondre aux besoins spécifiques d'une entreprise.
  • Acquérir des compétences en collecte, nettoyage, transformation, stockage et analyse de données massives.
  • Comprendre les aspects de la sécurité et de la confidentialité liés au Big Data.
  • Appliquer les compétences acquises pour résoudre des problèmes concrets en utilisant des ensembles de données volumineux.

Contenu du Cours par Semaine:

Semaine 1-2 : Introduction au Big Data
  • Introduction aux concepts de base du Big Data et aux défis associés.
  • Historique et évolution du Big Data.
  • Applications du Big Data dans l'ingénierie logicielle.
Semaine 3-4 : Architecture Big Data
  • Compréhension des architectures Big Data, y compris les architectures en lot et en temps réel.
  • Étude de cas d'architectures Big Data populaires.
Semaine 5-6 : Hadoop et MapReduce
  • Introduction à Hadoop et à son écosystème.
  • Programmation MapReduce.
  • Traitement de données massives avec Hadoop.
Semaine 7-8 : Apache Spark
  • Introduction à Apache Spark et ses avantages par rapport à Hadoop.
  • Programmation Spark en Scala.
  • Traitement de données massives en temps réel avec Spark Streaming.
Semaine 9-10 : Bases de Données NoSQL
  • Comprendre les bases de données NoSQL (MongoDB, Cassandra, etc.).
  • Modélisation de données NoSQL.
  • Intégration de bases de données NoSQL dans des applications Big Data.
Semaine 11-12 : Streaming de Données
  • Compréhension du streaming de données et de ses applications.
  • Utilisation d'Apache Kafka pour la gestion du streaming de données.
  • Traitement de flux de données en temps réel.
Semaine 13-14 : Sécurité et Éthique dans le Big Data
  • Questions de sécurité liées au Big Data.
  • Protection des données personnelles et conformité.
  • Éthique dans l'utilisation des données massives.
Semaine 15-16 : Projets Pratiques
  • Les étudiants travaillent sur des projets concrets mettant en œuvre les compétences acquises tout au long du cours.
  • Présentation des projets et évaluation finale.

Méthodes d’enseignement et d’apprentissage

  • Enseignement frontal avec des exemples à résoudre en
  • Travaux pratiques (laboratoire)
  • Travaux à faire à domicile (mini-projet, exposé, compte-rendu, …)

Connaissances et compétences pré-requises

  • Systèmes de gestion de fichiers, BDs relationnelles, Linux, Programmation fonctionnelle, Java, Documents structurés (XML/JSON), web services REST, conteneurs Docker

Références bibliographiques

  • Notes de cours (présentations Beamer) et fiches de TP
  • Docuementation, Tutoriels et sandbox hortonworks : https://fr.hortonworks.com/tutorials/
  • Documentation, tutoriels et sandbox Spark : http://spark.apache.org/docs/latest/
  • "Big Data: A Revolution That Will Transform How We Live, Work, and Think" par Viktor Mayer-Schönberger et Kenneth Cukier.
  • "Hadoop: The Definitive Guide" par Tom White.
  • "Spark: The Definitive Guide" par Bill Chambers et Matei Zaharia.
  • "Data-Intensive Text Processing with MapReduce" par Jimmy Lin et Chris Dyer.
  • "Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems" par Martin Kleppmann.
  • "Streaming Systems: The What, Where, When, and How of Large-Scale Data Processing" par Tyler Akidau, Slava Chernyak, et Tyler Akidau.
  • "Big Data Analytics: A Hands-On Approach" par Arshdeep Bahga et Vijay Madisetti.

Modalité d’évaluation

  • 40% Contrôle continu (TP noté, Test, Assiduité, Devoir surveillé, travaux non présentiel, …)
  • 60% Examen semestriel

Résultat d'apprentissage :

Lorsqu'un étudiant réussit un cours de Big Data Engineering en vue d'obtenir un diplôme d'ingénieur en Génie Informatique, il devrait acquérir un ensemble de compétences techniques et d'autres compétences professionnelles. Voici une liste de compétences que les étudiants peuvent espérer acquérir après avoir réussi ce cours : Compétences Techniques :
  1. Traitement des données massives (Big Data) : Comprendre les concepts fondamentaux du Big Data, y compris la collecte, le stockage, le traitement et l'analyse de grandes quantités de données.
  2. Programmation : Maîtriser les langages de programmation couramment utilisés dans le domaine du Big Data, tels que Python, Java, Scala, et posséder des compétences en développement de scripts et d'applications Big Data.
  3. Bases de données distribuées : Savoir concevoir, mettre en place et gérer des bases de données distribuées, notamment des technologies telles que Hadoop, Spark, NoSQL, et les entrepôts de données.
  4. Analyse de données : Être capable de réaliser des analyses de données avancées, y compris la modélisation prédictive, l'apprentissage automatique, et la visualisation des données.
  5. Infrastructure Cloud : Comprendre l'utilisation et la gestion des ressources de cloud computing pour le stockage et le traitement des données, comme Amazon Web Services (AWS), Microsoft Azure, Google Cloud Platform (GCP), etc.
  6. Sécurité des données : Avoir une compréhension approfondie des principes de sécurité des données, y compris la protection des données sensibles et la conformité aux réglementations.
  7. Architecture Big Data : Pouvoir concevoir des architectures Big Data évolutives et performantes en utilisant des composants tels que les clusters Hadoop, les bases de données distribuées, les moteurs de traitement en continu, etc.
Compétences Professionnelles :
  1. Communication : Être capable de communiquer efficacement avec des équipes multidisciplinaires, des gestionnaires de projet et des parties prenantes pour expliquer les résultats et les besoins en matière de données.
  2. Gestion de projet : Avoir une compréhension de base de la gestion de projet pour planifier, organiser et exécuter des projets Big Data avec succès.
  3. Résolution de problèmes : Pouvoir résoudre des problèmes complexes liés aux données, aux performances et à l'infrastructure.
  4. Éthique professionnelle : Comprendre les enjeux éthiques liés à la collecte et à l'utilisation des données, et être capable de respecter les normes éthiques dans le traitement des données.
  5. Apprentissage continu : Être disposé à suivre les dernières tendances et évolutions technologiques dans le domaine du Big Data et à continuer à se former tout au long de la carrière.
  6. Collaboration : Travailler efficacement en équipe avec des ingénieurs logiciels, des scientifiques des données, des administrateurs de bases de données, etc., pour atteindre les objectifs de l'entreprise.
  7. Adaptabilité : Être capable de s'adapter aux changements rapides dans le domaine de la technologie et du Big Data
This course does not have any sections.

More Courses by this Instructor


Proud of NASCAR and its supporters and fans. They won put up with disrespecting our Country or our Flag they said it loud and clear! words Friday and Saturday sparked a massive show of defiance Sunday as more than 200 NFL players protested by choosing not to stand for the national anthem. Many coaches locked arms with the players. Goal was to provide cheap china jerseys open dialogue and communication. We listened to one another. We believe it the best way to work through any issue we are facing, on and off the field, owners Terry and Kim Pegula said in a statement distributed by the Bills. Trump remarks were divisive and disrespectful to the entire NFL community, but we tried to use them as an opportunity to further unify our team and our organization. Our players have the freedom to express themselves in a respectful and thoughtful manner and we all agreed that our sole message is to provide and to promote an environment that is focused on love and equality. "Within hours, cheap jerseys certainly, and probably less, the Ranger regiment officers, high ranking officers back in the States were conspiring to cover this up," Krakauer says. military's highest honors, immediately began moving through the Army ranks something that is not done cheap nfl jerseys for deaths by friendly fire, Krakauer says. 'Prairie niggers' is an insult. Those are very upsetting to our kids. But 'Redskins' is an honorable name we wear with pride. He wondered how to tell the Willpinit Redskins the "name they wear proudly across their chests is insulting them. Because they have no idea.". According to the "Princeton Review," there are no prerequisites for sports management positions, but most general managers in the NFL have similar backgrounds as former scouts, accountants or athletes.Start in SchoolGMs in the NFL must have a passion for the game. They typically have experience either playing or coaching football. "This pro football has been personally hand cheap china jerseys signed by Hall of Fame defensive tackle Joe Greene with the inscription ""HOF 87"". This product is officially licensed by the National Football League and comes with an individually numbered; tamper evident hologram from Mounted Memories. To ensure authenticity, the hologram can be reviewed online. This oakley sunglasses sale process helps to ensure that the product purchased is authentic and eliminates any possibility of duplication or Retro Jordans fraud. " Setting Point Spreads, OddsOddsmakers do more than predict the outcome of games. They weigh myriad factors to determine which team is favored by how many points. In individual sports or group events, they set odds on which individual or team is most likely to win. They set odds that spread the betting encouraging bets on the underdogs and discouraging bets on heavy favorites. Their goal is to create higher betting volume and more wins than losses for the sports cheap jerseys book.
Need Help? Chat with us