Formation Écosystème NoSQL - focus sur Cassandra et MongoDB – Objectifs, programme et débouchés

Objectifs

• Comprendre les principes, les familles et les cas d'usage des bases de données NoSQL dans une architecture

Data/IA.

• Modéliser et interroger des données avec Cassandra (CQL) et MongoDB (requêtes/agrégations), en appliquant

les bonnes pratiques.

• Mettre en place un environnement NoSQL (cluster local, supervision de base) et savoir choisir la technologie

adaptée au besoin.

Description

— Comprendre NoSQL & démarrer avec Cassandra

• Définition des bases NoSQL et contexte d'usage (données non/semi-structurées, scalabilité)

• Panorama des familles : clé-valeur, document, colonnes, graphe

• Comparaison NoSQL vs relationnelles : schéma, scalabilité, transactions, jointures

• Définition d'Apache Cassandra : base distribuée, scalable, architecture masterless

• Avantages/défis : performances en écriture, haute disponibilité, limites des requêtes complexes

• Installation et exploration : cluster local, nodetool, cqlsh

— Modélisation et CQL (CRUD) avec Cassandra

• Conception centrée sur les requêtes, dénormalisation et patterns de tables

• Choisir les clés de partition, éviter les partitions trop grandes, notion de clustering

• Opérations CRUD en CQL : INSERT, SELECT, UPDATE, DELETE, TTL (initiation)

• Composants clés : nodes, clusters, data centers, partitions/tokens

• Cycle de vie d'une requête : routage, coordination, lecture/écriture, réponse

• Stratégies de réplication et niveaux de cohérence

• Monitoring et maintenance : nodetool, métriques, logs

— Cassandra vs MongoDB : critères & benchmark

• Modèle de données : colonnes (Cassandra) vs documents (MongoDB)

• Requêtes : CQL vs requêtes JSON-like + agrégations

• Tolérance aux pannes : réplication Cassandra, réplication/sharding MongoDB (concepts)

• Cas d'usage : écritures massives et séries temporelles (Cassandra), données semi-structurées et requêtes

riches (MongoDB)

• Exercice pratique : benchmark de performance sur cas d'usage

— Démarrer avec MongoDB : modélisation & CRUD

• Définition MongoDB : base orientée documents (BSON), flexibilité du schéma

• Avantages/défis : requêtes riches, indexation, limites sur écritures massives

• Installation et exploration : MongoDB Shell, Compass

• Modélisation orientée accès : embedding vs referencing, gestion des relations

• Index : principes, choix et impacts (initiation)

• CRUD et introduction à l'agrégation (pipeline simple)

• Exercice pratique : modéliser et interroger des documents

Conditions d'accès

Pour suivre cette formation dans de bonnes conditions, il est recommande de posseder des notions de bases de
donnees relationnelles, notamment en SQL, ainsi qu une comprehension des concepts fondamentaux tels que les
tables, les cles et les index. Une connaissance des commandes Linux de base - navigation dans le systeme, gestion
des fichiers, utilisation des ports - ainsi qu une comprehension generale du fonctionnement d un service sont
egalement attendues. Enfin, des bases en programmation, en Python ou en JavaScript, sont necessaires afin
d executer des scripts simples et de comprendre les exemples abordes durant la formation.

Écosystème NoSQL - focus sur Cassandra et MongoDB

Objectifs

Description

Conditions d'accès

Liste des sessions

CAPLOGY INNOVATION