On termine cette exploration avec le frère rebelle du SQL : le NoSQL (Not Only SQL).
Si le SQL est un classeur rigide avec des dossiers prédéfinis, le NoSQL est un système de stockage ultra-flexible conçu pour la rapidité, le volume massif de données et la diversité des formats (vidéos, messages, capteurs IoT).
Architecture et Fonctionnement du NoSQL
Le NoSQL a été créé pour répondre aux limites du SQL face au “Big Data”. Son architecture repose sur trois principes clés :
- Pas de Schéma Fixe (Schema-less) : Tu peux ajouter des données sans avoir défini de “colonnes” à l’avance. Chaque enregistrement peut être différent du précédent.
- Distribution (Horizontale) : Contrairement au SQL qui préfère un seul gros serveur puissant, le NoSQL est conçu pour fonctionner sur une armée de petits serveurs travaillant ensemble.
- Dénormalisation : En SQL, on sépare tout en petites tables. En NoSQL, on regroupe tout au même endroit pour éviter les calculs coûteux (les jointures) et répondre plus vite.
Les 4 grandes familles de NoSQL
Toutes les bases NoSQL ne se ressemblent pas. On choisit sa base selon son besoin :
1. Orienté Documents (ex: MongoDB)
Stocke les données sous forme de fichiers (JSON/BSON). C’est le plus polyvalent.
- Usage : Gestion de contenu web, profils utilisateurs.
2. Clé-Valeur (ex: Redis)
C’est le plus simple et le plus rapide. Une “Clé” (nom) correspond à une “Valeur” (donnée). Tout est souvent stocké en RAM.
- Usage : Systèmes de cache (pour accélérer un site), paniers d’achat.
3. Orienté Colonnes (ex: Cassandra)
Optimisé pour lire des colonnes spécifiques sur des milliards de lignes.
- Usage : Historique de capteurs (IoT), analyse de logs géants (Big Data).
4. Orienté Graphe (ex: Neo4j)
Se concentre sur les relations entre les objets (les “nœuds”).
- Usage : Réseaux sociaux (amis d’amis), moteurs de recommandation (Netflix), détection de fraudes bancaires.
Lexique technique NoSQL
| Terme | Définition |
| Scalabilité Horizontale | Capacité à augmenter la puissance en ajoutant simplement de nouveaux serveurs au cluster. |
| Théorème de CAP | Concept disant qu’une base NoSQL ne peut garantir que 2 points sur 3 entre : Cohérence, Disponibilité et Tolérance au partitionnement. |
| JSON | Format de texte léger { "nom": "Julie" } très utilisé pour échanger des données NoSQL. |
| Latence | Le temps de réponse. Le NoSQL est souvent choisi pour sa latence extrêmement faible. |
| Sharding | Mécanisme de découpage des données pour les répartir sur plusieurs machines. |
Pourquoi le NoSQL intéresse la Cybersécurité ?
- Analyse de menaces en temps réel : Les bases de type “Clé-Valeur” comme Redis permettent d’analyser des flux de trafic réseau à la milliseconde pour bloquer une attaque DDoS.
- Traçabilité massive : Pour respecter l’ISO 27001, on doit parfois garder des années de logs. Les bases orientées colonnes (Cassandra) permettent de stocker et fouiller des Pétaoctets de logs de sécurité.
- Investigation (Forensics) : Les bases de Graphes sont géniales pour visualiser comment un virus s’est propagé d’un ordinateur à un autre dans un réseau complexe.




