Comment installer Apache Cassandra sur Ubuntu 20.04

Apache Cassandra est un système de gestion de base de données NoSQL open-source qui a été développé à l’origine en 2008 par des ingénieurs de Facebook qui avaient besoin d’un moteur de stockage évolutif prenant en charge la réplication, le partitionnement et l’équilibrage de charge sans avoir à imposer de restrictions sur le type ou la taille du matériel utilisé. Ils utilisaient MySQL mais celui-ci ne pouvait pas évoluer au fur et à mesure qu’ils augmentaient leur base d’utilisateurs au-delà de dizaines de millions.

Les principales caractéristiques sont l’extensibilité, la mise à l’échelle linéaire (plus de nœuds) pour le débit d’écriture ; l’architecture entièrement distribuée – le partage entre serveurs de base s’échelonne linéairement sans point de défaillance unique ; la facilité d’installation et d’utilisation – ne nécessite pas de tâches d’installation complexes comme la configuration du matériel et peut être exécuté sur du matériel de base ; l’autoréparation – si un nœud tombe en panne, il sera automatiquement remplacé par un autre nœud du cluster.

La base de données Apache Cassandra est souvent utilisée comme magasin de données pour les analyses opérationnelles et en temps réel. Par exemple, dans le secteur de la vente au détail, les entreprises l’utilisent pour suivre les modèles de trafic des clients afin de pouvoir faire des ajustements en conséquence sans avoir à attendre des semaines ou des mois pour obtenir des informations de leurs analystes.

En d’autres termes, si un article se vend bien à un endroit mais pas à un autre en raison de fluctuations comme les vacances, ces changements peuvent être effectués immédiatement grâce à ce nouveau type d’outil analytique.

Ce guide te guidera dans l’installation d’Apache Cassandra sur Ubuntu 20.04, tout en couvrant également le processus de désinstallation si nécessaire.

Conditions préalables

  • Un serveur exécutant Ubuntu Server 20.04
  • Un utilisateur avec des privilèges sudo

Démarrage

Mise à jour de ton système

Ubuntu 20.04 est déjà préinstallé avec Apache Cassandra, mais pour t’assurer que tous les paquets de ton système sont à jour, exécute les commandes ci-dessous dans ton terminal :

sudo apt update -y
sudo apt upgrade -y

L’option -y est utilisée pour répondre automatiquement « oui » lorsqu’il y a des mises à jour qui nécessitent l’intervention de l’utilisateur.

La commande update permet d’obtenir la dernière version des paquets logiciels. La commande upgrade met à jour tous les paquets déjà installés vers une révision plus récente (et/ou stable).

Exemple de sortie :

Mise à jour de

Mise à jour de ton système

Mise à jour de

Mise à niveau de ton système

Installation des dépendances

Pour installer Cassandra sur Ubuntu, il faut d’abord installer plusieurs dépendances.

sudo apt install apt-transport-https wget gnupg

La dépendance apt-transport-htps permettra à Apache Cassandra de communiquer en toute sécurité avec d’autres hôtes via le cryptage SSL. wget est un programme qui te permet de télécharger du contenu depuis des serveurs sur Internet. gnupg est un programme de gestion des clés qui est utilisé pour vérifier l’intégrité des fichiers.

Exemple de sortie :

Installation des dépendances

Installation de Java

Java est nécessaire pour qu’Apache Cassandra fonctionne. Exécute la commande suivante pour installer OpenJDK :

sudo apt install openjdk-8-jdk

La commande téléchargera et installera Java sur ton système. Le chiffre « 8 » dans la commande fait référence à Java 8 qui est la version par défaut de Java.

Exemple de sortie :

Installer Java

Installation de Java

Pour vérifier si Java est installé, exécute la commande suivante :

java -version

Exemple de sortie :

Vérifier

Version de Java

Installation d’Apache Cassandra

Maintenant que tous les prérequis sont installés, il est temps d’installer Apache Cassandra. Pour commencer, nous allons importer la clé GPG en utilisant la commande wget comme ci-dessous :

wget -q -O - https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -

-q est une option qui réduira la sortie au silence.

La commande sudo apt-key add ajoutera la clé qui est nécessaire pour installer Cassandra.

Exemple de sortie :

Importation de la clé GPG

Importation de la clé GPG

Ajoute ensuite le référentiel d’Apache Cassandra à ton fichier sources.list :

sudo sh -c 'echo "deb http://www.apache.org/dist/cassandra/debian 311x main" > /etc/apt/sources.list.d/cassandra.list'

echo affichera le contenu de l’argument fourni sur une nouvelle ligne et l’ajoutera à la fin du fichier . list qui est spécifié dans le deuxième argument de cette commande, « /etc/apt/ » aligné avec des guillemets après deb (abréviation de paquet Debian). debian 311x main est le nom du dépôt qui sera ajouté à ton fichier sources.list.

Ensuite, mets à jour l’index des paquets de ton système :

sudo apt-get update

Puis installe Apache Cassandra :

sudo apt install cassandra

La commande ci-dessus téléchargera et installera Apache Cassandra sur ton système.

Exemple de résultat :

Installer Apache Cassandra

Installation de Cassandra

Tu peux vérifier l’état d’Apache Cassandra en tapant :

sudo systemctl status cassandra

Exemple de sortie :

Vérifier l'état d'Apache Cassandra

Vérification de l’état d’Apache Cassandra

Si tu dois redémarrer Apache Cassandra, tape :

sudo systemctl restart cassandra

En outre, tu peux vérifier les statistiques du nœud sur ton système en tapant :

sudo nodetool status

Exemple de sortie :

Statut de Nodetool

Nodetool Status

Une fois l’installation d’Apache Cassandra terminée, tu peux te connecter à Apache Cassandra avec la commande suivante :

cqlsh

Exemple de sortie :

Cqlsh

Écran de connexion

Maintenant pour quitter l’outil cqlsh, tape exit, et appuie sur Entrée.

Configurer Apache Cassandra

Maintenant qu’Apache Cassandra a été installé, il est temps de le configurer.

Le répertoire /var/lib/cassandra/data/ est l’emplacement par défaut des données Cassandra.

etc/cassandra est l’emplacement par défaut des fichiers de configuration pour Cassandra.

Il est important de faire une sauvegarde de ce fichier avant d’effectuer des modifications afin d’éviter toute perte de données.

Le nom de cluster par défaut de Cassandra est  » cluster de test « . Si tu veux utiliser un autre nom, tu peux te connecter à Cassandra et le modifier :

cqlsh
UPDATE system.local SET cluster_name = 'Howtoforge Cluster' WHERE KEY = 'local';

La commande ci-dessus changera le nom du cluster en « Howtoforge Cluster ».

Après avoir renommé le cluster, tu dois redémarrer Cassandra pour que cela prenne effet :

sudo systemctl restart cassandra

Maintenant, lorsque tu te connectes à l’interface d’Apache Cassandra, elle affichera le nouveau nom du cluster.

Exemple de sortie :

Change le nom du Cluster

Nouveau nom de cluster

Tu ne peux pas utiliser d’espaces ou de symboles spéciaux comme les traits de soulignement (_) avec les noms des clusters (les noms sont sensibles à la casse), tu devras utiliser un nom différent pour ton cluster.

Désinstaller Apache Cassandra

Tu peux supprimer Apache Cassandra de ta machine en suivant les étapes ci-dessous :

Arrête le service d’Apache Cassandra s’il est en cours d’exécution :

sudo service cassandra stop

Ensuite, supprime les répertoires des bibliothèques et des journaux et désinstalle Apache Cassandra à l’aide de ces commandes :

sudo rm -r /var/lib/cassandra
sudo rm -r /var/log/Cassandra
sudo apt purge cassandra

Apache Cassandra sera supprimé mais il te restera quelques fichiers provenant d’autres paquets qui ont également été installés et tu pourras les importer à tout moment. Il est donc recommandé de les supprimer également :

sudo rm -r /usr/lib/cassandra
sudo rm -r /etc/apache-cassandra
sudo rm -r ~/.cassandra

Dépannage

Voici les étapes courantes de dépannage des erreurs d’Apache Cassandra qui peuvent t’aider à résoudre certains problèmes d’installation ou de configuration.

– Si tu reçois l’erreur « Impossible de créer un thread natif », cela est généralement dû à une défaillance du système d’exploitation sous-jacent. Cela peut être dû à une mémoire physique non disponible ou à un autre problème sur le serveur. Vérifie dans les journaux de ton serveur les messages d’erreur liés à l’allocation de mémoire virtuelle et essaie d’ajuster les paramètres du noyau en conséquence (par exemple, vmalloc=256m).

– Si tu reçois une erreur « error while loading shared libraries : libcurl.so », il s’agit d’un problème avec l’installation d’OpenSSL sur ton système (par exemple, Ubuntu 16.04 ou plus récent).

-Incapable de trouver « cassandra- » dans le répertoire /etc/init.d en essayant de le démarrer manuellement. La première étape consiste à s’assurer que tu as un script d’initialisation d’Apache Cassandra installé et configuré correctement sur Ubuntu. Si cela ne fonctionne pas, essaie d’exécuter ces commandes en utilisant sudo : « update-rc.d cassandra defaults && service cassandra restart ». Cela devrait aider à résoudre le problème.

– « Erreur lors de la tentative de démarrage d’Apache Cassandra » : assure-toi que les modifications que tu as apportées sont enregistrées dans les fichiers de configuration du service avant de quitter.

Conclusion

Dans ce tutoriel, nous avons abordé les bases de l’installation d’Apache Cassandra sur Ubuntu 20.04, ainsi que certaines étapes supplémentaires que tu pourrais vouloir suivre après l’installation. Il peut être utile aux débutants qui s’initient à Cassandra ou à ceux qui veulent une mise à jour de leur installation actuelle.

Nous espérons que cet article t’a été utile et nous te verrons la prochaine fois avec un autre tutoriel.

Tu as aimé cet article ? Partage-le avec tes amis et suis-nous sur les médias sociaux.

Vous aimerez aussi...