Diferența dintre RDBMS și Hadoop

Cuprins:

Diferența dintre RDBMS și Hadoop
Diferența dintre RDBMS și Hadoop

Video: Diferența dintre RDBMS și Hadoop

Video: Diferența dintre RDBMS și Hadoop
Video: Hadoop Vs RDBMS 2024, Noiembrie
Anonim

Diferența cheie dintre RDBMS și Hadoop este că RDBMS stochează date structurate, în timp ce Hadoop stochează date structurate, semi-structurate și nestructurate.

RDBMS este un sistem de gestionare a bazelor de date bazat pe modelul relațional. Hadoop este un software pentru stocarea datelor și rularea aplicațiilor pe clustere de hardware de bază.

Imagine
Imagine

Ce este RDBMS?

RDBMS înseamnă Sistem de management al bazelor de date relaționale bazat pe modelul relațional. În RDBMS, tabelele sunt folosite pentru a stoca date, iar cheile și indecșii ajută la conectarea tabelelor. Un tabel este o colecție de elemente de date și acestea sunt entitățile. Conține rânduri și coloane. Rândurile reprezintă o singură intrare în tabel. Coloanele reprezintă atributele.

De exemplu, baza de date de vânzări poate avea entități de clienți și produse. Clientul poate avea atribute precum customer_id, name, address, phone_no. Articolul poate avea atribute precum product_id, nume etc. Cheia primară a tabelului client este customer_id, în timp ce cheia primară a tabelului produs este product_id. Plasarea product_id în tabelul client ca o cheie externă conectează aceste două entități. La fel, tabelele sunt, de asemenea, legate între ele. Acestea oferă integritatea datelor, normalizare și multe altele. Puține dintre RDBMS comune sunt MySQL, MSSQL și Oracle. Folosesc SQL pentru interogări.

Ce este Hadoop?

The Hadoop este un framework Apache open source scris în Java. Ajută la stocarea și procesarea unei cantități mari de date pe grupuri de computere folosind modele de programare simple. Obiectivul principal al Hadoop este stocarea și procesarea Big Data, care se referă la o cantitate mare de date complexe. Debitul Hadoop, care este capacitatea de a procesa un volum de date într-o anumită perioadă de timp, este mare.

Diferența dintre RDBMS și Hadoop
Diferența dintre RDBMS și Hadoop

Există patru module în arhitectura Hadoop. Acestea sunt Hadoop common, YARN, Hadoop Distributed File System (HDFS) și Hadoop MapReduce. Modulul comun conține bibliotecile și utilitarele Java. Are și fișierele pentru a porni Hadoop. Hadoop YARN realizează programarea lucrărilor și gestionarea resurselor clusterului.

În plus, sistemul de fișiere distribuit Hadoop (HDFS) este sistemul de stocare Hadoop. Utilizează arhitectura master-slave. Nodul Master este NameNode și gestionează metadatele sistemului de fișiere. Alte computere sunt noduri slave sau DataNodes. Ele stochează datele reale. Pe de altă parte, Hadoop MapReduce face calculul distribuit. Are algoritmi pentru a procesa datele. În HDFS, nodul Master are un instrument de urmărire a joburilor. Rulează joburi de reducere a mapelor pe nodurile slave. Există un Task Tracker pentru fiecare nod slave pentru a finaliza procesarea datelor și pentru a trimite rezultatul înapoi la nodul principal. În general, Hadoop oferă stocare masivă de date cu o putere mare de procesare.

Care este diferența dintre RDBMS și Hadoop?

RDBMS vs Hadoop

RDBMS este un software de sistem pentru crearea și gestionarea bazelor de date care se bazează pe modelul relațional. Hadoop este o colecție de software open source care conectează multe computere pentru a rezolva probleme care implică o cantitate mare de date și calcule.
Varietate de date
RDBMS stochează date structurate. Hadoop stochează date structurate, semi-structurate și nestructurate.
Stocare de date
RDBMS stochează o cantitate medie de date. Hadoop stochează o cantitate mare de date decât RDBMS.
Viteză
În RDBMS, citirile sunt rapide. În Hadoop, citirea și scrierea sunt rapide.
Scalabilitate
RDBMS are scalabilitate verticală. Hadoop are scalabilitate orizontală.
Hardware
RDBMS utilizează servere high-end. Hadoop folosește hardware de bază.
Debit
Debitul de RDBMS este mai mare. Debitul Hadoop deeste mai mic.

Rezumat – RDBMS vs Hadoop

Acest articol a discutat despre diferența dintre RDBMS și Hadoop. Diferența cheie dintre RDBMS și Hadoop este că RDBMS stochează date structurate, în timp ce Hadoop stochează date structurate, semi-structurate și nestructurate.

Recomandat: