Co je architektura systému Amazon Redshift Data Warehouse?

Co Je Architektura Systemu Amazon Redshift Data Warehouse



Hostování a správa dat v databázích a datových skladech byla vždy hektickým a obtížným úkolem. K tomu, aby data dala smysl, je potřeba mnoho zdrojů a výpočetního výkonu. Amazon Web Services má pro tento účel komplexní řešení. Má službu s názvem Amazon Redshift, která plně spravuje datové sklady uživatelů.

Tento článek podrobně vysvětlí Amazon Redshift spolu s jeho architekturou datového skladu. Všechny součásti architektury systému datového skladu Redshift budou podrobně vysvětleny.







Co je Amazon Redshift?

IT je služba pro ukládání dat poskytovaná společností Amazon. Efektivně spravuje a analyzuje velké datové sady pro analýzy a reporting. Je postaven na sloupcovém modelu úložiště. Využívá shluky výpočetních uzlů řízených vedoucím uzlem k poskytování vysoce výkonného zpracování dat.



Přebírá data z různých zdrojů a sdružuje je do datového skladu. Nabízí různé funkce, jako je sdílení dat a analýzy v reálném čase. Podívejte se na obrázek níže, abyste pochopili funkce a možnosti Amazon Redshift:







Pojďme nyní k jeho architektuře systému datového skladu.

Co je architektura systému Amazon Redshift Data Warehouse?

Tato architektura systému má tři základní části. Tyto části jsou:



  • Úložný prostor
  • Akcelerace
  • Výpočet

Pojďme pochopit jejich účel:

Úložný prostor
Úložná část se zabývá službami úložiště, které má Redshift. Má vlastní možnost spravovaného úložiště a také možnost S3 bucket.

Akcelerace
Akcelerační část je závislá na používané službě úložiště a použitém výpočetním výkonu. Úložiště spravované Redshiftem je rychlejší ve srovnání s jinými možnostmi úložiště

Výpočet
Výpočtová část se čistě zabývá používaným výpočetním výkonem. Výpočet se provádí se shluky a shluky mají uzly. Uzly zase mají řezy.

Abyste lépe porozuměli všem prvkům a komponentám této architektury, prohlédněte si obrázek níže:

Pojďme pochopit jeho součásti jeden po druhém.

Jaké jsou architektonické komponenty Amazon Redshift?

Níže jsou uvedeny architektonické komponenty Amazon Redshift:

  • Shluky
  • Uzly
  • Uzlové řezy
  • Úložný prostor
  • Vnitřní síť
  • Databáze

Pojďme si je probrat jeden po druhém:

Shluky
Klastr je základní a stěžejní jednotka. Zahrnuje řadu uzlů. Pokud se klastr skládá z více výpočetních uzlů, zapojí se další vedoucí uzel, který koordinuje aktivity těchto výpočetních uzlů a řídí externí komunikaci.

Uzly

Uzly ve shlucích jsou dvou typů. Tyto jsou:

  • Vedoucí uzel
  • Výpočetní uzel

Pojďme jim porozumět postupně:

Vedoucí uzel
Řídí komunikaci s klientskými programy a koordinuje interakce s výpočetními uzly. Vedoucí uzel hraje zásadní roli při provádění složitých dotazů. Kompiluje kód na základě prováděcího plánu, který je distribuován do výpočetních uzlů a přiřazuje datové části každému jednotlivému výpočetnímu uzlu.

Výpočetní uzel
Výpočetní uzly jsou páteří architektury Amazon Redshift. Provádějí jak ukládání, tak zpracování dat. Ty mají vyhrazené zdroje, jako je paměť a CPU.

Uzlové řezy
Výpočetní uzly se dále dělí na řezy. Tyto řezy spolupracují na zpracování přiřazených pracovních zátěží a dosahují paralelismu pro zlepšení zpracování dotazů.

Úložný prostor
Ukládání dat v rámci Amazon Redshift je spravováno „Redshift Managed Storage (RMS)“. Má schopnost nezávisle škálovat úložiště pomocí úložiště „Amazon S3“. RMS používá vysoce výkonné místní úložiště založené na SSD jako mezipaměť vrstvy 1, která optimalizuje výkon.

Vnitřní síť
Tato interní síť v Amazon Redshift pomáhá při rychlé a bezpečné komunikaci mezi vedoucími uzly a výpočetními uzly. Tato síť není přímo přístupná klientským aplikacím.

Databáze
Clustery mají jednu nebo více databází. Data z těchto databází jsou na výpočetních uzlech. Klientské aplikace komunikují s vedoucím uzlem. Výpočetní uzel spravuje provádění dotazů napříč výpočetními uzly.

To vše je o Amazon Redshift a jeho architektonických prvcích. Tento článek komplexně vysvětlil pracovní součásti Amazon Redshift

Závěr

Architektura Amazon Redshift je důvodem, na kterém stojí jeho schopnosti. Vedoucí uzel řídí a spravuje výpočetní uzly a řezy uzlů pomáhají při paralelním zpracování. Redshift Managed Storage využívá ke zvýšení výkonu úložiště založené na SSD. Tento článek vysvětluje architekturu systému Amazon Redshift Data Warehouse.