Jedinečný datový rámec Pandas

Jedinecny Datovy Ramec Pandas



Nejoblíbenější knihovna Pythonu, která se používá v datové vědě, se nazývá Pandas. Programátorům Pythonu nabízí vysoce výkonné, uživatelsky přívětivé nástroje pro analýzu dat. Jakmile pochopíte základní funkce a jak je používat, Pandas je účinný nástroj pro změnu dat. V „pandách“ jsou standardní metody pro ukládání dat v tabulkové formě DataFrames. Můžeme použít některé metody „pandy“ pro získání jedinečných hodnot ve sloupci DataFrame „pandy“. Když potřebujeme získat jedinečné hodnoty ve sloupcích DataFrame a nechceme duplikovat hodnoty ve sloupci DataFrame „pandy“, můžeme k tomu použít metody, které „pandy“ poskytují. Podívejme se na tyto metody v této příručce spolu s několika příklady a výstupy, abychom získali jedinečné hodnoty ve sloupci „pandy“ v DataFrame.

Metody pro získání jedinečných hodnot ve sloupcích DataFrame „pandy“.

Pro získání jedinečných hodnot ve sloupcích DataFrame „pandy“ můžeme použít dvě metody. Vypustíme duplicitní hodnoty a získáme pouze jedinečné hodnoty ve sloupcích DataFrames. Metody, které „pandy“ poskytují k provedení tohoto úkolu, jsou:







  • Použitím metody unique().
  • Použitím metody drop_dupliactes() .

Nyní použijeme obě metody v kódech „pandy“ pro získání jedinečných hodnot ve sloupcích DataFrame „pandy“.



Příklad #01

Aplikace „Spyder“ se zde používá pro generování těchto kódů „pandy“ k využití metod, které nám pomáhají získat jedinečné hodnoty ve sloupcích DataFrame „pandy“. Před vytvořením DataFrame musíme importovat moduly „pandy“, které jsou nezbytné pro kód „pandy“. Použitím termínu „import“ a umístěním „pandy jako pd“ tyto moduly importujeme.



Nyní s pomocí „pd“ můžeme rychle získat funkce nebo metody „pandy“. Poté vložíme „Data_předmětu“, do kterého přidáme „Jméno“ a do „Jméno“ přidáme údaje o jménu, které jsou „Roman, William, Peter, Smith, John, Milli, Thomas a James“. Poté přidáme údaje o předmětu do „Subj“, což jsou „Matematika, ekonomie, věda, matematika, statistika, statistika, statistika a počítač“. Poté tato „Subject_data“ převedeme na DataFrame „Subject_df“ pomocí metody „pd.DataFrame()“. Umístíme „Subject_df“ do metody „print()“, takže se zobrazí na terminálu.





Nyní chceme získat jedinečné hodnoty ve sloupci „Subj“ DataFrame „pandy“. Pro tento účel zde používáme metodu “unique()” a přidáme název sloupce a také název DataFrame, jak je uvedeno níže. Tuto metodu přidáme do „print()“, takže výsledek se také zobrazí na terminálu.



Nyní stiskneme „Shift+Enter“ pro získání výsledku tohoto kódu a ten se vykreslí na terminálu a je zde také zobrazen, který obsahuje DataFrame se všemi hodnotami. Toto je původní DataFrame, který jsme přidali do kódu a pod ním se zobrazují jedinečné hodnoty sloupce „Subj“. Vypustí duplicitní hodnoty a zobrazí jedinečné hodnoty sloupce „Subj“ DataFrame.

Příklad #02

Vytvoříme „Sample_list“, který obsahuje nějaké informace. Vložíme „Layla, 21, 28, 31, 14 a 39“, které se objeví jako první sloupec, když tento seznam převedeme do DataFrame. Poté přidáme „Lusy, 31, 25, 34, 26 a 21“ jako druhý řádek DataFrame. Poté máme „Peter, 38, 20, 20, 35 a 24“ a „Layla 38, 23, 39 24, 23“, což bude třetí a čtvrtý řádek DataFrame. Vkládáme také tři další údaje, které jsou „Stella, 21, 24, 24, 28, 31“, „Layla, 33, 32, 26, 30, 25“ a také „Petr, 21, 21, 31, 21, 29“ .

Nyní převádíme „Sample_list“ na „DF_Sample“, což je název DataFrame zde, vložením funkce „pd.DataFrame()“. Také jsme nastavili název sloupců tohoto DataFrame a tyto názvy jsou „Name, Ass_1, Ass_2, Ass_3, Ass_4 a Ass_5“. Poté použijeme funkci „print()“, která pomáhá při zobrazení DataFrame „DF_Sample“. Nyní v tomto příkladu používáme jinou metodu pro získání jedinečných hodnot ve sloupci DataFrame. Tato metoda je metodou „drop_duplicates()“ metody „pandy“.

V metodě „drop_duplicates()“ nastavujeme název sloupce, kde chceme získat jedinečné hodnoty ve sloupci DataFrame. Jedinečné hodnoty sloupce „Name“ získáváme vypuštěním duplicitních hodnot v tomto sloupci pomocí metody „drop_duplicates()“ a také zde tyto jedinečné hodnoty vykreslíme pomocí funkce „print()“.

Po použití metody „drop_duplicates()“ jsou duplikovaná jména odstraněna a jedinečné hodnoty jsou vykresleny. Můžete si všimnout, že jméno „Layla“ se objeví ve třech buňkách sloupce „Name“. Ale když je na tento sloupec aplikována metoda „drop_duplicates()“, všechny duplicitní hodnoty jsou zrušeny a na obrazovce se objeví jeden název „Layla“. Po odstranění duplicitních hodnot se objevil nový DataFrame, který obsahuje jedinečné hodnoty v tomto sloupci „Name“. Tímto způsobem můžeme vypustit duplicitní hodnoty a získat jedinečnou hodnotu ve sloupci DataFrame pomocí metody „drop_duplicates()“.

Příklad #03

Znovu je použit stejný DataFrame a nyní zde aplikujeme metodu „unique()“. Pomocí metody „unique()“ umístíme název sloupce a také název DataFrame, na který chceme tuto metodu „unique()“ použít pro získání jedinečných hodnot. Tím se vykreslí pouze jedinečné hodnoty tohoto sloupce a tyto hodnoty se nezobrazí ve formě DataFrame.

Zde DataFrame obsahuje sedm hodnot ve sloupci „Name“, ale když na tento sloupec aplikujeme metodu „unique()“, objevily se pouze čtyři hodnoty a toto jsou jedinečné hodnoty tohoto sloupce. Nevykresluje duplicitní hodnoty.

Příklad #04

DataFrame, který v tomto příkladu vytvoříme, je „F_G_df“. Do tohoto DataFrame vložíme „My_fruits“ a „my_Vegs“. Sloupec „My_fruits“ obsahuje „Jablko, Pomeranč, Jablko, Hruška, Liči, Jablko, Jablko, Hruška a Jablko“. Dále máme „My_Vegs“, který obsahuje názvy zeleniny, které jsou „Chilli, Bringle, Carrot, Brambory, Brambory, Mrkev, Cibule, Česnek a Zázvor“. Tento DataFrame obsahuje pouze dva sloupce.

Nyní získáváme jedinečné hodnoty v obou sloupcích pomocí metody „unique()“. Zmíníme název DataFrame. Poté zadejte název prvního sloupce. Poté použijeme metodu append(). V tomto dodatku opět umístíme název DataFrame a název druhého sloupce a umístíme metodu „unique()“. Tím získáte jedinečné hodnoty obou sloupců a poté připojíte jedinečné hodnoty obou sloupců a zobrazí se na obrazovce.

DataFrame se nejprve vykreslí a obsahuje všechny hodnoty. Poté se použije metoda „unique()“ a níže se vykreslí jedinečné hodnoty obou sloupců. V tomto kódu získáme jedinečné hodnoty ve více sloupcích DataFrame pomocí metody „unique()“.

Závěr

Úplné vysvětlení získávání jedinečných hodnot ve sloupci DataFrame naleznete v této příručce. Probrali jsme metody „unique()“ a „drop_duplicates()“, které nám pomáhají získat jedinečné hodnoty sloupce DataFrame. Prozkoumali jsme, jak používat tyto metody v kódu „pandy“, pomocí těchto metod zde v našich kódech. V této příručce jsme ilustrovali různé příklady a ukázali jsme vám, jak získat jedinečné hodnoty jednoho sloupce pomocí metody „unique()“ a také metody „drop_duplicates()“. Také jsme prozkoumali, jak získat jedinečné hodnoty ve více sloupcích pomocí metody „unique()“ v této příručce.