Pandas Sumový sloupec

Pandas Sumovy Sloupec



„Tento článek ukáže, jak sečíst všechny nebo konkrétní sloupce v Pandas DataFrame pomocí Pythonu. Funkce DataFrame.sum() bude použita spolu s několika užitečnými parametry v mnoha příkladech tohoto tutoriálu.“

Až tento tutoriál skončí, možná budete vědět, jak:







    • Najděte součet sloupce datového rámce v Pandas.
    • Přidání sloupců datového rámce dohromady
    • Přidejte do datového rámce Pandas sloupce, které splňují zadanou podmínku.
    • Určete součet po seskupení dat datového rámce.

Jak určit součet sloupců datového rámce?

Funkce „dataframe.sum()“ v Pandas vrací celkový součet pro zadanou osu. Pokud je vstupem osa indexu, funkce sečte hodnoty každého sloupce jednotlivě a poté udělá totéž pro každý sloupec a vrátí řadu, která ukládá součet dat/hodnot v každém sloupci. Navíc podporuje výpočet součtu datového rámce ignorováním chybějících hodnot.



Syntaxe: DataFrame.sum(axis = Žádný, skipna = Žádný, úroveň = Žádný, numeric_only = Žádný, min_count = 0, **kwargs)



Kde,





osa: {sloupce (1), index (0)}

objednat: Při výpočtu výsledku ignorujte hodnoty NA/null.



úroveň: Pokud je zadaná osa hierarchická (více indexů), počítejte před převodem na řadu do určité úrovně indexu.

numeric_only: Přijatelné jsou pouze sloupce float, int a boolean. Pokud Žádné, zkuste použít vše; pokud ne, pouze číselné údaje. Pro Series, neimplementováno.

min_count: Počet možných hodnot požadovaných k dokončení operace. Výsledkem bude NA, pokud je přítomno méně hodnot non-NA než min_count.

Vrácení: DataFrame (pokud je zadaná úroveň) nebo Series.

Příklad č. 01: Určete součet sloupce datového rámce a všech sloupců

Nejprve jsme požadovali datový rámec s platnými datovými typy, tj. int, float atd., sloupec nebo sloupce, pro které můžeme najít součet dat. Datový rámec bude vytvořen pomocí funkce pd.DataFrame().


Vytvořili jsme požadovaný datový rámec z pythonského slovníku uvnitř funkce pd.DataFrame(). Ve výše vytvořeném datovém rámci jsou čtyři sloupce „Název“, „den1“, „den2“ a „den3“. Ze čtyř sloupců jsou tři sloupce, tj. „den1“, „den2“ a „den3“, číselné sloupce s hodnotami dat (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2) a (7, 4, 3, 5, 6, 2, 1, 4). Můžeme najít pouze součet pro tyto tři sloupce. Součet pro obě řady (tj. sloupec) a celý datový rámec lze určit pomocí metody sum(). Začněme tím, že se naučíme, jak sečíst všechna data ve sloupci Pandy.


K určení součtu jsme použili metodu sum() ve sloupci „den2“. Funkce vrátila hodnotu součtu 28. Podobně jako v tomto případě můžeme určit součet každého sloupce Dataframe. Toho dosáhnete pouhým použitím metody sum() v celém datovém rámci.


Jak je vidět, součet ve sloupci „den1“ je 31; pro „den 2“ je hodnota součtu 28, zatímco pro sloupec „den 3“ je hodnota součtu 32.

Příklad č. 02: Použití funkce sum() k sečtení hodnot sloupce datového rámce dohromady

Jak můžete vidět z výstupu předchozího příkladu, funkce nevrátila skutečná data sloupce datového rámce, která tvořila součet. Přiřazením metody „DataFrame.sum()“ ke sloupci DataFrame však získáte přístup ke každému sloupci v DataFrame, včetně sloupce součtu. Nejprve pro tento příklad vytvoříme další datový rámec.


Pomocí pd.DataFrame() byl vytvořen náš datový rámec. Vytvořili jsme datový rámec se třemi sloupci: položka, cena a daň. Položka sloupce obsahující hodnoty řetězce („pero“, „značka“, „pravítko“, „guma“, „tužka“, „schránka“, „sešívačka“, „špendlíky“), sloupec cena ukládající hodnoty (20, 15, 10, 3, 5, 30, 35, 10) a sloupec „daň“ se skládá z hodnot (8, 5, 3, 3, 4, 10, 5, 2). Nyní sečteme hodnoty sloupců ceny a daně a výsledky uložíme do nového sloupce při zachování původních sloupců datového rámce.


Jak si lze všimnout spolu s novým sloupcem „celkem“, funkce vrací i původní sloupce daného datového rámce. Sloupec „celkem“ ukládá součet hodnot sloupců „cena“ a „daň“ proti každému údaji „položka“.

Příklad č. 03: Použití funkce sum() k určení součtu zadaných sloupců datového rámce

Abychom sečetli více sloupců datového rámce dohromady, můžeme určit seznam s popisky sloupců a pak použít metodu sum() na seznam, abychom našli součet. Stejně jako předchozí příklady nejprve vytvoříme datový rámec.


Vytvořili jsme náš datový rámec se čtyřmi sloupci „studenti“, „známky1“, „známky2“ a „známky3“. Sloupec „studenti“ ukládá data („Larry“, „James“, „Rob“, „Arya“, „Max“, „Ben“, „Gwen“, „Bill“) a sloupec „marks1“ ukládá hodnoty (8, 9, 6, 8, 10, 7, 9, 9), zatímco ve sloupcích „marks2“ a „marks3“ jsou uloženy číselné hodnoty (6, 6, 8, 6, 7, 9, 10, 9 ) a (7, 6, 9, 7, 8, 7, 10, 10).


Nejprve jsme vytvořili objekt seznamu s názvy sloupců „students“, „marks1“ a „marks3“. Poté se na seznam aplikuje metoda sum(). Funkce sečetla hodnoty sloupců známky1 a známky3 pouze proto, že sloupec „studenti“ je nenumerický, takže funkce sum() nemůže najít součet hodnot ve sloupci „studenti“. Do sloupce „součet“ jsme uložili součet hodnot sloupců „marks1“ a „marks3“.

Příklad č. 04: Přidejte sloupce datového rámce Pandas, které splňují specifikovanou podmínku

V tomto příkladu přidáme hodnoty zadaných sloupců, pokud splňují zadanou podmínku.


V nově vytvořeném datovém rámci je 5 sloupců, tj. „společnost“, „týden1_prodej“, „2.týden_prodej“, „3.týden_prodej“ a „pobočky“. Nyní předpokládejme, že nechceme přidávat hodnotu posledního sloupce, když přidáváme nebo zjišťujeme součet hodnot daných řádků datového rámce. Řekněme, že jsme jen chtěli přidat hodnoty sloupců se slovem „týden“ v jejich štítcích. Pro určení, zda je slovo „týden“ ve štítku sloupce přítomno nebo ne, lze vytvořit porozumění seznamu.


Nyní jsme načetli sloupce, které mají v popisku slovo „týden“. Sloupce obsahující slovo „týden“ můžeme shrnout pomocí argumentu axis=1 ve funkci sum().


Tímto způsobem můžeme bezpečně sčítat data napříč sloupci po řádcích, aniž bychom zahrnuli sloupce, které nechceme.

Příklad č. 5: Určete součet po seskupení dat datového rámce

Součet sloupců dataframe můžeme také najít po seskupení dat jednoho nebo více sloupců. Metoda groupby() bude použita k seskupení dat do kategorií uvnitř sloupce. Vytvořme datový rámec, abychom mohli seskupit data jednoho z jeho sloupců.


Nyní seskupíme data do sloupce „věk“ a sečteme hodnoty sloupců „skóre1“ a „skóre2“ pro každou kategorii skupiny.


Vidíme, že sečtením dat v datovém rámci po prvním seskupení hodnot dat podle věku vznikne součet po sloupcích v závislosti na věkových skupinách.

Závěr

V tomto tutoriálu jsme se vás pokusili naučit, jak vypočítat součet napříč datovými rámci pomocí metody Pandas sum. V příkladech tohoto příspěvku jsme diskutovali o přidávání hodnot po řádcích a sloupcích. Navíc jste se naučili, jak podmíněně přidávat sloupce a jak sčítat hodnoty po seskupení sloupce datového rámce. Nyní můžete být schopni sečíst sloupce datového rámce dohromady nebo sečíst hodnoty ve sloupci datového rámce sami.