Série Pandas do CSV

Serie Pandas Do Csv



Metoda “Series.to_csv()” v Pandas vypíše zadaný objekt série v notaci hodnot oddělených čárkami (csv). Tato funkce jednoduše přebírá hodnoty z řady a upravuje jejich formát přidáním čárek pro oddělení hodnot indexu a sloupce.

Pro použití této funkce musíme použít následující syntaxi:









Tento článek vám poskytne dvě různé techniky, jak se naučit používat tuto metodu v programu python.



Příklad č. 1: Použití metody Series.to_csv() k převodu řady s DatetimeIndex na hodnoty oddělené čárkami

Pro úpravu série do formátu CSV použijeme funkci „Series.to_csv()“. Tato ilustrace vygeneruje řadu s DatetimeIndex a poté ji převede do formátu hodnot oddělených čárkami.





Pro zprovoznění této metody musíme mít nástroj, který podporuje programování v pythonu. Pro kompilaci kódů je zvolen nástroj „Spyder“. Abychom na něm napsali skript, nejprve jsme spustili nainstalovaný nástroj v našem systému. Program python potřebuje knihovnu, aby mohl uplatnit své metody k dosažení požadovaného výsledku. Knihovna, kterou jsme zde nahráli, jsou „Pandy“. Na stejném řádku kódu je alias této knihovny označen jako „pd“. Takže kdekoli v programu musíme pro přístup k funkci napsat „pandy“. Místo toho bychom napsali „pd“.

Prvním krokem pro začátek s kódem je vygenerování série Pandas. Potřebujeme napsat „pd“, abychom mohli použít metodu vytváření série z pand. Funkce „pd.Series()“ je volána pro vytvoření řady se zadanými hodnotami. Hodnoty, které jsme pro sérii poskytli, jsou „Istanbul“, „Izmir“, „Ankara“, „Ankara“, „Antalya“, „Konya“ a „Bursa“. Pokud chcete toto pole hodnot pojmenovat, můžete tak učinit pomocí parametru „name“. Zde jsme toto pole hodnot pojmenovali „Cities“, protože obsahuje názvy 6 měst. Pro uložení této série byl vytvořen objekt série „Turecko“.



Abychom vytvořili DatetimeIndex, vyvolali jsme metodu „pd.date_range()“. Mezi závorky této funkce jsme předali 4 argumenty, které jsou: „start“, „freq“, „periods“ a „tz“.

Argument „start“ vyžaduje datum a čas, aby se z něj začalo generovat časové období. Zde jsme uvedli počáteční datum a čas na „2022-03-02 02:30“. Parametr „freq“ klasifikuje frekvenci pro časové období. Poskytli jsme mu tedy hodnotu „D“. Nyní vytvoří časové období s denní frekvencí. Argument „období“ je nastaven na „6“, což znamená, že vygeneruje časové období na 6 dní. Posledním parametrem je „tz“, který udává časové pásmo pro zadanou oblast. Specifikovali jsme časové pásmo pro „Asie/Istanbul“.

Pro uložení tohoto období jsme vytvořili proměnnou „Datetime“. Pro nastavení DatetimeIndex jsme použili vlastnost „Series.index“. Název série „Turkey“ je dodáván s vlastností „.index“ a je mu přiřazeno časové období uložené v proměnné „Datetime“. Vlastnost „index“ tedy převezme hodnoty z proměnné „Datetime“ a učiní z nich seznam indexů řady „Turecko“. A konečně, pro zobrazení výstupní série jsme použili metodu „print()“ a předali jsme sérii „Turecko“ jako vstup pro zobrazení jejího obsahu.

Právě jsme stiskli možnost „Spustit soubor“, aby se skript spustil. V důsledku toho můžeme vidět řadu s DatetimeIndex začínající od „2022-03-02 02:30:00+03:00“ a končící v „2022-03-07 02:30:00+03:00“ vytvářející období 6 dnů. Pod řadou je také uvedeno „Freq :D“, název seznamu polí „Cities“ a dtype „object“.

Nyní se naučíme převést tuto sérii, kterou jsme právě viděli na snímku výše, do formátu CSV. Chcete-li upravit řadu na hodnoty oddělené čárkami, máme metodu poskytovanou modulem pandas, která je „Series.to_csv()“. Tato metoda přebírá hodnoty poskytnuté řady a přidává čárky mezi hodnoty sloupce.

Je volána funkce “Series.to_csv()”. Název řady, kterou chceme převést, je uveden u metody jako „Turkey.to_csv()“. Abychom zachovali hodnoty oddělené čárkami, vytvořili jsme proměnnou „Comma_Separated“ a její obsah pak vložili do výstupního okna vyvoláním funkce „print()“.

Zde je naše série ve formátu csv. Na snímku vidíme, že hodnoty indexu a řady byly odděleny pomocí čárek v nich.

Příklad č. 2: Použití metody Series.to_csv() k převodu řady s hodnotami NaN na hodnoty oddělené čárkami

Druhou technikou, jak použít metodu „Series.to_csv()“ je použít tuto metodu k převodu série, která obsahuje nějaké prázdné položky, do formátu CSV.

Nejprve jsme dovezli potřebné balíčky. „pd“ je alias pro pandy a „np“ jako alias pro numpy. Numpy toolkit je zde načten, protože do naší série uděláme nějaké nulové položky pomocí „np.NaN“, zatímco ji vytvoříme pomocí metody pandas „pd.Series()“.

Funkce „pd.Series()“ je vyvolána pro vytvoření série pand s těmito hodnotami: „Nile“, „Amazon“, np.NaN, „Ganges“, „Mississippi“, „np.NaN“, „Yangtze“, „Dunaj“, „Mekong“, „np.NaN“ a „Volha“. Pro řadu je definováno celkem 21 hodnot, z nichž 3 položky mají hodnoty „np.NaN“, což znamená, že v řadě chybí 3 hodnoty. Vlastnost „name“ specifikuje název pro toto pole hodnot, které jsme poskytli „Titly“. Vlastnost „index“ se používá k nastavení seznamu indexů definovaných uživatelem namísto použití výchozího seznamu.

Zde chceme indexový seznam s hodnotami „10“, „11“, „12“, „13“, „14“, „16“, „17“, „18“, „19“, „20“, a 21“. Nyní bude mít naše série seznam indexů začínající od „10“ namísto „0“. Nyní uložte tuto sérii, abychom ji mohli později použít v programu. Inicializovali jsme objekt série „Rivers“ a přidělili jsme mu výstupní sérii generovanou voláním metody „pd.Series()“. Sérii lze vidět tak, že ji vystavíte pomocí funkce „print()“ od pythonu.

Renderovaný výstup na terminálu vytiskl řadu, jejíž seznam indexů začíná od 10 a končí na 21, což znamená, že řada má 21 hodnot.

Série bude převedena do formátu CSV pomocí metody „Series.to_csv()“.

S naší sérií „Turecko“ jsme vyvolali metodu „Series.to_csv()“. Tato metoda tedy převezme hodnoty ze série „Turecko“ a převede je do formátu hodnot oddělených čárkami. Výsledek se uloží do proměnné „Converted_csv“. A nakonec se převedená série vytiskne pomocí funkce „print()“.

Na snímku výsledku níže můžete vidět, že hodnoty řady jsou nyní změněny způsobem, kdy se k jejich oddělení od seznamu indexů používá čárka. Navíc tam, kde hodnoty chybí, je vytištěno pouze číslo indexu s čárkou.

Závěr

Praktickým přístupem je úprava série pand do formátu CSV. Toho lze dosáhnout pomocí funkce pandas “Series.to_csv()”. Tato příručka uvedla do praxe dvě techniky k použití této metody. V první ilustraci jsme použili tuto metodu pro převod řady s DatetimeIndex na formát hodnot oddělených čárkami. 2. instance použila funkci „Series.to_csv()“   k úpravě série s některými chybějícími položkami do formátu CSV. Obě techniky byly prakticky implementovány pomocí nástroje „Spyder“ v operačním systému Windows.