„V „pandách“ můžeme snadno přečíst textový soubor pomocí metody „pandy“. „Pandy“ nám poskytují možnost číst textový soubor. „Pandas“ poskytuje různé vestavěné metody pro čtení textového souboru. V tomto tutoriálu probereme všechny metody spolu se všemi parametry a podrobně je vysvětlíme. Také budeme číst textový soubor v „pandách“ pomocí metod „pandas“ v našich kódech zde.
Metody pro čtení textového souboru v „pandách“
V „pandách“ máme tři metody, které nám pomáhají při čtení textového souboru. Udělali jsme zde také několik příkladů, ve kterých čteme textový soubor. Metody, které „pandy“ poskytují, jsou popsány níže:
-
- Použitím metody pd.read_csv() .
- Použitím metody pd.read_table() .
- Použitím metody pd.read_fwf() .
Nyní vysvětlujeme syntaxi všech těchto metod a také podrobně diskutujeme o parametrech všech metod v tomto tutoriálu.
Syntaxe read_csv()
pd.read_csv ( 'název_souboru.txt', září =' ', záhlaví = Žádné, jména = [ “Col_name1”, “Col_name2, “Col_name2”, ………….. ] )
V této metodě nejprve přidáme název textového souboru, jehož data chceme číst, a je to první parametr této metody. Potom umístíme „sep“, což je oddělovač v této metodě, a jako znak zde umístíme mezeru, takže bude mezeru považovat za oddělovač. Poté máme parametr header a použije se hodnota „None“ tohoto parametru, takže vytvoří výchozí záhlaví, a pokud tento parametr nepřidáme, bude uvažovat první řádek textového souboru jako záhlaví. V parametru „names“ můžeme přidat názvy sloupců, které musíme přidat jako záhlaví.
Syntaxe read_table()
pd.read_table ( 'název_souboru.txt' , oddělovač = ' ' )
V této metodě uvedeme jako první parametr název textového souboru. Když do oddělovače umístíme „ “, pak bude jako oddělovač použit znak mezery.
Syntaxe read_fwf()
pd.read_fwf ( 'název_souboru.txt' )
Tato metoda přebírá pouze jeden parametr, kterým je název textového souboru.
Nyní použijeme tyto metody pro čtení textových souborů v kódech „pandy“ a zobrazení dat textového souboru na terminálu.
Příklad #01
Zde je aplikace „Spyder“, ve které jsme provedli všechny tyto kódy, které jsou uvedeny v tomto tutoriálu. Textový soubor, jehož data chceme číst, je zobrazen níže. Pro čtení tohoto textového souboru v „pandách“ použijeme metodu „read_csv()“.
Nejprve importujeme knihovnu „pandy“, protože chceme použít metodu „read_csv()“, a je to metoda „pandy“. K této metodě přistupujeme pouze tehdy, když jsme importovali knihovnu „pand“. Zde zmiňujeme „pandy jako pd“, takže toto „pd“ je umístěno s názvem metody pro jeho použití. Poté zde vytvoříme proměnnou „df“, která slouží k uložení dat textového souboru po přečtení. Zde umístíme metodu „pd.read_csv()“, která pomáhá při čtení textového souboru a převodu dat textového souboru do DataFrame a jejich uložení do proměnné „df“.
Zde jsme předali název souboru, který je „myData.txt“, a poté použijeme „sep“ a tomuto „sep“ přiřadíme prázdný znak. Tento prázdný znak tedy funguje jako oddělovač v textovém souboru. Poté jsme použili níže uvedenou „print()“, která se používá pro tisk dat textového souboru. Zobrazí data textového souboru ve formuláři DataFrame.
Pro provedení tohoto kódu musíme stisknout „Shift+Enter“ a výstup se vykreslí na terminálu „Spyder“. Výsledek výše uvedeného kódu je zobrazen na daném snímku obrazovky a můžete vidět, že data textového souboru jsou zobrazena jako DataFrame a první řádek našeho textového souboru je zde prezentován jako názvy sloupců tohoto DataFrame. Také odděluje data, kde je v textovém souboru přítomen znak mezery.
Příklad #02
Zde je ukázán textový soubor, který budeme číst v tomto příkladu, a opět použijeme metodu „read_csv()“, ale s jinými parametry.
Používá se metoda „pandy“ „pd.read_csv()“ a zde předáváme tři parametry. Nejprve umístíme název souboru, což je „Record.txt“. Druhý parametr je parametr „sep“ a přiřadí mu prázdný znak, a pak máme třetí parametr, ve kterém nastavíme „header“ a upravíme ho na „None“, takže vytvoří výchozí záhlaví DataFrame. když tento kód spustíme. To vše jsme uložili do proměnné “My_Record” a pro tisk přidali i “My_Record” do funkce “print()”.
Všechna data jsou uložena v DataFrame a odděluje data tam, kde je v datech textového souboru přítomen znak mezery. Také zde vytvořila výchozí záhlaví DataFrame, protože jsme upravili parametr „header“ na „None“.
Příklad #03
Zobrazí se textový soubor tohoto příkladu a znovu použijeme metodu „read_csv()“ s upravenými parametry.
V tomto kódu jsou zde čtyři parametry předány metodě „pandy“ „pd.read_csv()“. Název textového souboru je prvním parametrem. Parametr „sep“ má ve druhém parametru prázdný znak. Parametr „header“ je ve třetím argumentu nastaven na „None“ a jako čtvrtý parametr jsme nastavili „names“, které se objeví jako názvy sloupců DataFrame po přečtení textového souboru, a tyto názvy sloupců jsou „COL_1, COL_2, COL_3, COL_4 a COL_5“. Všechny tyto informace byly uloženy do proměnné „My_Record“ a „My_Record“ byl také přidán do metody „print()“, takže se vytiskne na terminálu.
Všechny informace textového souboru jsou zde vykresleny jako DataFrame a také odděluje data, do kterých jsou v textovém souboru přidány mezery. Podle toho také přidá názvy sloupců, které jsme přidali výše v kódu.
Příklad #04
Toto je textový soubor, který v tomto příkladu přečteme pomocí jiné metody, metody „pd.read_table()“.
Zde je přidána metoda „pd.read_table()“ pro čtení textového souboru a přidáme „ABC.txt“, což je název textového souboru. Tato metoda pomáhá při čtení textového souboru a také jsme upravili parametr „oddělovač“ na znak mezery, takže bude fungovat také jako oddělovač, který jsme vysvětlili výše. Poté se všechna data textového souboru uloží do proměnné „My_Data“ a zde se také vytisknou.
Počáteční řádek našeho textového souboru je zde zobrazen jako názvy sloupců DataFrame a data textového souboru jsou vytištěna jako DataFrame. Navíc odděluje data textového souboru, kde je v něm přítomen znak mezery.
Příklad #05
Nyní textový soubor obsahuje data, která jsou zobrazena níže. Tentokrát použijeme „read_fwf()“ a ukážeme, jak vykresluje data po přečtení textového souboru.
Jak víme, tato metoda „read_fwf()“ bere pouze jeden parametr, což je název souboru, který chceme číst. Zde přidáme „textfile.txt“, což je název našeho textového souboru a tuto metodu pandas přiřadíme do proměnné „File_Data“, která bude ukládat data tohoto textového souboru. Poté zadáme „print(File_Data)“, takže tato data také vytiskne.
Zde jsou zobrazena všechna data textového souboru. Neoddělila data, kde jsou přítomny mezery, protože v této funkci není žádný parametr jako „Sep“ nebo „oddělovač“.
Závěr
Tento tutoriál vysvětluje, jak číst textový soubor v „pandách“ a jaké metody se používají pro čtení textového souboru v „pandách“. Probrali jsme všechny metody, které nám pomáhají při čtení textového souboru v „pandách“. V tomto tutoriálu jsme prozkoumali tři různé metody „pandy“ pro čtení našich textových souborů v „pandách“. Také jsme zde podrobně vysvětlili syntaxi všech metod a také parametry všech metod a přečetli jsme mnoho textových souborů použitím různých metod se všemi možnými parametry v tomto tutoriálu.