Jak číst soubor excelu (xlsx) v pythonu

How Read Excel File Python



The .xlsx je rozšířením dokumentu aplikace Excel, který může ukládat velké množství dat v tabulkové podobě, a mnoho typů aritmetických a logických výpočtů lze snadno provádět v excelové tabulce. Někdy je pro účely programování nutné načíst data z dokumentu aplikace Excel pomocí skriptu Python. V Pythonu existuje mnoho modulů pro čtení dokumentu aplikace Excel. Některé z užitečných modulů jsou xlrd , openpyxl , a pandy . V tomto kurzu byly ukázány způsoby, jak pomocí těchto modulů číst soubor aplikace Excel v Pythonu.

Předpoklad:

Ke kontrole příkladů tohoto tutoriálu bude vyžadován fiktivní soubor aplikace Excel s příponou .xlsx. Můžete použít jakýkoli existující soubor aplikace Excel nebo vytvořit nový. Zde je nový soubor aplikace Excel s názvem prodeje.xlsx byl vytvořen soubor s následujícími údaji. Tento soubor slouží ke čtení pomocí různých modulů pythonu v další části tohoto kurzu.







prodeje.xlsx



Datum prodeje Prodavač Množství
12.12.18 Sila Ahmed 60 000
06.06.19 Já Hossain 50 000
08/09/20 Sarmin Jahan 45 000
7. 4. 21 Mahmudul Hasan 30 000

Příklad 1: Čtení souboru aplikace Excel pomocí xlrd

Modul xlrd není ve výchozím nastavení nainstalován v Pythonu. Před použitím modulu tedy musíte modul nainstalovat. Nejnovější verze tohoto modulu nepodporuje soubor aplikace Excel s příponou .xlsx. Abyste si mohli přečíst soubor xlsx, musíte si nainstalovat verzi 1.2.0 tohoto modulu. Spusťte z terminálu následující příkaz a nainstalujte požadovanou verzi xlrd .



$pipNainstalujte xlrd== 1.2.0

Po dokončení instalačního procesu vytvořte soubor pythonu s následujícím skriptem, který si přečtěte prodeje.xlsx soubor pomocí xlrd modul. open_workbook () funkce se používá ve skriptu otevřete soubor xlsx pro čtení. Tento soubor aplikace Excel obsahuje pouze jeden list. Takže workbook.sheet_by_index () ve skriptu byla použita funkce s hodnotou argumentu 0. Dále vnořená 'pro' smyčka slouží ke čtení hodnot buněk v listu pomocí hodnot řádků a sloupců. Ve skriptu byly použity dvě funkce range () k definování velikosti řádku a sloupce na základě dat listu. The cell_value () funkce použila ke čtení konkrétní hodnoty buňky listu v každé iteraci smyčky. Každé pole ve výstupu bude odděleno jedním mezerou na kartě.





# Importujte modul xlrd
import xlrd

# Otevřete sešit
sešit = xlrd.open_workbook('sales.xlsx')

# Otevřete list
worksheet = sešit.sheet_by_index(0)

# Opakujte řádky a sloupce
provrozsah(0,5):
projvrozsah(0,3):
# Vytiskněte hodnoty buněk pomocí mezery na kartě
tisk(worksheet.cell_value(já, j),konec=' t')
tisk('')

Výstup:

Po spuštění výše uvedeného skriptu se zobrazí následující výstup.



Příklad 2: Přečtěte si soubor aplikace Excel pomocí openpyxl

The openpyxl je další modul pythonu ke čtení souboru xlsx a ve výchozím nastavení také není nainstalován s Pythonem. Před použitím tohoto modulu z terminálu nainstalujte tento modul.

$pipNainstalujteopenpyxl

Po dokončení instalačního procesu vytvořte soubor pythonu s následujícím skriptem, který si přečtěte prodeje.xlsx soubor. Stejně jako modul xlrd, openpyxl modul má load_workbook () funkce k otevření souboru xlsx pro čtení. The prodeje.xlsx soubor je použit jako hodnota argumentu této funkce. Předmět wookbook.active byl ve skriptu vytvořen pro čtení hodnot souboru max_row a max_sloupec vlastnosti. Tyto vlastnosti byly použity ve vnořených smyčkách ke čtení obsahu souboru prodeje.xlsx soubor. Funkce range () byla použita ke čtení řádků listu a funkce iter_cols () byla použita ke čtení sloupců listu. Každé pole ve výstupu bude odděleno dvěma mezerami.

# Importujte modul openyxl
importovat openpyxl

# Definujte proměnnou pro načtení wookbooku
wookbook = openpyxl.load_workbook('sales.xlsx')

# Definujte proměnnou pro čtení aktivního listu:
list = wookbook.active

# Opakujte smyčku a přečtěte si hodnoty buňky
provrozsah(0, list. max_row):
pro s vworksheet.iter_cols(1, list. max_sloupec):
tisk(s[].hodnota,konec=' t t')
tisk('')

Výstup:

Po spuštění výše uvedeného skriptu se zobrazí následující výstup.

Příklad 3: Přečtěte si soubor aplikace Excel pomocí pand

Modul pandy není nainstalován s předchozím modulem podobným pythonu. Pokud jste jej tedy nenainstalovali dříve, musíte jej nainstalovat. Spuštěním následujícího příkazu nainstalujte soubor pandy z terminálu.

$pipNainstalujtepandy

Po dokončení instalačního procesu vytvořte soubor pythonu s následujícím skriptem, který si přečtěte prodeje.xlsx soubor. The read_excel () funkce pand se používá pro čtení souboru xlsx. Tato funkce byla použita ve skriptu ke čtení prodeje.xlsx soubor. The DataFrame () funkce zde použila ke čtení obsahu souboru xlsx v datovém rámci a uložení hodnot do pojmenované proměnné data . Hodnota dat byla vytištěna později.

# Import pand
import pandtak jakopd

# Načtěte soubor xlsx
excel_data = pd.read_excel('sales.xlsx')
# Přečtěte hodnoty souboru v datovém rámci
data = pd.DataFrame(excel_data,sloupce=['Datum prodeje','Prodavač','Množství'])
# Vytiskněte obsah
tisk(`` Obsah souboru je: n', data)

Výstup:

Po spuštění výše uvedeného skriptu se zobrazí následující výstup. Výstup tohoto skriptu se liší od předchozích dvou příkladů. Čísla řádků jsou vytištěna v prvním sloupci, kde je hodnota řádku počítána od 0. Hodnoty data jsou zarovnány centrálně. Jména prodejců jsou zarovnána doprava. Částka je zarovnána doleva.

Závěr:

Uživatelé pythonu musí pracovat se soubory xlsx pro různé účely programování. V tomto kurzu byly ukázány tři různé způsoby čtení souboru xlsx pomocí tří modulů pythonu. Každý modul má různé funkce a vlastnosti pro čtení souboru xlsx. Tento tutoriál pomůže uživatelům pythonu snadno přečíst soubor xlsx pomocí skriptu python po přečtení tohoto tutoriálu.