PyTorch je rámec pro hluboké učení, který uživatelům umožňuje vytvářet/vytvářet a trénovat neuronové sítě. Datová sada je datová struktura, která obsahuje sadu/sbírku vzorků dat a štítků. Poskytuje způsob přístupu k datům jako celku nebo pomocí operací indexování a dělení. Kromě toho může datová sada také aplikovat transformace na data, jako je oříznutí, změna velikosti atd. Uživatelé mohou snadno iterovat a vizualizovat datovou sadu v PyTorch.
Tento zápis bude ilustrovat metodu iterace a vizualizace konkrétní datové sady pomocí PyTorch.
Jak iterovat a vizualizovat datovou sadu pomocí PyTorch?
Chcete-li iterovat a vizualizovat konkrétní datovou sadu pomocí PyTorch, postupujte podle uvedených kroků:
Krok 1: Importujte nezbytnou knihovnu
Nejprve importujte požadované knihovny. Importovali jsme například následující knihovny:
dovozní pochodeň
z torch.utils.data import Dataset
z datových sad importu torchvision
z torchvision.transforms import ToTensor
import matplotlib.pyplot tak jako plt
Tady:
-
- “ dovozní pochodeň ” importuje knihovnu PyTorch.
- “ z torch.utils.data import Dataset ” importuje třídu „Dataset“ z modulu „torch.utils.data“ PyTorch pro vytváření vlastních datových sad v PyTorch.
- “ z datových sad importu torchvision ” importuje modul “datasets” z knihovny “torchvision”, která poskytuje předdefinované datové sady pro úlohy počítačového vidění.
- “ z torchvision.transforms import ToTensor ” importuje transformaci „ToTensor“ z „torchvision.transforms“ pro převod obrázků PIL nebo polí NumPy na tenzory PyTorch.
- “ import matplotlib.pyplot jako plt ” importuje knihovnu matplotlib pro vizualizaci dat:
Krok 2: Načtěte datovou sadu
Nyní načteme datovou sadu FashionMNIST z torchvision pro účely školení i testování s následujícími parametry:
tr_data = datové sady.FashionMNIST ( vykořenit = 'data' , vlak = Pravda, stažení = Pravda, přeměnit =ToTensor ( ))
ts_data = datové sady.FashionMNIST ( vykořenit = 'data' , vlak = nepravda, stažení = Pravda, přeměnit =ToTensor ( )
)
Tady:
-
- “ FashionMNIST ” načte datovou sadu FashionMNIST z knihovny torchvision.
- “ root=”data” ” určuje adresář, kam bude datová sada uložena nebo načtena, pokud již existuje. V našem případě je to adresář „data“.
- “ vlak “ označuje tréninkový nebo testovací datový soubor.
- “ download=Pravda ” stáhne datovou sadu, pokud ještě není přítomna.
- “ transform=ToTensor() ” použije transformaci ToTensor pro převod obrázků v datové sadě na tenzory PyTorch:
Krok 3: Označení tříd v datové sadě
Dále vytvořte slovník, který mapuje indexy tříd na jejich odpovídající štítky tříd v datové sadě FashionMNIST. Poskytuje lidem čitelné štítky pro každou třídu. Zde jsme vytvořili „ mapovaný_štítek ” slovník a my jej použijeme k převodu indexů tříd na jejich odpovídající štítky tříd:
mapovaný_štítek = {0 : 'Tričko' ,
1 : 'kalhoty' ,
2 : 'Svetr' ,
3 : 'Šaty' ,
4 : 'Kabát' ,
5 : 'Sandál' ,
6 : 'Košile' ,
7 : 'Teniska' ,
8 : 'Taška' ,
9 : 'kotníková bota' ,
}
Krok 4: Vizualizujte datovou sadu
Nakonec vizualizujte vzorky v trénovacích datech pomocí knihovny „matplotlib“:
obr = plt.figura ( obr. velikost = ( 8 , 8 ) )kol , řádek = 3 , 3
pro i v rozsah ( 1 , kol * řádek + 1 ) :
ukázkový_index = pochodeň.randint ( jen ( tr_date ) , velikost = ( 1 , ) ) .položka ( )
img, label = tr_data [ ukázkový_index ]
fig.add_subplot ( řádek, kol , i )
plt.title ( mapovaný_štítek [ označení ] )
plt.axis ( 'vypnuto' )
plt.imshow ( img.stisknout ( ) , cmap = 'šedá' )
plt.show ( )
Poznámka : Zde můžete přistupovat k našemu Zápisníku Google Colab odkaz .
To bylo vše o iteraci a vizualizaci požadované datové sady pomocí PyTorch.
Závěr
Chcete-li iterovat a vizualizovat konkrétní datovou sadu pomocí PyTorch, nejprve importujte potřebné knihovny. Poté načtěte požadovanou datovou sadu pro školení a testování s požadovanými parametry. Dále označte třídy v datové sadě a vizualizujte vzorky v trénovacích datech pomocí knihovny „matplotlib“. Tento zápis ilustroval metodu iterace a vizualizace konkrétní datové sady pomocí PyTorch.