Instytut Informatyki UwB



Programowanie Laboratorium 10.Nale?y za?adowa? pakiety:import os import pandas as pd # pd to skrót dla pandas # pandas - biblioteka do obs?ugi danych tabelarycznych Zadanie 1. Tutorial - pakiet pandasTworzenie ramek danych i zapisywanie do plikuutwórz dwie listy (to s? Twoje przyk?adowe dane)imie = ['Bobi','Jess','Jess','Marta','Janek','Melania','Jess', 'Melania']rok = [1968, 1999, 1955, 2013, 1977, 1978, 2003, 2017]po??cz dwie listy ze sob? korzystaj?c z funkcji zipDataSet1 = list(zip(imie,rok))utwórz obiekt DataFrame (ramka danych) korzystaj?c z biblioteki pandasd1 = pd.DataFrame(data = DataSet1, columns=['Imie', 'RokUrodzenia'])print(d1)zapisz dane do pliku DatyUrodzin.csv, DatyUrodzin.txt i DatyUrodzin.xlsxd1.to_csv('DatyUrodzin.csv',index=False,header=False)d1.to_csv('DatyUrodzin.txt',index=False,header=False)d1.to_excel('DatyUrodzin.xlsx', index=False)Odczyt danych operacje na kolumnach i wierszachodczytaj na 3 sposoby swoje dane korzystaj?c z funkcji read_csv, podaj ?cie?k? do pliku, zwró? uwag? na nag?ówkisciezkaPlik1 = r'C:\Users\births1880.csv'sciezkaPlik2 = r'C:\Users\births1880.xlsx'mojeDane0 = pd.read_csv(sciezkaPlik1)mojeDane1 = pd.read_csv(sciezkaPlik1, header=None)mojeDane2 = pd.read_csv(sciezkaPlik1, names=['Imie', 'RokUrodzenia']) mojeDane3 = pd.read_excel(sciezkaPlik2,0,index_col='RokUrodzenia')usuń plik z danymios.remove(sciezkaPlik)ponownie zapisz dane do pliku o nowej nazwie, wczytaj plik dane przypisz do zmiennej mojeDane4 nast?pnie sprawd? typ danychmojeDane4.dtypesposortuj warto?ci kolumny, wy?wietl dwa pierwsze wiersze danych i trzy ostatniedSort = mojeDane4.sort_values(['RokUrodzenia'],ascending=False)dSort.head(2)dSort.tail(3)znajd? minimaln? i maksymaln? warto?? kolumny RokUrodzenia, korzystaj?c z funkcji min i max okre?l imiona osób które urodzi?y si? najwcze?niej i najpó?niej, posortuj dane ze wzgl?du na rok urodzenia, wy?wietl osoby które urodzi?y si? przed rokiem 2000MaxValue = dSort['RokUrodzenia'].max()MaxImie = dSort['Imie'][dSort['RokUrodzenia'] == MaxValue].valuesprint(mojeDane4[mojeDane4['RokUrodzenia'] < 2000])wska? imiona które nie powtarzaj? si?, wy?wietl podstawowe informacje o danychmojeDane4['Imie'].unique() lub for i in mojeDane4['Imie'].unique(): print(i)mojeDane4['Imie'].describe()pogrupuj dane wzgl?dem imion i zsumuj dla pogrupowanych imion daty urodzeńimieGrup = mojeDane4.groupby('Imie')imieGrup.sum()zmień nazwy kolumn na: 'names', 'Birth', dodaj now? kolumn? 'Nowa' zawieraj?c? liczb? 10, a nast?pnie j? usuń, wstaw indeksymojeDane4.columns = ['names', 'Birth']mojeDane4['Nowa'] = 10del mojeDane4['Nowa']i = ['a','b','c','d','e','f','g','h']mojeDane4.index = izast?p kolumn? 'Birth' liczbami od 1 do 8, mojeDane4['Nowa'] = [1,2,3,4,5,6,7,8] wy?wietl wiersz indeksowany jako 'c' i wiersze od 'a' do 'd'print(mojeDane4.loc['c'])print(mojeDane4.loc['a':'d'])podziel zbiór na podzbiory ze wzgl?du na indeksy, wykonaj transpozycj? danych, uporz?dkuj dane: wiersze kolumna Birth kolumny names, zwró? uwag? na inny sposób odwo?ywania si? do zmiennychmojeDane4.ix[0:3,['names', 'Birth']] mojeDane4.TmojeDane4.crosstab(mojeDane4.Birth,mojeDane4.names)Zadanie do samodzielnej realizacji:Wczytaj plik filmy.csv, nast?pnie zapoznaj si? z danymi i wykonaj polecenia:wy?wietl wszystkie nazwy kolumnwy?wietl 5 pierwszych wierszywy?wietl wszystkie nazwiska re?yserów filmów korzystaj?c z funkcji crosstab wy?wietl tytu?y filmów w zale?no?ci od re?yserówwy?wietl wszystkie filmy Jamesa Cameronawy?wietl filmy które s? Polskie i s? w j?zyku polskimile filmy amerykańskich posiada?o bud?et wi?kszy ni? 250 milionów dolarówjaki polski film by? najdro?szypodaj 10 filmów które mia?y najwi?ksz? liczb? lajków na Facebookuw jakim kraju nakr?cono najwi?cej filmów w kolorzeposortuj dane rosn?co ze wzgl?du na rok produkcjiwymień wszystkie filmy w których grali: Leonardo DiCaprio lub Johnny Depp ................
................

In order to avoid copyright disputes, this page is only a partial summary.

Google Online Preview   Download

To fulfill the demand for quickly locating and searching documents.

It is intelligent file search solution for home and business.

Literature Lottery

Related download
Related searches