Python pandas quick guide - University of Utah
Python pandas quick guide
Shiu-Tang Li
May 12, 2016
Contents
1 Dataframe initialization / outputs
1.1 Load csv files into dataframe. . . .
1.2 Initialize a dataframe . . . . . . . .
1.3 Create a new column . . . . . . . .
1.4 Output a dataframe to csv . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
3
3
3
2 Take a quick glance of a dataframe
2.1 Print the data frame . . . . . . . . . . . . . . . . . . .
2.2 Get the description of numerical columns . . . . . . .
2.3 Get the dimension . . . . . . . . . . . . . . . . . . . .
2.4 Get the data type / get the filtered data by data type
2.5 Get the unique elements . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
4
4
4
4
4
3 Select data from a dataframe
3.1 Get column names . . . . . . . . . . . . . . .
3.2 Select a specific column . . . . . . . . . . . .
3.3 Select the sub-dataframe of a few columns . .
3.4 Select rows with restrictions on columns . . .
3.5 Select rows with row index . . . . . . . . . .
3.6 Select row index with max values in a specific
3.7 Select given entry . . . . . . . . . . . . . . . .
3.8 Iterate rows . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
column
. . . . .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
5
5
5
5
5
5
6
4 Revise data in a dataframe
4.1 Revise data in a particular entry
4.2 Reindex rows . . . . . . . . . . .
4.3 Reindex one row . . . . . . . . .
4.4 Rename columns . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
7
7
7
.
.
.
.
.
.
.
.
.
.
.
.
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4.5
4.6
4.7
4.8
4.9
Drop columns / rows . . . . . .
Find / drop / fill missing values
Data frame transpose . . . . .
Change types of a column . . .
Merge data frames . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
8
8
8
8
5 Search key words in a dataframe
5.1 Exact match in target column . . . . . . . . . . . . . . . . . . . . . . . . . .
9
9
6 Perform operations on a dataframe
6.1 Sort dataframe . . . . . . . . . . .
6.2 Rearrange dataframe - pivot table
6.3 Grouping . . . . . . . . . . . . . .
6.4 ¡®Apply¡¯ function . . . . . . . . . .
.
.
.
.
.
.
.
.
.
7 Others
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
10
10
10
10
11
2
1
Dataframe initialization / outputs
1.1
1
2
3
4
import pandas
d a t a f r a m e = pandas . r e a d c s v ( ¡±C : / U s e r s / Shiu?Tang L i / . . . c s v ¡± ,
encoding = ¡± ISO?8859?1¡± )
# encoding : t o d e a l with u n i c o d e s
1.2
1
2
3
4
5
1
2
3
4
2
import pandas as pd
l i s t o f d i c t s = [{ ¡¯ column1 ¡¯ : 3 , ¡¯ column2 ¡¯ : 4 } , { ¡¯ column1 ¡¯ : 7 , ¡¯ column2 ¡¯ : 2 } , { ¡¯ column1
¡¯ : 6 , ¡¯ column2 ¡¯ : 8 } ]
d a t a f r a m e = pd . DataFrame ( l i s t o f d i c t s , index=[ ¡¯ index1 ¡¯ , ¡¯ index2 ¡¯ ] )
# c o n s t r u c t data frame from l i s t o f d i c t i o n a r i e s
2
Create a new column
d a t a f r a m e [ ¡¯ new column ¡¯ ] = L i s t OR S e r i e s
# w i l l g e t warning message
1.4
1
Initialize a dataframe
import pandas as pd
df1 = pd . DataFrame = ({ ¡¯ c1 ¡¯ : [ ¡¯ 1 ¡¯ , ¡¯ 2 ¡¯ , ¡¯ 3 ¡¯ , ¡¯ 4 ¡¯ ] , ¡¯ c2 ¡¯ : [ ¡¯ 5 ¡¯ , ¡¯ 6 ¡¯ , ¡¯ 7 ¡¯ , ¡¯ 8 ¡¯ ] } )
df2 = pd . DataFrame ({ ¡¯ c1 ¡¯ : 2 ,
¡¯ c2 ¡¯ : np . a r r a y ( [ 0 ] ? 100 , dtype= ¡¯ i n t 3 2 ¡¯ ) ,
¡¯ c3 ¡¯ : ¡¯ h e l l o ¡¯ })
1.3
1
Load csv files into dataframe.
Output a dataframe to csv
import pandas
d a t a f r a m e . t o c s v ( ¡±C : / U s e r s / Shiu?Tang L i / . . . c s v ¡± )
Remark. May load .csv as list of lists instead of data frames.
3
2
2.1
1
2
3
4
2
3
2
3
4
5
6
2
3
4
Get the data type / get the filtered data by data type
types = data frame . dtypes
# t y p e s i s a S e r i e s l a b e l e d by column names , showing t h e data t y p e f o r each
column .
i n t e g e r i n d e x = t y p e s [ t y p e s == i n t 6 4 ] . index
# t y p e s [ t y p e s == i n t 6 4 ] i s a f i l t e r e d S e r i e s with i n t e g e r v a l u e s .
p r i n t ( data frame [ i n t e g e r i n d e x ])
# t h i s g i v e s us t h e f i l t e r e d data frame with o n l y i n t 6 4 v a l u e s .
2.5
1
Get the dimension
dim = d a t a f r a m e . shape
number of rows = dim [0 ]
number of columns = dim [ 1]
2.4
1
Get the description of numerical columns
p r i n t ( data frame . describe () )
2.3
1
Print the data frame
p r i n t ( d a t a f r a m e . head ( 5 ) )
# p r i n t f i r s t 5 rows
p r i n t ( data frame )
# p r i n t t h e data frame , dimension i n f o r m a t i o n i s a l s o a t t a c h e d
2.2
1
Take a quick glance of a dataframe
Get the unique elements
p r i n t ( d a t a f r a m e [ ¡¯ column name ¡¯ ] . unique ( ) )
# w i l l r e t u r n a l i s t showing d i s t i n c t elements i n t h e column
p r i n t ( d a t a f r a m e [ ¡¯ column name ¡¯ ] . v a l u e c o u n t s ( ) )
# w i l l r e t u r n a t a b l e showing t h e c o u n t s i n t h e column
4
3
3.1
1
2
3
4
2
3
4
2
3
4
5
2
3
4
Select rows with restrictions on columns
d a t a f r a m e [ d a t a f r a m e [ ¡¯ column name ¡¯ ] == s o m e v a l u e s ]
3.5
1
Select the sub-dataframe of a few columns
d a t a f r a m e 2 = d a t a f r a m e [ [ ¡¯ column name1 ¡¯ , ¡¯ column name2 ¡¯ ] ]
d a t a f r a m e 2 = d a t a f r a m e [ d a t a f r a m e . column [ 0 : 2 ] ]
# s e l e c t t h e f i r s t two columns i n two d i f f e r e n t ways
d a t a f r a m e 2 = d a t a f r a m e [ ¡¯ column name x ¡¯ : ¡¯ column name y ¡¯ ]
# s e l e c t t h e columns between t h e two columns
3.4
1
Select a specific column
column = d a t a f r a m e [ ¡¯ column name ¡¯ ]
# column i s a [ S e r i e s ] o b j e c t , c o n t a i n s row index + v a l u e s , both a r e l i s t s
c o l u m n v a l u e s = column . v a l u e s
column index = column . index
3.3
1
Get column names
p r i n t ( d a t a f r a m e . columns )
# d a t a f r a m e . columns i s a l i s t o f s t r i n g s
f i r s t c o l u m n = d a t a f r a m e . columns [ 0]
# p r i n t t h e f i s t column , which i s a s t r i n g
3.2
1
Select data from a dataframe
Select rows with row index
data frame . i l o c [ i ]
#i : row index
data frame . i l o c [0:3]
# s e l e c t t h e rows with i n d i c e s 0 ,1 ,2
Remark. The difference between loc and iloc: If the index of the dataframe is 3, 7, 0, 2,
. . ., iloc[0] will select the third row (true integer index), loc will select the 1st row (index
by locations).
3.6
1
2
Select row index with max values in a specific column
d a t a f r a m e [ ¡¯ column name ¡¯ ] . idxmax ( )
# r e t u r n s t h e 1 s t row index t h a t has max
3.7
Select given entry
5
................
................
In order to avoid copyright disputes, this page is only a partial summary.
To fulfill the demand for quickly locating and searching documents.
It is intelligent file search solution for home and business.
Related download
- cheat sheet pandas python datacamp
- data wrangling tidy data pandas
- worksheet data handling using pandas
- pandas dataframe notes university of idaho
- interaction between sas and python for data handling and visualization
- numpy scipy pandas cheat sheet
- introduction to python numpy pandas and plotting
- how to add row to pandas dataframe
- with pandas f m a f ma vectorized a f operations cheat sheet http
- manipulating and analyzing data with pandas eindhoven university of
Related searches
- state of utah division of finance
- python pandas apply
- python pandas string to date
- python pandas read csv
- pandas user guide pdf
- python pandas number of row
- python quick guide pdf
- state of utah medical license
- state of utah education
- state of utah finance department
- pandas quick reference
- university of utah stadium map