본문 바로가기

코딩/기타

판다스(panda) 기본

반응형

mask, loc, iloc

 

# pandas 라이브러리를 불러옵니다. pd를 약칭으로 사용합니다.
import numpy as np  #수치연산
import pandas as pd
import matplotlib.pyplot as plt #그래프 그려줌
import seaborn as sns #그래프 그려줌

# s는 1, 3, 5, 6, 8을 원소로 가지는 pandas.Series
pd.Series([1,3,5,6,8])

# 12x4 행렬에 1부터 48까지의 숫자를 원소를 가지고, index는 0부터 시작하고, coulmns은 순서대로 X1, X2, X3, X4로 하는 DataFrame 생성
df = pd.DataFrame(data=np.arange(1,49).reshape(12,4),columns=["X1","X2","X3","X4"])

# dataframe index
df.index

# dataframe columns
df.columns

# dataframe values
df.values

# 특정 column을 가져오기
df["X2"]

# X1 column에 2 더하기
df["X1"]+2

# dataframe의 맨 위 다섯줄을 보여주는 head()
df.head()

# 10줄
df.head(10)

# dataframe에 대한 전체적인 요약정보를 보여줍니다. index, columns, null/not-null/dtype/memory usage가 표시됩니다.
df.info()

# dataframe에 대한 전체적인 통계정보를 보여줍니다.
df.describe()

# X2 column를 기준으로 내림차순 정렬
df.sort_values(by="X2", ascending = False)

 

 

 

 

 

 

 

describe

ascending

 

 

마스크

 

 

반응형