반응형
mask, loc, iloc
# pandas 라이브러리를 불러옵니다. pd를 약칭으로 사용합니다.
import numpy as np #수치연산
import pandas as pd
import matplotlib.pyplot as plt #그래프 그려줌
import seaborn as sns #그래프 그려줌
# s는 1, 3, 5, 6, 8을 원소로 가지는 pandas.Series
pd.Series([1,3,5,6,8])
# 12x4 행렬에 1부터 48까지의 숫자를 원소를 가지고, index는 0부터 시작하고, coulmns은 순서대로 X1, X2, X3, X4로 하는 DataFrame 생성
df = pd.DataFrame(data=np.arange(1,49).reshape(12,4),columns=["X1","X2","X3","X4"])
# dataframe index
df.index
# dataframe columns
df.columns
# dataframe values
df.values
# 특정 column을 가져오기
df["X2"]
# X1 column에 2 더하기
df["X1"]+2
# dataframe의 맨 위 다섯줄을 보여주는 head()
df.head()
# 10줄
df.head(10)
# dataframe에 대한 전체적인 요약정보를 보여줍니다. index, columns, null/not-null/dtype/memory usage가 표시됩니다.
df.info()
# dataframe에 대한 전체적인 통계정보를 보여줍니다.
df.describe()
# X2 column를 기준으로 내림차순 정렬
df.sort_values(by="X2", ascending = False)
describe
ascending
마스크
반응형
'코딩 > 기타' 카테고리의 다른 글
seaborn(lineplot, pointplot, barplot, heatmap, pairplot 등) (1) | 2023.03.19 |
---|---|
엑셀 데이터 합치기 (0) | 2023.03.19 |
데이터분석 입문(타이타닉) (0) | 2023.03.19 |
데이터 크롤링(네이버 코스피 가져오기) (0) | 2023.03.18 |
아나콘다 설치 오류(SSL) (0) | 2023.03.16 |