코딩/기타
seaborn(lineplot, pointplot, barplot, heatmap, pairplot 등)
자본왕김민춘
2023. 3. 19. 21:23
반응형
펭귄 데이터 불러오기
import seaborn as sns
sns.set_theme(style='whitegrid')
penguins = sns.load_dataset("penguins").dropna() #NAN(비어있는 데이터) 제거
lineplot (1)
sns.lineplot(data = penguins, x="body_mass_g",
y = "flipper_length_mm", ci = None) #ci는 오차범위 그래프, None은 설정안함
lineplot(2), species별로 그래프 색깔을 다르게
sns.lineplot(data = penguins, x="body_mass_g",
y = "bill_length_mm", ci = None,
hue = "species") #species별로 그래프 그리기
pointplot
sns.pointplot(data = penguins, x="species",
y = "body_mass_g",
hue = "sex", palette = "ocean") #shift + tab 누르면 설정 나오고, 팔레트 색깔이 ocean
barplot(가로,세로막대)
sns.barplot(data = penguins,
x = "island",
y = "body_mass_g",
hue = "sex")
hisplot(히스토그램 = 도수분)
sns.histplot(data = penguins,
x="bill_depth_mm",
bins=30, #가로 막대 개수, 생략가능
hue = "species", #종별로 그래프 여러개
multiple = 'stack') #설정 안하면 색이 혼합되니깐 구분하기 위해 위로 stack
countplot(숫자 세기)
sns.countplot(data = penguins,
x = "island")
boxplot (사분위 수)
sns.boxplot(data = penguins,
x = "species",
y = "body_mass_g")
swarmsplot (분포도)
sns.swarmplot(data = penguins,
x = "sex",
y = "flipper_length_mm")
scatterplot (산포도)
sns.scatterplot(data = penguins,
x = "body_mass_g",
y = "flipper_length_mm",
hue="species")
heatmap
#1. 상관관계를 숫자 테이플로 표현
penguins.corr()
#2. 테이블을 색상으로 표시
sns.heatmap(data = penguins.corr(),
annot = True, #테이블에 숫자 넣기
cmap = "Blues") #색깔을 넣을 때 cmap사용
숫자 1에 가까울 수록 관계있
pairplot
sns.pairplot(data = penguins, hue = "species")
※출처 : 패스트캠퍼스 김용담강
반응형