코딩/기타

seaborn(lineplot, pointplot, barplot, heatmap, pairplot 등)

자본왕김민춘 2023. 3. 19. 21:23
반응형
펭귄 데이터 불러오기
import seaborn as sns
sns.set_theme(style='whitegrid')
penguins = sns.load_dataset("penguins").dropna() #NAN(비어있는 데이터) 제거

 

 

lineplot (1)
sns.lineplot(data = penguins, x="body_mass_g",
            y = "flipper_length_mm", ci = None) #ci는 오차범위 그래프, None은 설정안함

 

 

lineplot(2), species별로 그래프 색깔을 다르게
sns.lineplot(data = penguins, x="body_mass_g",
            y = "bill_length_mm", ci = None,
            hue = "species") #species별로 그래프 그리기

 

pointplot
sns.pointplot(data = penguins, x="species",
            y = "body_mass_g",
             hue = "sex", palette = "ocean")  #shift + tab 누르면 설정 나오고, 팔레트 색깔이 ocean

barplot(가로,세로막대)
sns.barplot(data = penguins,
             x = "island",
             y = "body_mass_g",
             hue = "sex")

 

 

hisplot(히스토그램 = 도수분)
sns.histplot(data = penguins,
             x="bill_depth_mm",
             bins=30, #가로 막대 개수, 생략가능
             hue = "species", #종별로 그래프 여러개
             multiple = 'stack') #설정 안하면 색이 혼합되니깐 구분하기 위해 위로 stack

 

countplot(숫자 세기)
sns.countplot(data = penguins,
             x = "island")

 

boxplot (사분위 수)
sns.boxplot(data = penguins,
           x = "species",
           y = "body_mass_g")

 

swarmsplot (분포도)
sns.swarmplot(data = penguins,
           x = "sex",
           y = "flipper_length_mm")

scatterplot (산포도)
sns.scatterplot(data = penguins,
           x = "body_mass_g",
           y = "flipper_length_mm",
            hue="species")

 

heatmap
#1. 상관관계를 숫자 테이플로 표현
penguins.corr()


#2. 테이블을 색상으로 표시
sns.heatmap(data = penguins.corr(),
            annot = True, #테이블에 숫자 넣기
            cmap = "Blues") #색깔을 넣을 때 cmap사용

숫자 1에 가까울 수록 관계있

 

pairplot
sns.pairplot(data = penguins, hue = "species")

 

※출처 : 패스트캠퍼스 김용담강

반응형