본문 바로가기

코딩/기타

데이터분석 입문(타이타닉)

반응형
import pandas as pd

# 타이타닉 데이터 불러오기
titanic = pd.read_csv("./data/titanic.csv")

#나이가 30세 이상인 사람의 이름 보기
titanic.loc[30<=titanic["Age"], "Name"]

# 성별을 기준으로 생존률 파악
pd.pivot_table(data = titanic, 
               index = "Sex",
               values = "Survived",
               aggfunc=[ "count", "sum", "mean"])  #aggregation : 집합, mean : 평균
               
# 사회 계급을 기준으로 생존률 파악
pd.pivot_table(data = titanic, 
               index = ["Pclass", "Sex"],
               values = "Survived",
               aggfunc=[ "count", "sum", "mean"])

 

타이타닉 데이터 불러오기

나이가 30세 이상인 사람의 이름 보기

성별을 기준으로 생존률 파악

사회 계급을 기준으로 생존률 파악

 

※출처 : 패스트캠퍼스 김용담강사

반응형