카테고리 없음

[파이썬] 혼자 공부하는 데이터 분석(04-1 통계로 요약하기)

도아죻아 2023. 4. 25. 22:20
반응형

#1. 도서권수가 0인 도서의 행 개수를 카운트

#2. 도서권수가 0보다 큰 값을 새로 저장

#3. Object타입의 열에 대한 통게

#4. 대출건수의 평균값과 중간값

#5. 대출건수의 중복값을 제외한 중앙값

#6. 대출건수의 1/4에 위치한 값

#7. 대출건수가 10이 위치한 백분위

#8. 대출건수의 분산 및 표준편자, 최빈값

#9. ns_book7의 최빈값('도서명'부터~) #'번호'열은 의미없음

#10. 넘파이에서 ①0.25,0.5분위수, ②분산, ③표준편차, 

 

#1. 도서권수가 0인 도서의 행 개수를 카운트
sum(ns_book6['도서권수'] == 0)

#2. 도서권수가 0보다 큰 값을 새로 저장
ns_book7 = ns_book6[ns_book6['도서권수']>0]

#3. Object타입의 열에 대한 통게
ns_book7.describe(include = 'Object')

#4. 대출건수의 평균값과 중간값
ns_book7['대출건수'].mean()
ns_book7['대출건수'].median()

#5. 대출건수의 중복값을 제외한 중앙값
ns_book7['대출건수'].drop_duplicates().median()

#6. 대출건수의 1/4에 위치한 값
ns_book7['대출건수'].quantile(0.25)

#7. 대출건수가 10이 위치한 백분위
borrow_10 = ns_book7['대출건수'] < 10
borrow_10.mean() #값은 0.64 나옴
ns_book7['대출건수'].quantile(0.64) # 값은 10

#8. 대출건수의 분산 및 표준편자, 최빈값
ns_book7['대출건수'].var()
ns_book7['대출건수'].std()
ns_book7['대출건수'].mode()

#9. ns_book7의 최빈값('도서명'부터~) #'번호'열은 의미없음
ns_book7.loc[:, '도서명':].mode()

#10. 넘파이에서 '대출건수'열의 ①0.25,0.5분위수, ②분산, ③표준편차, 
np.quantile(ns_book7['대출건수'],[0.25, 0.5])
np.var(ns_book7['대출건수'])
np.std(ns_book7['대출건수'])

출처:혼자공부하는데이터분석

반응형