카테고리 없음
[파이썬] 혼자 공부하는 데이터 분석(04-1 통계로 요약하기)
도아죻아
2023. 4. 25. 22:20
반응형
#1. 도서권수가 0인 도서의 행 개수를 카운트
#2. 도서권수가 0보다 큰 값을 새로 저장
#3. Object타입의 열에 대한 통게
#4. 대출건수의 평균값과 중간값
#5. 대출건수의 중복값을 제외한 중앙값
#6. 대출건수의 1/4에 위치한 값
#7. 대출건수가 10이 위치한 백분위
#8. 대출건수의 분산 및 표준편자, 최빈값
#9. ns_book7의 최빈값('도서명'부터~) #'번호'열은 의미없음
#10. 넘파이에서 ①0.25,0.5분위수, ②분산, ③표준편차,
#1. 도서권수가 0인 도서의 행 개수를 카운트
sum(ns_book6['도서권수'] == 0)
#2. 도서권수가 0보다 큰 값을 새로 저장
ns_book7 = ns_book6[ns_book6['도서권수']>0]
#3. Object타입의 열에 대한 통게
ns_book7.describe(include = 'Object')
#4. 대출건수의 평균값과 중간값
ns_book7['대출건수'].mean()
ns_book7['대출건수'].median()
#5. 대출건수의 중복값을 제외한 중앙값
ns_book7['대출건수'].drop_duplicates().median()
#6. 대출건수의 1/4에 위치한 값
ns_book7['대출건수'].quantile(0.25)
#7. 대출건수가 10이 위치한 백분위
borrow_10 = ns_book7['대출건수'] < 10
borrow_10.mean() #값은 0.64 나옴
ns_book7['대출건수'].quantile(0.64) # 값은 10
#8. 대출건수의 분산 및 표준편자, 최빈값
ns_book7['대출건수'].var()
ns_book7['대출건수'].std()
ns_book7['대출건수'].mode()
#9. ns_book7의 최빈값('도서명'부터~) #'번호'열은 의미없음
ns_book7.loc[:, '도서명':].mode()
#10. 넘파이에서 '대출건수'열의 ①0.25,0.5분위수, ②분산, ③표준편차,
np.quantile(ns_book7['대출건수'],[0.25, 0.5])
np.var(ns_book7['대출건수'])
np.std(ns_book7['대출건수'])
출처:혼자공부하는데이터분석
반응형