본문 바로가기

코딩/Python

[파이썬] 혼자 공부하는 데이터 분석(06 데이터표현, 07 검증,예측)

반응형

 

#1. top30_pubs의 선그래프 5개를 for문을 이용하여 그리기, x축 연도 1985~2025년도 설정, 객체지향 API
fig, ax = plt.subplots(figsize = 8,6))
for pub in top30_pubs.index[:5]:
  line = ns_book9[ns_book9['출판사'] == pub]
  ax.plot(line['발행년도'], line['대출건수'], label = pub)
ax.set_title('연도별 대출건수')
ax.set_xlim(1985, 2025)
fig.show()

#2. 하나의 피겨에 2개의 막대그래프, 겹치지 않게('발행년도', '대출건수'열의 '황금가지', 비룡소' 데이터)
fig, ax = plt.subplots(figsize = (8,6))
ax.bar(line1['발행년도'] - 0.2, line1['대출건수'], width = 0.4, label = '황금가지')
ax.bar(line2['발행년도'] + 0.2, line2['대출건수'], width = 0.4, label = '비룡소')
fig.show()

#3. data 열을 이용하여 원그래프 그리기
data = top30_pubs[:10]
labels = top30_pubs.index[:10]
fig, ax = plt.subplots(figsize = (8,6))
ax.pie(data, labels = labels)

 

 

(μ-σ)  μ → (μ+σ)

 

표준정규분포

표준편자 -1 ~ 1까지 의 확률분포는 68%

from scipy import stats

# m(평균 0)까지의 비율 구하기
stats.norm.cdf(0) #Cumulative Distribution Function(누적분포함수)
→ 0.5

# -1σ부터 +1σ까지의 비율 구하기
stats.norm.cdf(1) - stats.norm.cdf(-1)
→ 0.68

# -2σ부터 +2σ까지의 비율 구하기
stats.norm.cdf(2) - stats.norm.cdf(-2)
→ 0.95

# 90%까지의 z값
stats.norm.ppf(0.9)
→ 1.28

 

 
반응형