본문 바로가기

반응형

전체 글

(239)
파이썬, openpyxl(1)- 엑셀 입력 및 저장하기 from openpyxl import Workbook wb = Workbook() ws = wb.active ws.title = "dodo" ws["A1"] = 1 ws["A2"] = 2 ws["A3"] = 3 ws["B1"] = 4 ws["B2"] = 5 ws["B3"] = 6 ws.cell(row = 1, column = 2).value = 7 #b2의 값 변경 print(ws["B1"].value) #B1의 값 출력 print(ws["B4"].value) #값이 없을 땐 none 출력 #반복문을 이용해서 랜덤숫자 입력하기 from random import * for x in range(1, 11): for y in range(1, 11): ws.cell(row=x, column = 1, value ..
좋은 아빠 되기(1)_아이의 수면교육 수면교육 - 아이의 이상적인 수면 시간은 19~20시부터 06~07시까지이며, 17~18시부터 재울 준비 해야함 - 빠른 아이는 수면교육이 잘 되면 6주부터 낮밤 구분 - 수면교육이 늦을 경우 06~07시에 일어날 수 있도록 하루 30분씩 앞당기면서 깨울 것 - 수면교육은 늦어도 4개월전에는 시작해야 함 월령별 수면 횟수 및 시간 낮잠 횟수 총 낮잠 시간 밤잠 시간 총 수면 시간 0~2개월 16~20 6~8개월 2~3 2~5 14~18 12개월 무렵 1~2 2~3 11~12 13~15 2~3세 0~1 1~2.5 11~12 12~13.5 웨이스블러스법 : 울다 지쳐 잠들게 하라 페버법 : 아이에게 가는 시간을 늦춰라 - 아이가 울 때 바로 가지 않고 일정한 시간을 기다린 후 들어가라 - 수면교육 첫 날은 ..
금융공학 강의 요약(1) 헤리 마코위츠 -계란을 한 바구니에 담지 말라는 월스트릿의 오랜 격언을 수학적으로 증명 -동일 수준의 위험에서 가장 높은 기대수익률 포트폴리오를 어떻게 선택할 지 최적화 방법 제 ㅇ확률분포의 종류 -이산형 확률분포 : 확률변수 x의 값이 셀 수 있는 개수인 경우의 확률분포(이항분포) -연속형 확률분포 : 확률변수 x의 값이 셀 수 없는 개수인 경우의 확률분포(정규분포) ㅇ형태통계량 왜도 : 데이터의 편향도 첨도 : 뾰족함 정도 boxplot - Q1, Q2, Q3 → 각각 상위 75%, 50%, 25% - Q3-Q1 = IQR(Inter Quentile Range) - 초록색 도트는 극단값에 해당함 (분홍색의 치우침에 따라 왜도, 극단값이 많을 수록 첨도가 설명 가능) ㅇ 공분산과 상관관계 - 두 변수가..
데이터 전처리(네이버 쇼핑 웹 크롤링 후 seaborn) 출처 : 패스트캠퍼스 김용담 강사 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns apple = pd.read_excel("./naver_shopping(삼성).xlsx") #날짜 정보 변경 apple["등록일"] = apple["등록일"] + '01' apple["등록일"] = pd.to_datetime(apple["등록일"]) #특정 단어 포함 from collections import Counter product_names = [] #apple["제품명"].str.split() → [삼성토너, 정품프린터용, ...] #apple["제품명"].str.split().tolist() → ['삼성토너', '정품프린터용', ..
네이버 쇼핑 웹 크롤링 출처 : 패스트캠퍼스 김용담 강사 import requests import bs4 import pandas as pd from selenium.webdriver.common.by import By import time from tqdm.notebook import tqdm #프로세스바 import warnings warnings.simplefilter('ignore') query = "삼성" titles = [] prices = [] review_counts = [] buy_counts = [] published_dates = [] favorites = [] driver = Chrome('./chromedriver') for page_no in tqdm(range(1, 3)): #페이지 수 1~2페이지 ..
plotly 사용 예시(그래프) histogram import plotly.express as px df = px.data.tips() fig = px.histogram(data_frame=df, x="total_bill", nbins=30, #가로 범위 color = "sex") #seaborn에서 hue와 같다. 성별 2종류로 구분하여 표현 fig.show() #show를 해야 표현 가능 import plotly.express as px df = px.data.tips() fig = px.box(df, x="day", y="total_bill", color="smoker", notched=True) fig.show() ganttchart(프로젝트 일정관리) # gantt chart import plotly.express as px ..
seaborn(lineplot, pointplot, barplot, heatmap, pairplot 등) 펭귄 데이터 불러오기 import seaborn as sns sns.set_theme(style='whitegrid') penguins = sns.load_dataset("penguins").dropna() #NAN(비어있는 데이터) 제거 lineplot (1) sns.lineplot(data = penguins, x="body_mass_g", y = "flipper_length_mm", ci = None) #ci는 오차범위 그래프, None은 설정안함 lineplot(2), species별로 그래프 색깔을 다르게 sns.lineplot(data = penguins, x="body_mass_g", y = "bill_length_mm", ci = None, hue = "species") #species별로..
엑셀 데이터 합치기 from glob import glob from tqdm.notebook import tqdm #프로세스bar import os # 엑셀 합치기 stations_files = glob('./data/opinet/*.xls') total = pd.DataFrame() #temp를 누적하여 저장할 total을 만드는데 데이터프레임 형태로 만듦 for file_name in tqdm(stations_files): #프로세스bar 보이기 temp = pd.read_excel(file_name, header = 2) total = pd.concat([total, temp]) #concat 데이터아래 또 다른 데이터 붙이기 total = total.sort_values(by="경유") #내림차순 정렬은 (by="경..

반응형