| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
- pandas #ewma #python #지수이동가중평균 #파이썬 #판다스 #ema #ewm
- 깃허브
- version_error
- 특정값지우기
- AI #Inductive_Bias #Relational_inductive_bias
- ngrok
- pandas #python #date #datetime
- Github
- 선형회귀
- tensorflow #tensorflow-gpu #python #ubuntu #텐서플로우
- Asyncio
- 판다스 #Pandas #DataFrame #Statistics #통계 #파이썬 #Python #Resample
- git
- 시계열데이터
- pandas #python #excel #판다스 #파이썬 #엑셀저장 #xlsxwriter
- 비동기모듈
- aiohttp
- tf.where
- SQL #PostgreSQL
- 깃
- mnist
- 파이썬
- MachineLearning
- REST_API
- python #pandas #data_preprocessing #data_process
- Python
- SQL #python #MySQL #PostgreSQL
- AI #RNN #LSTM #LSTMP #인공지능 #언어학습 #순차학습
- fashionmnist
- TensorFlow
- Today
- Total
목록Python/Pandas (6)
린스토리
EWMA (Exponentially Weighted Moving Average) _ 지수가중평균 시간순서대로 나열되어 있는 데이터에 활용되며, 현재를 기준으로 오래된 값엔 낮은 가중치를 부여하고, 최근 값은 높게 부여하여 평균값을 도출하는 것 시계열 데이터를 다루다가 현재와 가까운 값이 더 중요함을 알려주고 싶어 고민하다가, EWMA를 적용한 데이터로 가공하자는 생각이 들었다. 이를 Pandas에서 api로 제공하여 손쉽게 사용할 수 있는 방법을 소개하고자 한다. (자세한건 여기) 내가 EWMA를 적용한 방식은 다음과 같다. 이 수식을 위 api를 활용해 적용하면, import pandas as pd df = pd.DataFrame({'test': [540, 320, 680, 120, 960, 450]}..
Pandas로 만든 DataFrame을 Excel로 저장하는 법을 알아보자. 근데 만들다보면 DataFrame이 여러개 생길 수 있고, 이걸 한 파일 내로 시트를 나눠 저장하고 싶을 때가 있다. 어떻게 하는지 알아보자! Pandas 모듈은 설치되어 있겠지만, 만약 'xlsxwriter' 모듈이 설치되어 있지 않다면 설치해주도록 하자. pip install xlsxwriter or conda install -c conda-forge xlsxwriter 이제 pandas dataframe이 있는 코드로 가서, 다음과 같이 해본다. # 1. excel writer 선언 writer = pd.ExcelWriter('./test.xlsx', engine='xlsxwriter') # 2. dataframe을 exc..
Pandas DataFrame은 왠만한 기능이 다 갖춰져 있어 데이터 가공이나 통계에 사용하기 매우 편리하다. 오늘은 기능 중 Time 기준으로 알아서 월별/주별/일별로 통계를 내주는 기능에 대해 알아보고자 한다. 우선, 다음과 같은 table이 있다고 생각해보자. table에서 time을 기준으로 월별 통계를 낸다고 해보자. 이걸 일일히 time의 month를 추출해서 1,2,3,4,5월에 해당하는 데이터만 따와서 평균이나 합계를 구할 필요없이 pandas에서 제공하는 아주 유용한 함수를 사용하면 된다. 바로, "Resample" 이라는 함수이다. RESAMPLE resample 함수는 time-series data에 적용하기 위한 함수이다. 자세한 설명은 여기에서 확인하면 된다. 그럼 바로 적용해보자..
Pandas를 활용해 Start Date와 End Date를 입력받아 날짜를 생성할 때 다음과 같이 사용하면 된다. pd.date_range(start = start_date, end = end_date, freq = 'D') # 'D': 1일 간격 생성 (Default) # 'W': 1주 간격 생성 # 'M': 1달 간격 생성 # 'A': 1년 간격 생성 'str' type으로 입력받은 날짜를 pandas date format 변환 date = '2022-06-19' pd_date = pd.to_datetime(date) 'str' type으로 입력받은 날짜 연산하기 date = '2022-06-19' after_date = pd.to_datetime(date) + pd.Timedelta(days=1)
1. 조건에 해당하는 값 변경 Pandas Dataframe에서 조건에 해당하는 값을 원하는 값으로 변경할 때! 아래 같은 경우, 'date' 컬럼에서 특정 날짜인 경우, 'price' 칼럼의 값을 변경하는 것이다. df.loc[df['date']== date, 'price'] = int(27500) 이렇게 사용하면 된다. 2. 여러 행, 여러 열 동시에 값 변경 df.loc[행의 인덱스 리스트, 열 이름 리스트] = 바꿀 값 df.loc[[2,4], ['price', 'count']] = 1000 3. 특정 행 값 전체 일괄 변경 df.loc[행의 인덱스] = 바꿀 값 리스트(컬럼 개수와 동일) df.loc[2] = [1000,2000,3000] 4. 특정 열 값 전체 일괄 변경 df['열 이름'] =..
Pandas 데이터 조작 및 분석을 위한 Python 프로그래밍 언어 용으로 작성된 소프트웨어 라이브러리. 특히, 숫자 테이블과 시계열을 조작하기 위한 데이터 구조와 연산을 제공. (위키백과) Pandas에서 DataFrame 생성 import pandas as pd df = pd.DataFrame(columns=['Age', 'Name', 'Sex', 'Job']) import pandas as pd df = pd.DataFrame({ "name" : ['TIM', 'TAM', 'TOM'], "job" : ['Student', 'Banker', 'Player'], "City" : ['L.A', 'Texas', 'N.Y']}) DataFrame에 list로 값 넣기(loc) mike = [20, 'mik..