본문 바로가기

#파이썬 #파이썬독학 #파이썬기초 #python #데이터분석

[python스터디] for문을 통한 월별 그래프 그리기(pointplot 사용) 안녕하세요 오늘은 for문, 반복문이라고도 하죠? for문을 통해서 월별/일자별 그래프를 그려보려고 합니다. 데이터셋에 연월/월일 데이터가 있는데, 월별 일자별 그래프를 그려볼 예정입니다. 데이터는 2019년 1월 부터 6월까지 있기 때문에 2019년 1월, 2019년 2월,..... 2019년 6월 이렇게 총 6개 그래프를 pointplot으로 그려 기울기를 나타내 보도록 할게요! 진행순서는 다음과 같습니다. 그래프를 그리기 위한 라이브러리를 불러오고요. 반복문을 통해 연월 데이터를 가져와서 월별 일자별 그래프를 그려보겠습니다. # 그래프 그리기에 필요한 라이브러리를 불러옵니다. # 한글을 표시하기 위해 폰트를 지정합니다. import matplotlib.pyplot as plt import seabo.. 더보기
[python스터디] 문자열 분리하기, 슬라이싱 안녕하세요 오늘은 문자열 인덱싱에 대해서 스터디해보도록 할게요! 문자열을 나누는 방법은 크게 슬라이싱과 split을 활용하는 방법이 있습니다. split의 경우는 문자가 띄어쓰기가 되어 있거나, 특정 문자를 기준으로 나눠져있을 때 사용하기 좋습니다. 예컨대, 2021 01 01 이나 2021-01-01 문자를 분리할 경우 split(), split('-')을 사용하면 쉽게 분리할 수 있죠 단, 해당 데이터타입이 문자여야이 split 함수를 사용할 수 있습니다. 아닌경우에는 문자형으로 바꿔주고 사용하실 수 있어요! str(2021 01 01) 또는 '2021 01 01' 이렇게 하면 문자로 바꿀 수 있겠죠? 오늘은 슬라이싱을 활용해보도록 하겠습니다. 아래와 같이 데이터셋 안에 연월일로 표시된 사용일자 컬럼.. 더보기
[python스터디] 결측치 보기, 결측치 시각화(barplot) 안녕하세요. 데이터셋에서 결측치를 어떻게 다루는지는 데이터 분석결과에 큰 영향을 미칠텐데요. 그래서 오늘은 결측치 세는 법과 결측치를 시각화하는 것을 스터디 해보도록 하겠습니다. 파이썬에서 결측치를 셀 때는 데이터프레임.isnull().sum()을 통해서 세면 되는데요. df.isnull() 명령어를 적게 되면 null값인 경우, false가 나타나고 null값이 아닌경우에는 true값이 나타납니다. df.innull() 파이썬에서는 True == 1, False == 0 으로 나타내기 때문에 위 데이터프레임의 합계를 구해주면 결측치값을 알 수 있습니다. df.isnull().sum() 이제 이 결측치값을 가독성을 높이기 위해 null_count라는 변수에 담고 barplot을 통해 시각화를 해보겠습니다.. 더보기
[python스터디] 멀티인덱스를 번호순으로 초기화(reset_index) 안녕하세요 오늘은 reset_index를 통한 인덱스 초기화를 해보려고 합니다. 매우 간단한데요. 데이터 전처리를 하다보면 아래처럼 멀티인덱스인 경우가 있는데요. (멀티인덱스는 인덱스가 2개이상인 것을 말합니다. 아래는 월일/요일 이렇게 2개이네요) 멀티인덱스인 경우, 데이터 분석시 불편함이 있기때문에 인덱스를 기존 숫자순으로 만들어주는 reset_index() 함수를 써보려고 합니다. #데이터 프레임명은 df_pivot인데요. 여기에 reset_index()만 추가해주면 됩니다. df_pivot.reset_index() 더보기
[python스터디] 텍스트 데이터 색인하기(str.contains) 안녕하세요 오늘은 데이터 분석에 있어서 매우중요한 색인에 대해 스터디해보려고 합니다. 특정 단어를 포함하거나 미포함할 때 쓰는 str.contains 를 사용하려고 합니다. df_seoul_hostpital이라는 데이터 프레임이고요. 여기서 우리는 상호명에 '종합병원'이 있는 데이터를 색인해보려고 합니다. 아래와 같이 str.contains()를 사용하게 되면 특정 컬럼에서 특정단어를 색인할 수 있습니다. 종합병원인 경우 True, 아닌경우 False로 표시가 됩니다. df_seoul_hospital['상호명'].str.contains("종합병원") 이것을 데이터프레임으로 보기위해 묶어주면 아래와 같이 나오네요. df_seoul_hospital[df_seoul_hospital['상호명'].str.cont.. 더보기
[python스터디] 일자를 요일로 바꾸려면(datetime, weekday) 안녕하세요 오늘은 일자 데이터를 요일로 바꾸는 스터디를 해보려고 합니다. 날짜를 관리하는 datetime 라이브러리에서 datetime.strptime을 통해서 문자타입 데이터를 날짜타입 데이터로 바꾸고 weekday를 통해 요일을 표시해보도록 하겠습니다. * datetime.strptime('날짜str', str형태) : 문자 --> 날짜 타입 str형태 %Y-%m-%d %H:%M:%S %Y : 연도(4자리) %m: 월(2자리) %d: 일자(2자리) %H : 시간 %M : 분 %S : 초 from datetime import datetime # 일시를 관리하는 datetime 라이브러를 불러오겠습니다. date_str = str(20190601) #숫자형날짜를 문자로 바꿔준다. date = dateti.. 더보기
[python스터디] for문을 활용하여 여러 개의 파일 행으로 합치기(append 함수) 안녕하세요 지난 시간에는 2개의 파일을 append로 합치는 것을 해보았는데요. 파일이 여러개일 경우에는 번거로울 수가 있겠죠? 2021.08.07 - [파이썬 데이터 분석] - [python스터디] 여러개의 파일 행으로 합치기(append 함수활용) 그래서 여러개의 파일을 합칠 경우에는 for문을 통해서 폴더 안에 있는 파일들을 1개씩 불러오게 하려고 합니다. 폴더/파일을 관리하는 os 라이브러리를 불러오고 os.listdir() 명령어를 통해 파일을 1개씩 불러올 수 있게 경로를 지정해주려고 합니다. impor os # 폴더/파일을 관리하는 os 라이브러리를 불러옵니다. os.listdir() #os.listdir()을 통해 현재 폴더의 파일을 확인합니다. 저는 'rawfiles'폴더 안에 파일을 넣.. 더보기