'Python' 태그의 글 목록

본문 바로가기

Python

[python스터디] groubpy 와 pivot_table 결과값 차이점 안녕하세요 오늘은 데이터 분석시 많이 쓰이는 groupby와 pivot_table의 차이점에 대해 스터디 해보도록 할게요!! 아래와 같은 데이터프레임이 있는데요. 저희는 시군구명, 브랜드명별로 상호명을 세어 보도록 하겠습니다. 한가지 팁을 드리자면, ~~~별이 나오면 00별 기준으로 groupby나 pivot_table을 사용하시면 됩니다. 예를 들어, 지역별, 연령별이면 df.groupy('지역'), pd.pivot_table(index = '연령') 이런식으로 써주시면 됩니다. 그러면 바로 결과 확인해볼게요! groupby로 하면 아래와 같이 시리즈 파일로 나와서 reset_index()를 통해서 데이터프레임으로 만들어줍니다. df_cafe_vs = df_cafe.groupby(['시군구명','브랜드.. 더보기

[python스터디] 문자열 치환/제거(replace 함수) 안녕하세요 오늘은 참 유용한 함수인 replace에 대해서 살펴보도록 할게요. replace는 전처리 하다보면간단할 것 같은데 막상 하려고 하면 어려운 전처리 과정에서 크게 도움이 될 때가 많은데요. 특정 문자열을 제거하거나 생략하면 됩니다. 제거하는 것도 사실 치환의 일부분인데요. replace('기존문자','바꿀문자')에서 '바꿀문자'에 '' 이렇게 공백으로 해두면 제거가 된답니다. 저는 오늘 아래 테이블에서 뚜레쥬는 '1', 파리바게뜨는 '0'으로 바꿔보겠습니다. heat['브랜드명'].replace('뚜레쥬르',1).replace('파리바게뜨',0) 바꾸니 시리즈 확인하실 수 있습니다 쉽죠???ㅎㅎ 잘 활용해보세요~~ 더보기

[python스터디] 여러개의 파일 행으로 합치기(append 함수활용) 안녕하세요 오늘은 여러개의 CSV파일을 하나로 합치는 스터디를 해보려고 합니다. 바로 append 함수를 사용할 껀데요. 데이터셋이 아래와 같이 2개 파일이 있고 동일한 컬럼을 가지고 있을때, 쓰시기 좋은 방법입니다. 1)데이터셋 : 2019년도 1월 지하철 이용데이터 2)데이터셋 : 2019년도 2월 지하철 이용데이터 방법은 아래 순서로 하시면됩니다. 1. 두개의 데이터셋을 담을 데이터 프레임 만들기 2. 불러올 파일을 변수 temp_1,temp_2에 담기 3. append로 변수 1,2를 데이터프레임에 담기 data = pd.DataFrame() #데이터프레인 만들기 file_1 = 'CARD_SUBWAY_MONTH_201901.csv' file_2 = 'CARD_SUBWAY_MONTH_201902... 더보기

이전 1 다음

티스토리툴바