본문 바로가기
TIL - 프로그래밍/개념, 설정

[230704] Pandas 공부

by chaemj97 2023. 7. 4.
728x90

concat() vs merge()

  1. concat() 메서드는 동일한 형태의 데이터를 행이나 열을 기준으로 연결
  2. merge() 메서드는 서로 다른 두 데이터에서 공통된 열을 기준으로 데이터 병합

map() vs apply()

  1. 단일 컬럼에서는 둘 다 사용 O
  2. 다중 컬럼이 기준이 되는 경우에 map() 메서드 사용X

rename()

  • df.rename(columns = {'A':'B'}) : 컬럼A 이름을 B로 바꾸기

clip()

  • 이상치를 제거하거나 데이터를 일정 범위 내로 제한하려는 경우 유용하게 사용
  • df['A'].clip(upper=100) : 컬럼A의 값이 100을 초과하는 값은 100으로 바꾸기

sort_values()

  • 다중 열 정렬시 by = []

cut() vs qcut()

  1. cut()
    • 지정한 열의 값을 동일한 길이 구간으로 나누는 기능 제공
    • pd.cut(데이터, bins=구간의 개수,(labels = [구간명]))
  2. qcut()
    • 지정한 열의 값을 각 구간에 동일한 개수의 데이터가 들어가도록 나누기
    • pd.qcut(데이터, q=구간의 개수) 

where()

  • 조건이 True면 그대로, False면 값 변경
  • df.where(조건, 거짓일 때의 값)

선그래프

import matplotlib.pyplot as plt

df.plot(y = 'box_off_num')
plt.show()

산점도

df.plot.scatter(x = 'time', y = 'box_off_num')
plt.show()

# 산점도 행렬
pd.plotting.scatter_matrix(df, figsize = (16,12))
plt.show()

막대 그래프, 히스토그램, 상자 수염 그림, 원형 그래프

# 막대 그래프
grouped_over700.plot.bar(y = 'box_off_num')
plt.show()

# 히스토그램
df.plot.hist(y = 'time')
plt.show()

# 상자 수염 그림
df.plot.box(y = 'num_actor')
plt.show()

# 원형 그래프
pie_rating.plot.pie()
plt.show()

728x90
반응형

댓글