728x90
concat() vs merge()
- concat() 메서드는 동일한 형태의 데이터를 행이나 열을 기준으로 연결
- merge() 메서드는 서로 다른 두 데이터에서 공통된 열을 기준으로 데이터 병합
map() vs apply()
- 단일 컬럼에서는 둘 다 사용 O
- 다중 컬럼이 기준이 되는 경우에 map() 메서드 사용X
rename()
- df.rename(columns = {'A':'B'}) : 컬럼A 이름을 B로 바꾸기
clip()
- 이상치를 제거하거나 데이터를 일정 범위 내로 제한하려는 경우 유용하게 사용
- df['A'].clip(upper=100) : 컬럼A의 값이 100을 초과하는 값은 100으로 바꾸기
sort_values()
- 다중 열 정렬시 by = []
cut() vs qcut()
- cut()
- 지정한 열의 값을 동일한 길이 구간으로 나누는 기능 제공
- pd.cut(데이터, bins=구간의 개수,(labels = [구간명]))
- qcut()
- 지정한 열의 값을 각 구간에 동일한 개수의 데이터가 들어가도록 나누기
- pd.qcut(데이터, q=구간의 개수)
where()
- 조건이 True면 그대로, False면 값 변경
- df.where(조건, 거짓일 때의 값)
선그래프
import matplotlib.pyplot as plt
df.plot(y = 'box_off_num')
plt.show()
산점도
df.plot.scatter(x = 'time', y = 'box_off_num')
plt.show()
# 산점도 행렬
pd.plotting.scatter_matrix(df, figsize = (16,12))
plt.show()
막대 그래프, 히스토그램, 상자 수염 그림, 원형 그래프
# 막대 그래프
grouped_over700.plot.bar(y = 'box_off_num')
plt.show()
# 히스토그램
df.plot.hist(y = 'time')
plt.show()
# 상자 수염 그림
df.plot.box(y = 'num_actor')
plt.show()
# 원형 그래프
pie_rating.plot.pie()
plt.show()
728x90
반응형
'TIL - 프로그래밍 > 개념, 설정' 카테고리의 다른 글
구글 한글 깨짐 해결 ([matplotlib] 한글 폰트 설정) (0) | 2024.06.14 |
---|---|
Linux, Shell Command (1) | 2023.04.27 |
파이썬 버전 관리 (venv, pip, poetry) (0) | 2023.04.26 |
python 알고리즘 풀면서 도움이 된 10가지 2. (0) | 2022.07.03 |
[Python] deque (0) | 2022.05.03 |
댓글