Matplotlib - pairplot
category
URL
date
Jan 27, 2023
slug
Matplotlib-pairplot
author
status
Public
tags
Playdata_Python
summary
matplotlib - pairplot 종류
type
Post
thumbnail
updatedAt
Jan 27, 2023 07:39 AM
pairplot
- 데이터셋 내의 각 column마다 pair로 경우에 수에 따라 묶고 그에 따른 결과를 일목요연하게 한번에 확인할 수 있는 플롯
- pairplot()으로 서로 다른 column간에 비교할 떄 가장 단순하게 적용하기 좋은 것이 scatterplot
- 같은 column이 겹치는 위치에는 histplot()의 결과를 보여줘서 값의 밀도가 어떻게 되는지 보여줌
# pairplot
penguins = sns.load_dataset("penguins")
sns.pairplot(penguins)

1.hue키워드
- hue 키워드 인수에 species를 전달하여 펭귄의 종마다 어떤 분포를 갖는지 분류
- joint plot 떄와 같게도 자동적으로 marginal plot의 형태가 kde로 변경된 것을 확인
# hue 키워드 인수에 species를 전달
sns.pairplot(penguins, hue="species")

2.diag_kind
- marginal plot이 kde가 아닌 histogram으로 표현 가능
- histogram을 의미하는 hist 문자열을 값으로 전달하면 된다.
# histogram으로도 표현 가능
sns.pairplot(penguins, hue="species",diag_kind="hist")

3.다른 column과의 비교
- kind라는 키워드 인수에 kde를 전달하여 서로 다른 column간에 결과를 더 보기좋게 비교
# 다른 column과 비교하는 플롯의 종류
sns.pairplot(penguins, hue="species",kind="kde")

4.x_vars, y_vars
- x_vars,y_vars 키워드 인수를 활용하여 원하는 column만 추려서 비교 가능
# x_vars, y_vars 키워드 인수 활용
sns.pairplot(
penguins,
x_vars=["bill_length_mm","bill_depth_mm","flipper_length_mm"],
y_vars=["bill_length_mm","bill_depth_mm"],
)

5.coner-True
- 한 방향으로만 그 분포를 얻으면 corner라는 키워드 인수를 활용해서 True로 설정
- 삼각형 모향의(축의 방향을 고려 않았을 떄) 중복 없는 결과를 얻을 수 있음.
# corner=True
sns.pairplot(penguins, hue="species", corner=True)
