[Seaborn 튜토리얼]An introduction to seaborn_Intro
Seaborn은 판다스에서 통계 그래프를 만들기 위한 라이브러리이다. matplotlib 위에 구축되고 pandas 데이터 구조와 밀접하게 통합된다.
Seaborn은 데이터를 탐색하고 이해할 수 있도록 도와줍니다. Plotting 기능은 전체 데이터 세트를 포함하는 데이터 프레임 및 배열에서 작동하며 필요한 의미론적 매핑 및 통계 집계를 내부적으로 수행하여 유익한 플롯을 생성합니다. 데이터세트 중심의 선언적 API를 사용하면 플롯을 그리는 방법에 대한 세부 정보가 아니라 플롯의 다양한 요소가 의미하는 바에 집중할 수 있습니다.
다음은 seaborn이 할 수 있는 일의 예이다.
#Import seaborn
import seaborn as sns
#Apply the default theme
sns.set_theme()
#Load an example dataset
tips = sns.load_dataset("tips")
#Create a visualization
sns.relplot(
data=tips,
x = "total_bill", y="tip", col="time",
hue="smoker", styple="smoker", size="size",
)

뭔가 그려졌다. 하나씩 살펴보자.
#Import seaborn
import seaborn as sns
Seaborn은 간단한 이번 예에서 우리가 필요한 단 하나의 라이브러리이다. 관습적으로 sns라고 별명지어 불러온다.
사실 seaborn은 이 그래프들을 그리기 위해 matplotlib을 쓴다. 인터렉티브한 작업의 경우, 주피터나 IPython의 matplotlib 모드에서 사용하는 것이 좋다. 그렇지 않으면 그래프를 그리고 싶을 때 matplotlib.pyplot.show() 를 콜해야 할 것이다.
#Apply the default theme
sns.set_theme()
이것은 matplotlib rcParam 시스템을 사용하며 seaborn으로 만들지 않더라도 모든 matplotlib 그래프 모양에 영향을 준다. 기본 테마 외에도 몇가지 다른 옵션들이 있고, 그래프 스타일과 크기를 독립적으로 제어하여 프리젠테이션 중에 빠르게 변환할 수 있다. 예를 들어 폰트가 더 잘 읽히도록 그림을 변환하기. matplotlib 기본값이 마음에 들거나 다른 테마를 선호하는 경우는 이 단계를 건너뛰고 사용해도 된다.
#Load an example dataset
tips = sns.load_dataset("tips")
이 문서의 대부분의 코드는 예제 데이터셋에 빠르게 접근하기 위해 load_dataset() 함수를 사용할 것이다. 이 데이터셋이 특별한 것은 없다. 그냥 pandas 데이터프레임이고, pandas.read_csv()로 불러오거나 직접 구축할 수 있다. 문서의 대부분의 예제는 pandas 데이터프레임을 사용하여 데이터를 지정하지만, seaborn은 데이터 구조를 허용하는 데 매우 유연하다.
#Create a visualization
sns.relplot(
data=tips,
x = "total_bill", y="tip", col="time",
hue="smoker", styple="smoker", size="size",
)
이 plot은 seaborn 함수 relplot()에 대한 단일 호출을 사용하여 tips 데이터 셋의 5개의 변수 간의 관계를 보여준다. plot에서 변수의 이름과 역할만 쓰는 것을 주목하라. matplotlib가 색상 값이나 마커 코드 측면에서 플롯 속성을 지정하는 것과 달리 seaborn은 필요 없다. seaborn은 데이터 프레임의 값에서 matplotlib이 이해하는 인수로의 변환을 처리했다. 이 선언적 접근 방식을 사용하면 matplotlib을 제어하는 방법에 대한 세부정보가 아니라 원하는 값들에 집중할 수 있다.
* Seaborn 튜토리얼을 번역하였습니다.