반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 빅데이터분석기사
- 컨버티드
- 데이터리안
- 빅분기
- 정처기
- 빅데이터분석기사 실기
- 통계독학
- 투자마인드
- 메타코드
- 데이터분석가
- 투자도서
- 빅분기실기
- 데이터자격증
- 우리금융캐피탈면접
- 빅분기1유형
- 우금캐면접
- sql
- MySQL
- 빅분기 실기
- 빅데이터분석기사실기
- 메타코드m
- BNK저축은행
- 데이터분석
- 데이터넥스트레벨챌린지
- 실기1유형
- 우리금융캐피탈
- 우금캐
- 데이터분석마인드셋
- boostcourse
- 데이터분석전문가
Archives
- Today
- Total
하파와 데이터
return으로 데이터 바로 분할하기(return_X_y=True) 본문
DF에서 많은 예시로 사용하는 df 가운데 iris(붓꽃)데이터가 있다.
iris 데이터는 sklearn에서 제공하는 데이터셋으로 머신러닝 초반부터 많은 예시로 활용되고 있다.
우선 iris 데이터를 불러오고 어떤 형태로 되어있는지 보자
from sklearn.datasets import load_iris
iris = load_iris()
iris
iris 데이터를 출력하면, 아래와 같이 행렬의 구조인 data와 벡터형태인 target 2가지로 구성되어있는 것을 확인할 수 있다.
이에 보통 iris데이터를 위와같이 로드를 한 뒤, data와 target으로 각기 나눠서 저장한다.
iris_data = iris['data']
iris_target = iris['target']
헌데, 이를 처음부터 나눠서 불러오는 방법이 있다.
from sklearn.datasets import load_iris
X, y = load_iris(return_X_y=True)
이렇게 처리하면, X에 data의 행렬이, y에는 target벡터 데이터가 들어가게 된다.
아주 편리하게 데이터를 분할해서 넣을 수 있다.
한줄이라도 코드를 줄여서 쓸 수 있다면 얼마나 좋은가 !
반응형
'Development > Python' 카테고리의 다른 글
df.describe(include='object') 데이터프레임 기술분석 다양하게 해보기 (0) | 2024.01.15 |
---|---|
의사결정나무 쉽게 따라해보기!(plot_tree그리기, 중요 feature 파악하기) (2) | 2024.01.13 |
Python 자료형 - 자료형과 자료형 확인하는 법 (0) | 2023.07.20 |