'프로젝트로 배우는 데이터사이언스' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2024/06 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

Tags more

Archives

Today

Total

관리 메뉴

목록프로젝트로 배우는 데이터사이언스 (2)

하파와 데이터

의사결정나무 쉽게 따라해보기!(plot_tree그리기, 중요 feature 파악하기)

머신러닝에서 많이 사용되는 방법 중 '의사결정나무'가 있다. 의사결정 나무의 장점으로는 어떤 기준으로 분류를 하는지 명확하게 확인할 수 있다는 것이다. 이에 의사결정나무(DecisionTree)를 그려보는 것을 간단히 해보고자 한다. 본 연습은 naver connect재단에서 운영하는 boostcourse 강의 중 오늘 코딩 '박조은'님의 '프로젝트로 배우는 데이터사이언스'에서 학습한 내용을 토대로 한다. 아래의 실습을 따라하면, 간단하게 머신러닝을 실습해볼 수 있다. 활용데이터: Pima Indians Diabetes (출처: https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database) 환경: jupyter notebook 1. 데이터 구..

Development/Python 2024. 1. 13. 00:32

return으로 데이터 바로 분할하기(return_X_y=True)

DF에서 많은 예시로 사용하는 df 가운데 iris(붓꽃)데이터가 있다. iris 데이터는 sklearn에서 제공하는 데이터셋으로 머신러닝 초반부터 많은 예시로 활용되고 있다. 우선 iris 데이터를 불러오고 어떤 형태로 되어있는지 보자 from sklearn.datasets import load_iris iris = load_iris() iris iris 데이터를 출력하면, 아래와 같이 행렬의 구조인 data와 벡터형태인 target 2가지로 구성되어있는 것을 확인할 수 있다. 이에 보통 iris데이터를 위와같이 로드를 한 뒤, data와 target으로 각기 나눠서 저장한다. iris_data = iris['data'] iris_target = iris['target'] 헌데, 이를 처음부터 나눠서 ..

Development/Python 2024. 1. 12. 17:40

이전 Prev 1 Next 다음

목록프로젝트로 배우는 데이터사이언스 (2)

하파와 데이터

티스토리툴바