일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 마케팅
- MySQL
- 딥러닝
- 데이터분석
- 컨버티드
- coursera
- 데이터리안
- 데분
- 데이터분석준전문가
- 데이터분석가
- 데이터분석마인드셋
- 데이터 처리 기술 이해
- 데이터애닐러틱스
- 창조적학습
- 코세라
- 마케팅책
- 법무법인데이터분석가
- 데이터넥스트레벨챌린지
- 자격증
- 이달의책
- 데벨챌
- 오답노트
- ADP
- 데이터분석전문가
- AI Specialization
- ADsP
- 티아고포르테
- sql
- boostcourse
- 프로젝트로 배우는 데이터사이언스
- Today
- Total
목록프로젝트로 배우는 데이터사이언스 (2)
하파와 데이터
머신러닝에서 많이 사용되는 방법 중 '의사결정나무'가 있다. 의사결정 나무의 장점으로는 어떤 기준으로 분류를 하는지 명확하게 확인할 수 있다는 것이다. 이에 의사결정나무(DecisionTree)를 그려보는 것을 간단히 해보고자 한다. 본 연습은 naver connect재단에서 운영하는 boostcourse 강의 중 오늘 코딩 '박조은'님의 '프로젝트로 배우는 데이터사이언스'에서 학습한 내용을 토대로 한다. 아래의 실습을 따라하면, 간단하게 머신러닝을 실습해볼 수 있다. 활용데이터: Pima Indians Diabetes (출처: https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database) 환경: jupyter notebook 1. 데이터 구..
DF에서 많은 예시로 사용하는 df 가운데 iris(붓꽃)데이터가 있다. iris 데이터는 sklearn에서 제공하는 데이터셋으로 머신러닝 초반부터 많은 예시로 활용되고 있다. 우선 iris 데이터를 불러오고 어떤 형태로 되어있는지 보자 from sklearn.datasets import load_iris iris = load_iris() iris iris 데이터를 출력하면, 아래와 같이 행렬의 구조인 data와 벡터형태인 target 2가지로 구성되어있는 것을 확인할 수 있다. 이에 보통 iris데이터를 위와같이 로드를 한 뒤, data와 target으로 각기 나눠서 저장한다. iris_data = iris['data'] iris_target = iris['target'] 헌데, 이를 처음부터 나눠서 ..