일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 정처기
- 투자도서
- 통계독학
- 데이터분석
- 메타코드
- sql
- 메타코드m
- 컨버티드
- 데이터분석전문가
- 데이터리안
- BNK저축은행
- 빅분기실기
- 빅데이터분석기사
- 데이터분석가
- 우리금융캐피탈
- 우금캐
- 데이터자격증
- 투자마인드
- 빅분기 실기
- 우금캐면접
- 빅분기
- 빅분기1유형
- 우리금융캐피탈면접
- 빅데이터분석기사실기
- 실기1유형
- MySQL
- 빅데이터분석기사 실기
- 데이터넥스트레벨챌린지
- boostcourse
- 데이터분석마인드셋
- Today
- Total
목록Development/Python (4)
하파와 데이터
일반적으로 데이터분석을 하거나, ML 등의 데이터를 기반으로 무언가를 작업할 때 데이터를 불러온 뒤 가장 처음하는 것이 데이터가 어떤 구조로 되어있는지? 살펴보는 것이다. 어려운 말로 하면 EDA (Exploratory Data Analysis, 탐색적 데이터 분석)라고 할 수 있다. 간단한 앞서 '의사결정나무(DecisionTree)'를 해본 실습에서 사용했던 Diabates 데이터를 기반으로 이를 간단히 해보겠다. 쉽게 해보는 실습은 아래 링크를 참조!(데이터파일도 아래 링크를 통해 kaggle에서 다운받을 수 있다. 2024.01.13 - [Development/Python] - 의사결정나무 쉽게 따라해보기!(plot_tree그리기, 중요 feature 파악하기) 의사결정나무 쉽게 따라해보기!(pl..
머신러닝에서 많이 사용되는 방법 중 '의사결정나무'가 있다. 의사결정 나무의 장점으로는 어떤 기준으로 분류를 하는지 명확하게 확인할 수 있다는 것이다. 이에 의사결정나무(DecisionTree)를 그려보는 것을 간단히 해보고자 한다. 본 연습은 naver connect재단에서 운영하는 boostcourse 강의 중 오늘 코딩 '박조은'님의 '프로젝트로 배우는 데이터사이언스'에서 학습한 내용을 토대로 한다. 아래의 실습을 따라하면, 간단하게 머신러닝을 실습해볼 수 있다. 활용데이터: Pima Indians Diabetes (출처: https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database) 환경: jupyter notebook 1. 데이터 구..
DF에서 많은 예시로 사용하는 df 가운데 iris(붓꽃)데이터가 있다. iris 데이터는 sklearn에서 제공하는 데이터셋으로 머신러닝 초반부터 많은 예시로 활용되고 있다. 우선 iris 데이터를 불러오고 어떤 형태로 되어있는지 보자 from sklearn.datasets import load_iris iris = load_iris() iris iris 데이터를 출력하면, 아래와 같이 행렬의 구조인 data와 벡터형태인 target 2가지로 구성되어있는 것을 확인할 수 있다. 이에 보통 iris데이터를 위와같이 로드를 한 뒤, data와 target으로 각기 나눠서 저장한다. iris_data = iris['data'] iris_target = iris['target'] 헌데, 이를 처음부터 나눠서 ..
Python에는 여러가지 형태들이 존재한다. 형태에 따라서 적용되는 함수가 있고, 적용이 불가능한 함수들이 있다. 이에 데이터 분석을 위해선 자료가 어떤 형태를 가지고 있는지 파악하고, 내가 필요한 형태로 변경하는 처리작업이 필요하다. 숫자형을 문자형으로, 문자형을 날짜형으로 바꾸는등 데이터 분석에 적합하게 변경하는 전처리 작업을 해야 내가 원하는 작업들을 수월하게 할 수 있다. 다양한 형태 중 가장 기본인 자료형부터! 자료형 int(정수) a= 3 float(실수) b=3.14 str(문자열) c= 'Python' # Python에서는 대소문자를 구분한다! list(리스트) d= [1,2,3,4,5] #리스트 안에는 정수, 실수, 문자 모두 들어갈 수 있다. 여러개를 묶음으로 저장할때 사용! dict(..