일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- boostcourse
- 빅데이터분석기사 실기
- sql
- BNK저축은행
- 빅분기1유형
- 데이터리안
- 빅분기 실기
- 우금캐면접
- MySQL
- 데이터자격증
- 우금캐
- 정처기
- 투자도서
- 메타코드
- 우리금융캐피탈면접
- 빅데이터분석기사실기
- 데이터넥스트레벨챌린지
- 데이터분석전문가
- 데이터분석가
- 빅분기실기
- 데이터분석마인드셋
- 실기1유형
- 빅데이터분석기사
- 통계독학
- 투자마인드
- 데이터분석
- 메타코드m
- 컨버티드
- 빅분기
- 우리금융캐피탈
- Today
- Total
목록빅분기 실기 (5)
하파와 데이터

이제는 앞서 배웠던 것들을 실습해보자!! Q) iris데이터에서 sepal_width, petal_width를 삭제하시오import pandas as pddf = pd.read_csv('data/iris.csv')df1 = df.copy()df1.drop(['sepal_width', 'petal_length'], axis=1, inplace = True)print(df1)Q) iris 컬럼의 이름을 다음과 같이 변경하고 df_kor에 저장하시오df2 = df.copy()df_kor = df2.rename(columns = {'sepal_length':'꽃받침길이', 'sepal_width':'꽃받침너비', ..

데이터에서 가장 큰 골치거리가 결측지다. 하나만 비어있을때는 전체를 날리지도 못하고, 너무 무의미한 데이터가 많다면, 결측치가 많은 컬럼 자체를 날려야하는 경우도 있다. 즉, 우리의 필요에 따라서 우리는 결측된 데이터들을 제거하거나, 보완하는 방법을 알아야 한다. 우리는 그중에서 우선 간단한 방법인 평균으로 결측을 보완하는 방법과아예 결측치를 제거하는 방법에 대해서 알아본다. 나아가, 유니크한 값을 구하는 다른 방법인 중복값들을 제거하는 방법도 배워본다! 0. 전제우리만의 DataFrame을 만든다. import pandas as pdimport numpy as npdates = pd.date_range('20241129', periods= 6)df = pd.DataFrame(np.random.r..

인코딩은 대체로 str로 되어있는 데이터를 유의미하게 사용하기 위해서 전처리하는 방법중 하나이다. 예를들어, Setosa, Virginica 등이 문자로 있는 것은 의미가 없고, 이걸 이해하는 것도 어렵기때문에, 0,1,2 등의 숫자로 그 단어를 대체하는 것이다. 또는 10~19세를 0, 20~29를 1 등으로 변경하는 것도 동일한 방법이다. 사실 간단한 값들만 존재한다면, replace, map을 이용해서 내가 직접 인코딩과 같은 절차를 거칠 수도 있다. 하지만 그 값이 너무도 많다면?? 그럴때 사용하는 것이 인코딩 기술이다. 이러한 인코딩에 대해서 배워보자 0. 전제jupyter notebook 실행한 위치에 data라는 폴더가 있고, 그 안에 iris.csv가 존재한다. 1. Categoric..

데이터는 가지런할때, 예쁘다. 멀리서 보아도 그렇다. 우리는 데이터를 여러 측면에서 본다. 처음 주어진 그대로 살펴보기도 하지만, 그 데이터가 가진 방향성, 의미 등을 파악하기 위해서 정렬을 해보기도하고분포도를 보기도 하고 여러 방법을 택한다. 그중에 가장 쉽고 가볍게 해볼 수 있는 정렬을 해보자. 0. 전제(6,4) 임의의 난수를 가진 데이터프레임을 생성하여 활용함. import pandas as pdimport numpy as npdates = pd.date_range('20241129', periods=6)df = pd.DataFrame(np.random.randn(6,4), index = dates, columns = list('ABCD'))df1. 인덱스 정렬1.1. 행 인덱스 정렬예를들어..

이번주 토요일 오전 10시, 나는 빅데이터분석기사 실기를 보러간다. 우선 현재 상태는, 오랜만에 Jupyter notebook을 켰고, Pandas의 기본 문법을 사용한지도 오래되어서, 기본적인 메소드도 잊어버린게 많다. 그래서 유데미를 통해 빅분기 실기 강의를 들으면서,거기서 배운 내용을 간략하게 정리하고자 한다. 스스로에게는 복습을 하며 기억을 하는 것으로, 이 글을 보는 빅분기 실기 준비생에게는 어떤 것을 준비해야하는지 알아야 하는 글로 이해가 되면 좋겠다. 우선 내가 듣는 강의는 udemy에서 이래중 박사(Ph.D)님의 빅분기 강의다.https://www.udemy.com/course/rfjhluyv/ 나는 유데미 계정이 있어서, 들을 수 있는데, 현재 강의를 보면서 느끼는 것은 굳.......