일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 데이터분석전문가
- 빅분기
- 정처기
- 데이터넥스트레벨챌린지
- 우리금융캐피탈
- 메타코드
- MySQL
- BNK저축은행
- 우리금융캐피탈면접
- 메타코드m
- 우금캐면접
- 투자마인드
- 통계독학
- 빅데이터분석기사
- 빅분기1유형
- 빅데이터분석기사 실기
- 데이터분석마인드셋
- 데이터자격증
- 데이터분석가
- sql
- 빅분기실기
- 우금캐
- 투자도서
- boostcourse
- 빅분기 실기
- 데이터분석
- 컨버티드
- 빅데이터분석기사실기
- 데이터리안
- 실기1유형
- Today
- Total
목록Development (15)
하파와 데이터

면접 종료 후, 여행과 게으름으로 멈추었던 SQL을 다시 시작해본다. 3주차 강의의 내용은 JOIN 과 JOIN된 파일을 활용한 결과치를 추출하는 내용이다. 1. LEFT, RIGHT, INNER, OUTER JOIN 조인은 두개의 테이블을 합쳐주는 역할을 수행한다. 예를들어 USERS 테이블과 ORDERS 테이블을 합친다고 가정을 하면, 우선 두개의 테이블을 SELECT 문으로 확인한 뒤, 공동된 컬럼을 찾는다. 그 후 JOIN 문을 활용하여 공통된 컬럼으로 연결을 한다. 연결 한 뒤에는 하나의 테이블인 것처럼, 테이블을 활용하면 된다. 예를들어 아래와 같이 courses 테이블과 enrolleds 테이블이 있다고 해보자. 우선 SELECT * FROM 테이블명으로 두 테이블을 확인 한 뒤..

오늘은 SQL 복습 2일차. 시간으로는 새벽이 넘었지만, 어쨌뜬 잠을 자지 않았으니 2일차의 연속이라고나 할까... 쨋든 오늘도 스파르타코딩의 강의를 참고해서 복습을 시행했다. 오늘은 SQL의 가장 기본인 ORDER BY, GROUP BY를 배웠다. 1. ORDER BY + 컬럼명ORDER BY는 뒤에 컬럼명과 함께 사용해서, 해당 컬럼명을 기준으로 정렬을 해주는 기능을 갖고 있다. 일반적으로는 COUNT 등 숫자 컬럼을 기준으로 정렬을 하여 보기 좋게 데이터를 정리한다. 하지만 ORDER BY는 숫자 컬럼 뿐 아니라, 문자(영어/한글), 일자(시간)도 모두 정렬시킬 수 있다! 그리고 내림차순과 오름차순 역시 지정할 수 있는데, ORDER BY 컬럼명 으로 작성하면 기본 디폴트가 오름차순이고 ..

내가 연습으로 다시 시작한 강의는스파르타코딩의 '엑셀보다 쉬운 sql'이라는 강의이다. 스파르타 코딩의 대표가 직접 강의를 해주고(대표님의 강의력이 나는 참 좋은 것 같다!!)쉽고 간단하게 배울 수 있어서, 기초를 다시 상기하기에 좋다. 오늘 배운 것은 where절에 대한 기본기이다. where 기본 조건문 between in구문 like 구문 사실 크게 어렵지 않기 때문에, 하나의 예시로 배운 것을 정리해보고자 한다. SELECT *FROM users uWHERE course_title = '웹개발 종합반' -- 웹개발 종합반을 듣는 사람 검색 AND name like '김%' -- 김으로 시작하는 모든 사람 검색 AND created_at between '2024-12-01' and ..

SQL을 배운지 언 1년이 넘어간다. 근데, 배울때만 배우고, 현업에 있지 않으니 사용하지 않는다. 그냥, 가끔 공모전 할때?사실 공모전 할때도 SQL을 쓰기보다 PYTHON, PANDAS 등을 사용하지 SQL은 사용하지 않는다. 근데, 채용 공고에서는 SQL로 시험을 본다. 매번 볼때마다 벼락치기 했는데, 뭔가 잉여로운 것 같아서 오늘부터 다시금 복습을 하고자 한다. 내가 할 복습은스파르타코딩을 통한 기초 데이터리안을 통한 중급그리고는 여러 코딩테스트 사이트를 통한 시험을 계속 볼거다뭐 리트코드 등등을 통해서 말이다. 오늘은 첫날로 스파르타 코딩을 했다. 이건, 그냥 하기보다 뭐라도 기록을 남기는게 좋을 것 같아서 남긴다!
SQL 코테를 앞두고 오랜만에 SQL을 켰다. 문제를 풀려고 SELECT * FORM DB를 적었더니 데이터가 너무 많아서 못불러온다는거다. 그래서 자신있게, HEAD를 찍으려는데 ... 음 어떻게 하는거더라??? 우선 SELECT HEAD(*) FROM DB 이렇게 적으려는데 너무너무 이상하다. 숫자를 넣는 것도 없고, 뭔가 이상하다. 역시나 실행시키니 SYNTAX오류. 뭐지뭐지 하다가 구글링아.. SQL은 HEAD가 아니라 LIMIT이지... 전체 데이터 중 정해진 숫자만큼 데이터를 보고싶은 때는 아래처럼 해야한다. SELECT *FROM DBLIMIT 10(또는 임의의 숫자)

일반적으로 데이터분석을 하거나, ML 등의 데이터를 기반으로 무언가를 작업할 때 데이터를 불러온 뒤 가장 처음하는 것이 데이터가 어떤 구조로 되어있는지? 살펴보는 것이다. 어려운 말로 하면 EDA (Exploratory Data Analysis, 탐색적 데이터 분석)라고 할 수 있다. 간단한 앞서 '의사결정나무(DecisionTree)'를 해본 실습에서 사용했던 Diabates 데이터를 기반으로 이를 간단히 해보겠다. 쉽게 해보는 실습은 아래 링크를 참조!(데이터파일도 아래 링크를 통해 kaggle에서 다운받을 수 있다. 2024.01.13 - [Development/Python] - 의사결정나무 쉽게 따라해보기!(plot_tree그리기, 중요 feature 파악하기) 의사결정나무 쉽게 따라해보기!(pl..

머신러닝에서 많이 사용되는 방법 중 '의사결정나무'가 있다. 의사결정 나무의 장점으로는 어떤 기준으로 분류를 하는지 명확하게 확인할 수 있다는 것이다. 이에 의사결정나무(DecisionTree)를 그려보는 것을 간단히 해보고자 한다. 본 연습은 naver connect재단에서 운영하는 boostcourse 강의 중 오늘 코딩 '박조은'님의 '프로젝트로 배우는 데이터사이언스'에서 학습한 내용을 토대로 한다. 아래의 실습을 따라하면, 간단하게 머신러닝을 실습해볼 수 있다. 활용데이터: Pima Indians Diabetes (출처: https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database) 환경: jupyter notebook 1. 데이터 구..

DF에서 많은 예시로 사용하는 df 가운데 iris(붓꽃)데이터가 있다. iris 데이터는 sklearn에서 제공하는 데이터셋으로 머신러닝 초반부터 많은 예시로 활용되고 있다. 우선 iris 데이터를 불러오고 어떤 형태로 되어있는지 보자 from sklearn.datasets import load_iris iris = load_iris() iris iris 데이터를 출력하면, 아래와 같이 행렬의 구조인 data와 벡터형태인 target 2가지로 구성되어있는 것을 확인할 수 있다. 이에 보통 iris데이터를 위와같이 로드를 한 뒤, data와 target으로 각기 나눠서 저장한다. iris_data = iris['data'] iris_target = iris['target'] 헌데, 이를 처음부터 나눠서 ..

DATE 형태 변형 MY SQL에서 자주보는 날짜 형식인 DATETIME타입은 YYYY-MM-DD hh:mm:ss 형식으로 나타난다. 초단위까지 있는 날짜를 BETWEEN 등으로 구간으로 설정한다면 DATETIME 그대로 사용하는데 큰 문제가 없는 경우도 있으나, 문제에서 연/월/일 까지만 출력하라고 요청할 때가 있다. 이럴때, DATE 또는 DATE_FORMAT('날짜컬럼','형식)을 입력해서 이를 수정할 수 있다. DATE 타입은 YYYY-MM-DD의 형식을 가진다. 만일 DAY라는 컬럼의 값이 '2023-08-08 01:48:10'라고 가정할때, DATE(DAY) 는 '2023-08-08'이 된다. 만일, 08-AUG-23으로 표현하거나, 다른 형식의 모양으로 연월일을 표시하고 싶다면 DATE_FO..

SQL에서 마주할 수 있는 다양한 숫자들과 문자형들이 있다. 데이터를 그대로 사용하기 보다, 내가 그 안에서 추출하고 싶은 값들이 있을때, 우리는 기본함수들을 이용해서 원하는 값을 찾아낼 수 있다. MYSQL의 함수는 아래 사이트를 통해 더 많이, 정확히 알아볼 수 있다. https://dev.mysql.com/doc/refman/8.0/en/numeric-functions.html SQL에도 여러가지 함수가 있다. 전부를 나열할 수 없기 때문에, 필요한 함수들을 몇가지 적어본다 . 숫자형 COUNT(*) -- NULL을 포함하여, 열의 총 갯수를 반환 -- count의 경우, 숫자 밸류가 아니더라도 그 값들을 셀 수 있다는게 특징이다. SUM('열이름') - 열에 있는 값들의 합계를 출력 AVG('열이..