하파와 데이터

Python 자료형 - 자료형과 자료형 확인하는 법 본문

Development/Python

Python 자료형 - 자료형과 자료형 확인하는 법

hhpp 2023. 7. 20. 15:04

Python에는 여러가지 형태들이 존재한다. 

형태에 따라서 적용되는 함수가 있고, 적용이 불가능한 함수들이 있다. 

 

이에 데이터 분석을 위해선 자료가 어떤 형태를 가지고 있는지 파악하고,

내가 필요한 형태로 변경하는 처리작업이 필요하다. 

 

숫자형을 문자형으로, 문자형을 날짜형으로 바꾸는등 데이터 분석에 적합하게 변경하는 전처리 작업을 해야

내가 원하는 작업들을 수월하게 할 수 있다. 

다양한 형태 중 가장 기본인 자료형부터!

 

 

자료형

int(정수)

  • a= 3

float(실수)

  • b=3.14

str(문자열)

  • c= 'Python' 
    # Python에서는 대소문자를 구분한다!

list(리스트)

  • d= [1,2,3,4,5] 
    #리스트 안에는 정수, 실수, 문자 모두 들어갈 수 있다. 여러개를 묶음으로 저장할때 사용!

dict(딕셔너리)

  • e={"강아지" :"Dog", "고양이": "Cat", "원숭이": "Monkey"} 
    # 딕셔너리는 순서가 중요하지 않고 "키": "밸류"가 매칭되어서 들어간다! 

bool(부울/논리형자료)

  •  f=True / False
    # boolean의 참과 거짓의 첫글자는 항상 대문자로 작성해야한다!

 

변수의 자료형을 확인하는법!

a=6
type(a)
int

만일 a 변수의 자료형이 궁금하다면, 'type(변수명)'을 입력하면 확인할 수 있다!

 

또는 데이터프레임에서 각 속성들의 자료형을 확인하는 방법은 아래와 같다.

df.info() # 각 컬럼별 데이터의 숫자와 함께 자료형을 출력
df.dtypes #각 컬럼의 자료형만을 출력

두가지 방법이 있는데, info()를 활용하는 방법과 dtypes를 이용하는 방법이다.

df.info()의 경우, 컬럼별 자료형 뿐 아니라 컬럼별 데이터가 몇개가 있는지 바로 확인이 가능하다

df.dtypes의 경우, 각 컬럼별 자료형을 바로 확인할 수 있다. #dtypes는 뒤에 "()"가 붙지 않는다!