하파와 데이터

[빅분기] 실기 1유형- 데이터 처리 실습해보기! 본문

자격증/DATA

[빅분기] 실기 1유형- 데이터 처리 실습해보기!

hhpp 2024. 11. 29. 23:47

이제는 앞서 배웠던 것들을 실습해보자!! 

 

Q) iris데이터에서 sepal_width, petal_width를 삭제하시오

import pandas as pd
df = pd.read_csv('data/iris.csv')

df1 = df.copy()

df1.drop(['sepal_width', 'petal_length'], axis=1, inplace = True)
print(df1)

Q) iris 컬럼의 이름을 다음과 같이 변경하고 df_kor에 저장하시오

df2 = df.copy()

df_kor = df2.rename(columns = {'sepal_length':'꽃받침길이', 
                               'sepal_width':'꽃받침너비', 
                               'petal_length':'꽃잎길이', 
                               'petal_width':'꽃잎너비',
                               'variety':'품종'})

print(df_kor)

Q) df_kor의 품종 컬럼을 one-hot Encoding으로 변경하시오

df2 = pd.get_dummies(df_kor, columns = ['품종'])

print(df2)

Q) df_kor 컬럼에서 '꽃받침길이'를 인덱스로 설정하시오

df_kor = df_kor.set_index('꽃받침길이')
df_kor

Q) df_kor의 컬럼 '꽃잎길이' 값을 10.0으로 설정하세요.

df_kor['꽃잎길이'] = 10.0
print(df_kor)

Q) df_kor의 컬럼 '꽃의길이'의 타입을 int64로 설정하세요. 

df_kor = df_kor.astype({'꽃잎길이':('int64')})
print(df_kor.info())

Q) df_kor의 컬럼 '꽃잎길이'와 '꽃잎너비'를 곱한값으로 새로운 컬럼인 '컬럼곱'을 추가하세요

df_kor['컬럼곱'] = df_kor['꽃잎길이'] * df_kor['꽃잎너비']

print(df_kor)

 

반응형