
[준비] index가 없는 dataframe 생성 import pandas as pd list_val = [ ['a', 1, 2, 3], ['b', 4, 5, 6], ['c', 7, 8, 9] ] list_col = ['col1', 'col2', 'col3', 'col4'] df_a = pd.DataFrame(list_val, columns=list_col) df_a set_index 함수를 사용해 특정 column을 index로 변경한다. df_a.set_index('col1', inplace=True) df_a index name을 삭제한다. df_a.index.name = None df_a reset_index 함수를 사용해 index를 다시 column으로 변경한다. df_a.reset_index..

[준비] import import pandas as pd import numpy as np import matplotlib.pyplot as plt rand 함수를 사용해 0부터 1사이의 균일 분포 임의 실수를 구할 수 있다. pd.DataFrame(np.random.rand(1000)).plot(kind='hist') plt.show() randn 함수를 사용해 가우시안 표준 정규 분포 임의 실수를 구할 수 있다. pd.DataFrame(np.random.randn(1000)).plot(kind='hist') plt.show() randint 함수를 사용해 균일 분포 임의 정수를 구할 수 있다. np.random.randint(1, 100, size=10) array([98, 52, 63, 63, 23..
[준비] import import pandas as pd comma로 잘 구분되어 있고 column name도 있다면 filepath만 설정해도 된다. filepath = 'test.csv' df_a = pd.read_csv( filepath, sep=',', header=0 ) ※ sep : default ',' ※ header : default 0 만약 column name이 없다면 names 옵션을 사용한다. filepath = 'test.csv' df_a = pd.read_csv( filepath, sep=',', header=None, names=['col1', 'col2', 'col3'] ) 특정 column을 index로 생성하기 위해 index_col 옵션을 사용한다. filepath = ..

dictionary로 dataframe을 생성하면 dictionary의 key가 dataframe의 column이 된다. dataframe의 index는 list로 설정해 주어야 한다. import pandas as pd dict_val = { 'key1': ['a', 'b', 'c'], 'key2': [1, 2, 3], 'key3': [4, 5, 6], 'key4': [7, 8, 9] } list_idx = ['idx1', 'idx2', 'idx3'] df_a = pd.DataFrame(dict_val, index=list_idx) df_a

[방법1] value, column으로 dataframe 생성 import pandas as pd list_val = [ ['a', 1, 2, 3], ['b', 4, 5, 6], ['c', 7, 8, 9] ] list_col = ['col1', 'col2', 'col3', 'col4'] df_a = pd.DataFrame(list_val, columns=list_col) df_a [방법2] value, column, index로 dataframe 생성 import pandas as pd list_val = [ ['a', 1, 2, 3], ['b', 4, 5, 6], ['c', 7, 8, 9] ] list_col = ['col1', 'col2', 'col3', 'col4'] list_idx = ['idx1..
index를 사용해 value 를 조회하기 위해 loc를 사용한다. import pandas as pd dict_a = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5} srs_a = pd.Series(dict_a) print('# value 1개 조회') var_a = srs_a.loc['a'] print(type(var_a)) print(var_a) print() print('# value 여러개 조회 - slicing 사용') var_a = srs_a.loc['a':'c'] print(type(var_a)) print(var_a) print() print('# value 여러개 조회 - list 사용') var_a = srs_a.loc[['a', 'c']] print(type..
- Total
- Today
- Yesterday