
[준비] dataframe 생성 import pandas as pd list_val = [ ['xab', 'yab1', 1, 2, 3], ['xab', 'yab2', 1, 5, 6], ['xcd', 'ycd1', 7, 8, 9], ['xcd', 'ycd2', 10, 11, 12], ['xef', 'yef1', 13, 14, 15] ] list_col = ['col1', 'col2', 'col3', 'col4', 'col5'] list_idx = ['a', 'b', 'c', 'd', 'e'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) df_a 1개 column 기준으로 grouping하여 모든 data를 조회한다. df_a.groupb..

ones, zeros, full, arange, random.randint 함수를 사용할 수 있다. [준비] import import numpy as np ones 함수를 사용해 1을 입력한다. narr_a = np.ones((2, 5)) narr_a zeros 함수를 사용해 0을 입력한다. narr_b = np.zeros((2, 5)) narr_b full 함수를 사용해 특정 숫자를 입력한다. narr_c = np.full((2, 5), 7) narr_c arange 함수를 사용해 범위 내 순서가 있는 숫자를 입력한다. narr_d = np.arange(1, 11, 1).reshape(2, 5) narr_d random.randint 함수를 사용해 범위 내 순서가 없는 숫자를 입력한다. narr_e =..

[준비] dataframe 생성 import pandas as pd list_val = [ ['xab1', 'yab1', 1, 2, 3], ['xab2', 'yab2', 1, 5, 6], ['xcd3', 'ycd3', 7, 8, 9], ['xcd4', 'ycd4', 10, 11, 12], ['xef5', 'yef5', 13, 14, 15] ] list_col = ['col1', 'col2', 'col3', 'col4', 'col5'] list_idx = ['a', 'b', 'c', 'd', 'e'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) df_a 1개 숫자 column을 비교하여 조회한다. df_a.loc[df_a['col3'] ..

[준비] dataframe 생성 import pandas as pd list_val = [ [1, 2, 3], [1, 5, 6], [7, 8, 9], [10, 11, 12], [13, 14, 15] ] list_col = ['col1', 'col2', 'col3'] list_idx = ['a', 'b', 'c', 'd', 'e'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) df_a ※ integer location은 조회한 dataframe에서 보이지 않는다. [방법1] row integer loaction 기준으로 dataframe 1개 조회 df_a.iloc[[0]] ※ [0] 대신 0을 입력하면 dataframe이 아니라 ser..

[준비] dataframe 생성 import pandas as pd list_val = [ ['x1', 'y1', 1, 2, 3], ['x2', 'y2', 1, 5, 6], ['x3', 'y3', 7, 8, 9] ] list_col = ['col1', 'col2', 'col3', 'col4', 'col5'] list_idx = ['a', 'b', 'c'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) df_a 1개의 column의 구성된 dataframe을 조회한다. loc를 사용하는 대신 대괄호 2개를 사용한다. df_a[['col1']] ※ df_a.loc[:, ['col1']] 표현으로도 동일한 결과를 조회할 수 있다. (row 생..

[준비] dataframe 생성 import pandas as pd list_val = [ [1, 2, 3], [1, 5, 6], [7, 8, 9], [10, 11, 12], [13, 14, 15] ] list_col = ['col1', 'col2', 'col3'] list_idx = ['a', 'b', 'c', 'd', 'e'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) [방법1] data 1개 조회 df_a.loc[['a']] ※ index를 ['a']가 아니라 'a'로 지정하면 dataframe이 아닌 series로 조회된다. ※ loc에는 index와 value를 함께 지정할 수 있다. value 생략의 명시적 표현은 아래와 ..

[준비] dataframe 생성 import pandas as pd from math import nan list_val = [ ['x1', 'x2', 3], ['y4', 'y5', 6], ['z7', 'z8', 9], ['x1', 'x2', 3], ['y4', 'y5', 6], ['z7', 'z8', 9], [nan, 'x2', 3] ] list_col = ['col1', 'col2', 'col3'] list_idx = ['a', 'b', 'c', 'd', 'e', 'f', 'g'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) unique 함수를 사용해 특정 column의 unique value를 확인한다. df_a['col1'].u..

[준비] dataframe 생성 import pandas as pd list_val = [ [1, 2, 3], [1, 5, 6], [7, 8, 9] ] list_col = ['col1', 'col2', 'col3'] list_idx = ['a', 'b', 'c'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) sort_index 함수를 사용해 index를 기준으로 정렬한다. df_a.sort_index(ascending=False) df_a sort_values 함수를 사용해 value를 기준으로 정렬한다. df_a.sort_values(by='col1', ascending=False) sort_values 함수의 매개변수에 list를 ..
- Total
- Today
- Yesterday