
[준비] dataframe 생성 import pandas as pd list_val = [ ['xab', 'yab1', 1, 2, 3], ['xab', 'yab2', 1, 5, 6], ['xcd', 'ycd1', 7, 8, 9], ['xcd', 'ycd2', 10, 11, 12], ['xef', 'yef1', 13, 14, 15] ] list_col = ['col1', 'col2', 'col3', 'col4', 'col5'] list_idx = ['a', 'b', 'c', 'd', 'e'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) df_a 1개 column 기준으로 grouping하여 모든 data를 조회한다. df_a.groupb..

[준비] dataframe 생성 import pandas as pd list_val = [ ['xab1', 'yab1', 1, 2, 3], ['xab2', 'yab2', 1, 5, 6], ['xcd3', 'ycd3', 7, 8, 9], ['xcd4', 'ycd4', 10, 11, 12], ['xef5', 'yef5', 13, 14, 15] ] list_col = ['col1', 'col2', 'col3', 'col4', 'col5'] list_idx = ['a', 'b', 'c', 'd', 'e'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) df_a 1개 숫자 column을 비교하여 조회한다. df_a.loc[df_a['col3'] ..

[준비] dataframe 생성 import pandas as pd list_val = [ [1, 2, 3], [1, 5, 6], [7, 8, 9], [10, 11, 12], [13, 14, 15] ] list_col = ['col1', 'col2', 'col3'] list_idx = ['a', 'b', 'c', 'd', 'e'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) df_a ※ integer location은 조회한 dataframe에서 보이지 않는다. [방법1] row integer loaction 기준으로 dataframe 1개 조회 df_a.iloc[[0]] ※ [0] 대신 0을 입력하면 dataframe이 아니라 ser..

[준비] dataframe 생성 import pandas as pd list_val = [ ['x1', 'y1', 1, 2, 3], ['x2', 'y2', 1, 5, 6], ['x3', 'y3', 7, 8, 9] ] list_col = ['col1', 'col2', 'col3', 'col4', 'col5'] list_idx = ['a', 'b', 'c'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) df_a 1개의 column의 구성된 dataframe을 조회한다. loc를 사용하는 대신 대괄호 2개를 사용한다. df_a[['col1']] ※ df_a.loc[:, ['col1']] 표현으로도 동일한 결과를 조회할 수 있다. (row 생..

[준비] dataframe 생성 import pandas as pd list_val = [ [1, 2, 3], [1, 5, 6], [7, 8, 9], [10, 11, 12], [13, 14, 15] ] list_col = ['col1', 'col2', 'col3'] list_idx = ['a', 'b', 'c', 'd', 'e'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) [방법1] data 1개 조회 df_a.loc[['a']] ※ index를 ['a']가 아니라 'a'로 지정하면 dataframe이 아닌 series로 조회된다. ※ loc에는 index와 value를 함께 지정할 수 있다. value 생략의 명시적 표현은 아래와 ..

[준비] dataframe 생성 import pandas as pd from math import nan list_val = [ ['x1', 'x2', 3], ['y4', 'y5', 6], ['z7', 'z8', 9], ['x1', 'x2', 3], ['y4', 'y5', 6], ['z7', 'z8', 9], [nan, 'x2', 3] ] list_col = ['col1', 'col2', 'col3'] list_idx = ['a', 'b', 'c', 'd', 'e', 'f', 'g'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) unique 함수를 사용해 특정 column의 unique value를 확인한다. df_a['col1'].u..

[준비] dataframe 생성 import pandas as pd list_val = [ [1, 2, 3], [1, 5, 6], [7, 8, 9] ] list_col = ['col1', 'col2', 'col3'] list_idx = ['a', 'b', 'c'] df_a = pd.DataFrame(list_val, columns=list_col, index=list_idx) sort_index 함수를 사용해 index를 기준으로 정렬한다. df_a.sort_index(ascending=False) df_a sort_values 함수를 사용해 value를 기준으로 정렬한다. df_a.sort_values(by='col1', ascending=False) sort_values 함수의 매개변수에 list를 ..

[준비] index가 없는 dataframe 생성 import pandas as pd list_val = [ ['a', 1, 2, 3], ['b', 4, 5, 6], ['c', 7, 8, 9] ] list_col = ['col1', 'col2', 'col3', 'col4'] df_a = pd.DataFrame(list_val, columns=list_col) df_a set_index 함수를 사용해 특정 column을 index로 변경한다. df_a.set_index('col1', inplace=True) df_a index name을 삭제한다. df_a.index.name = None df_a reset_index 함수를 사용해 index를 다시 column으로 변경한다. df_a.reset_index..
- Total
- Today
- Yesterday