17일차에서 특정 문자열이 들어간 데이터만 뽑는 연습을 했는데 반대로 특정 문자열이 들어간 데이터만 제외하는 방법이 없을까 생각하면서 이것저것 시도해봤다.


방법은
          (특정문자열 지정) == False
이다.


참고로 특정 영어 문자열이 대소문자가 섞여 있을 때 하나로 통일시키는 방법은
          (df).(컬럼).str.upper()/lower().str.contains(찾고싶은 문자열)
이다.


아래는 17일자 데이터를 이용한 예시이다.



==================================== Python ====================================

import pandas as pd


data = pd.read_csv('convenient_store.csv')  # 데이터 가져오기

# 문자열에 CU가 들어간 것만 선택하고 and CUBE가 False인 것을 선택

# 여기서 data.company.str.upper().str.contains('CUBE')는

#    data.company의 데이터를 str.upper()로 다 대문자로 바꾼 후에 

#    str.contains('CUBE') CUBE가 들어간 문자열만 선택한다는 뜻.

cu = data[(data.company.str.contains('CU')) & data.company.str.upper().str.contains('CUBE') == False]

print(cu)

==================================== Python ====================================

+ Recent posts