17일차에서 특정 문자열이 들어간 데이터만 뽑는 연습을 했는데 반대로 특정 문자열이 들어간 데이터만 제외하는 방법이 없을까 생각하면서 이것저것 시도해봤다.
방법은
(특정문자열 지정) == False
이다.
참고로 특정 영어 문자열이 대소문자가 섞여 있을 때 하나로 통일시키는 방법은
(df).(컬럼).str.upper()/lower().str.contains(찾고싶은 문자열)
이다.
아래는 17일자 데이터를 이용한 예시이다.
==================================== Python ====================================
import pandas as pd
data = pd.read_csv('convenient_store.csv') # 데이터 가져오기
# 문자열에 CU가 들어간 것만 선택하고 and CUBE가 False인 것을 선택
# 여기서 data.company.str.upper().str.contains('CUBE')는
# data.company의 데이터를 str.upper()로 다 대문자로 바꾼 후에
# str.contains('CUBE') CUBE가 들어간 문자열만 선택한다는 뜻.
cu = data[(data.company.str.contains('CU')) & data.company.str.upper().str.contains('CUBE') == False]
print(cu)
==================================== Python ====================================
'프로그래밍 > Python, R 프로그래밍' 카테고리의 다른 글
[Python] Python 18일차 (0) | 2018.06.14 |
---|---|
[Python DataStreamOut] csv, json, xlsx로 데이터 내보내기 (0) | 2018.06.13 |
[Python] Python 17일차 (0) | 2018.06.12 |
[Python] Python 16일차(예제로 배우는 파이썬 데이터 시각화) (0) | 2018.06.11 |
[Python] dialect 란? (0) | 2018.06.11 |