0. 들어가며
1. 정규표현식이란?
2. 정규표현식을 배우는 이유
3. 어떻게 공부할 것인가?
0. 들어가며
다음과 같은 상황을 생각해봅시다. 1이9것9은2훼.이0크9닷.훼1이4크 누가 장난을 쳐서 제 생일에다가 이런 글자를 적어놨다고 생각해봅시다. 이럴 때 제 생일만 찾으려면 어떻게 해야할까요?
네. 이럴 때 필요한 것이 정규표현식 입니다.
위 사이트에서 정규표현식 테스트를 할 수 있습니다.
하지만, 정규표현식은 아주 어렵고 저도 잘 모르겠습니다. 메이즈러너의 미로가 생각나네요. 그렇다고 평생 모르고 살 수는 없으니 저도 공부할겸 내용을 정리해보려고 합니다.
1. 정규표현식이란?
한자로 "정규"의 규자는 "규칙"의 규자와 동일합니다.
規
법 규
욕 아닙니다(오해 마시길).... 따라서, 정규표현식은 어떤 규칙을 표현하는 하나의 문법이라고 생각할 수 있습니다. 그렇다면 어떤 규칙이 있을까요?
주민번호에도 규칙이 있습니다. 예를 들어, 뒷자리 7개의 숫자 중 첫 숫자가 5~8 사이면 외국인의 주민등록번호입니다. 외국인의 주민등록번호를 찾아보려면 뒷자리 7자리 중 첫 숫자가 5~8 사이인지 체크해보면 되겠죠.
2. 왜 정규표현식을 배우는가?
이외에도 우편번호, 파일 형식 등 다양한 규칙이 있을 수 있습니다. 정규표현식을 이용하면 다양한 규칙들을 표준화된 방식으로 인코딩 할 수 있습니다. 여기서, 표준이라는 단어가 중요합니다. "표준"은 통일된 규격을 얘기하는데요. 마찬가지로 정규표현식도 통일된 규격을 의미하며, 정규표현식만 잘 정의한다면 어떤 문자열이든 정의된 정규표현식에 속하는지 판단해볼 수 있습니다.
결론적으로 정규표현식을 통해 두 가지 작업을 할 수 있습니다.
1. 규칙에 맞는 문자열을 찾는다. (match)
2. 규칙에 맞는 문자열을 찾아 변환한다. (replace)
3. 어떻게 공부할 것인가?
정규표현식도 하나의 언어라고 할 수 있습니다. 한국말도 잘 못하는 제가 감히 언어 공부 방법론에 대해서 논의하려는건 아니구요. 영어를 배울 때, 문법을 배우듯이 정규표현식도 사용 전 기본적인 규칙을 알고 있어야 합니다.
적게 일하고 돈 많이 벌고 싶어요를 번역하니 오른쪽과 같이 되는데요. 예를 들어, money want to i work less and a lot of make 이렇게 말하는 사람은 없을 겁니다.
4. 어떤 규칙이 있는가?
부터는 다음글에서 다뤄볼 수 있도록 하겠습니다.
'딥상어동의 딥한 데이터 처리 > 전처리' 카테고리의 다른 글
정규표현식 뽀개기 (3) - 반복 하기 (0) | 2021.10.24 |
---|---|
정규표현식 뽀개기 (2) - 메타 문자 이해하기 (0) | 2021.10.24 |
[Pandas] str.contains를 사용하는 이유 - 정규표현식 (0) | 2021.09.26 |
[Pandas] 이것만은 알고가자 - 2.Basic Function (0) | 2021.06.07 |
[Pandas] 이것만은 알고가자 - 1.Indexing(iloc, loc) (0) | 2021.06.05 |
제 블로그에 와주셔서 감사합니다! 다들 오늘 하루도 좋은 일 있으시길~~
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!