일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- nlp
- 데이터분석
- 파이썬기초100제
- 한빛미디어
- 코드업100제
- attention
- gcp
- 블레이저
- 구글퀵랩
- Microsoft
- codeup
- 알고리즘
- GenerativeAI
- 코드업
- 파이썬
- 코드업파이썬
- DataScience
- 빅데이터
- 파이썬기초
- 생성형AI
- 데이터사이언스
- 머신러닝
- C#
- GenAI
- 자연어처리
- Azure
- Python
- Blazor
- 클라우드
- 파이썬알고리즘
Archives
- Today
- Total
Tech for good
[파이썬 정규표현식] re.sub() 본문
re.sub(pattern, repl, string, count, flags)
- re.sub -> '패턴에 일치되는 문자열은 대체 문자열로 바꿔준다.'
- pattern = 패턴
- repl = 대체될 문자열
- string = 문자열 데이터
- count = 최대 몇 개까지 치환할 것인가를 지정
- * (만약 일치되는 문자열이 3인데 count=2라고 지정되어 있으면 마지막 세 번째 문자열은 치환되지 않는다.)
- flags = (아래 블로그 포스팅 표 참조)
# re.sub() 예제
import re
text = """\
010-1234-5678 Kim
011-1234-5678 Lee
016-1234-5678 Han
"""
# flags=re.MULTILINE 지정
text_mod = re.sub('^[0-9]{3}-[0-9]{4}-[0-9]{4}',"***-****-****",text, flags=re.MULTILINE)
print (text_mod)
* 참고
https://docs.python.org/3/library/re.html
https://ponyozzang.tistory.com/335
'IT > Data Science' 카테고리의 다른 글
.iteritems() 함수 (0) | 2021.10.29 |
---|---|
[딥러닝을 이용한 자연어 처리 입문] 5. 벡터의 유사도(Vector Similarity) - 2. 여러가지 유사도 기법 (0) | 2021.10.20 |
[딥러닝을 이용한 자연어 처리 입문] 5. 벡터의 유사도(Vector Similarity) - 1. 코사인 유사도(Cosine Similarity) (0) | 2021.10.20 |
[Elasticsearch] Elastic Cloud에서 Nori Tokenizer 설치하기 (Extensions 활용) (0) | 2021.10.19 |
[딥러닝을 이용한 자연어 처리 입문] 6. 토픽 모델링(Topic Modeling)- 3) 잠재 디리클레 할당(LDA) 실습2 (2) | 2021.10.14 |