Tech for good

[파이썬 정규표현식] re.sub() 본문

IT/Data Science

[파이썬 정규표현식] re.sub()

Diana Kang 2021. 10. 29. 12:21

 

re.sub(pattern, repl, string, count, flags)

 

  • re.sub -> '패턴에 일치되는 문자열은 대체 문자열로 바꿔준다.' 
    • pattern = 패턴
    • repl = 대체될 문자열
    • string = 문자열 데이터
    • count = 최대 몇 개까지 치환할 것인가를 지정
  • * (만약 일치되는 문자열이 3인데 count=2라고 지정되어 있으면 마지막 세 번째 문자열은 치환되지 않는다.)
    • flags = (아래 블로그 포스팅 표 참조)

https://greeksharifa.github.io/%EC%A0%95%EA%B7%9C%ED%91%9C%ED%98%84%EC%8B%9D(re)/2018/07/21/regex-usage-02-basic/ 

 

Python, Machine & Deep Learning

Python, Machine Learning & Deep Learning

greeksharifa.github.io

 

 

# re.sub() 예제

import re

text = """\
010-1234-5678 Kim
011-1234-5678 Lee
016-1234-5678 Han
"""
# flags=re.MULTILINE 지정
text_mod = re.sub('^[0-9]{3}-[0-9]{4}-[0-9]{4}',"***-****-****",text, flags=re.MULTILINE) 
print (text_mod)

 

 

 


* 참고

https://docs.python.org/3/library/re.html

 

re — Regular expression operations — Python 3.10.0 documentation

This module provides regular expression matching operations similar to those found in Perl. Both patterns and strings to be searched can be Unicode strings (str) as well as 8-bit strings (bytes). However, Unicode strings and 8-bit strings cannot be mixed:

docs.python.org

https://ponyozzang.tistory.com/335

 

Python 정규 표현식(re.sub)을 이용한 문자열 치환 방법 및 예제

파이썬에서 문자열을 치환해주는 메서드로 replace가 있습니다. 이번에는 replace 메서드로 문자열을 치환하는 방법이 아닌 정규 표현식을 이용하여 문자열을 치환해보도록 하겠습니다. 정규 표현

ponyozzang.tistory.com

https://greeksharifa.github.io/%EC%A0%95%EA%B7%9C%ED%91%9C%ED%98%84%EC%8B%9D(re)/2018/08/04/regex-usage-05-intermediate/ 

 

Python, Machine & Deep Learning

Python, Machine Learning & Deep Learning

greeksharifa.github.io