자유 정규표현식 관련 질문 올립니다
- Hahn
- 조회 수 333
- 2024.01.09. 14:58
머신러닝 책에서 자연어 처리 관련 챕터를 보고 있는데 정규표현식을 사용하는 코드가 있네요.
이게 뒤에도 계속 나오는건 아닌거 같고, 책에서도 '배우는데 시간이 많이 걸리고 이 책의 범위가 아니다'라고 써있습니다.
제 전공/업무분야를 감안하면 앞으로 자연어 처리 쪽으로 나갈 가능성은 높지 않아 보이긴 하는데, 그래도 익혀 두는게 좋을까요?
댓글
16
1등 불심
글쓴이
Hahn
불심 님께
불심
Hahn 님께
글쓴이
Hahn
불심 님께
2등 하루우라라
글쓴이
Hahn
하루우라라 님께
3등 섭힝
포인트봇
섭힝 님께
감이어디감
글쓴이
Hahn
감이어디감 님께
ONNURI
글쓴이
Hahn
ONNURI 님께
서리바람
글쓴이
Hahn
서리바람 님께
TODO
글쓴이
Hahn
TODO 님께
2024.01.09. 15:02
2024.01.09. 15:11
2024.01.09. 18:49
2024.01.11. 21:03
2024.01.09. 15:09
2024.01.09. 15:16
2024.01.09. 15:58
2024.01.09. 15:45
2024.01.09. 16:12
정규표현식이란게 원하는 규칙을 문법에 맞게 옮겨적는 거라 그때그때 찾아서 쓰면 되긴 해요. 요즘은 LLM에 물어보면 꽤 정확하게 알려줄 것 같구요.
SyntaxWarning 관련해서는 인코딩 때문에 발생하는 이슈인데
파이썬은 기본 문자열의 \를 무조건 escape로 인식하는데 \W나 \)는 파이썬 내장 확장열escape sequence이 아니라서 인식을 못해요
정규표현식만 있는 문자열이라면 앞에 r을 붙여서 raw string으로 적어주는게 바람직합니다
raw string 예시: r"(?::|;|=) ..."
Why does Python log a DeprecationWarning saying “invalid escape sequence”? - Adam Johnson
2024.01.09. 16:15
2024.01.09. 16:49
2024.01.11. 21:04
2024.01.09. 17:45
2024.01.11. 21:05
2024.01.09. 19:16
2024.01.11. 21:06
무슨 전공이나 업무를 하시는진 모르겠지만, 복잡한 스트링 패턴 처리시엔 정규식(regex)이 필수라서요.
뭐 예를들면 회원가입 받을때 비밀번호 패턴분석에도 쓸수있고, 활용처는 많습니다.