로그인 해주세요.

자유 게시판 *자유로운 대화공간입니다. 회원간 예의를 지켜주세요. #정치글 #친목 금지

Hahn

자유 정규표현식 관련 질문 올립니다

  • Hahn
  • 조회 수 331
  • 2024.01.09. 14:58

머신러닝 책에서 자연어 처리 관련 챕터를 보고 있는데 정규표현식을 사용하는 코드가 있네요.

이게 뒤에도 계속 나오는건 아닌거 같고, 책에서도 '배우는데 시간이 많이 걸리고 이 책의 범위가 아니다'라고 써있습니다.

제 전공/업무분야를 감안하면 앞으로 자연어 처리 쪽으로 나갈 가능성은 높지 않아 보이긴 하는데, 그래도 익혀 두는게 좋을까요?

Hahn
#Mobile
Galaxy S21 Ultra
Galaxy Watch Active 2
Galaxy Buds Pro

#At home
Macbook Air (2022, M2, 16GB, 256GB)
Epson Perfection V39
Wacom Intuos Pro M (PTH-660)

#For Machine Learning study
i7 9700 / 16GB / Quadro P400
Ubuntu 22.04.2 LTS

#For Electromagnetic Simulation
i7 9700 / 16GB / Quadro P400
Windows 8.1
댓글
16
불심
1등 불심
2024.01.09. 15:02

무슨 전공이나 업무를 하시는진 모르겠지만, 복잡한 스트링 패턴 처리시엔 정규식(regex)이 필수라서요.

 

뭐 예를들면 회원가입 받을때 비밀번호 패턴분석에도 쓸수있고, 활용처는 많습니다.

[불심]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn 불심 님께
2024.01.09. 15:11

저는 화학 계열 엔지니어고, 실험데이터 처리에 ML을 적용하고자 하는게 목적이었기 때문에 주로 숫자를 다룹니다. (물론 요즘 평생직업이란게 있을수 없다보니 고민이 많긴 합니다ㅎㅎ)

뜬구름잡는 얘기일수 있지만 다량의 논문을 전부 읽지 않고 뭔가 정보를 뽑아낸다거나 하는 쪽으로도 응용이 가능하긴 하겠네요. 시간날때 한번 들여다봐야겠습니다. 감사합니다!

[Hahn]님의 댓글을 신고합니다. 취소 신고
불심
불심 Hahn 님께
2024.01.09. 18:49

요즘은 굳이 정규식 패턴을 외울필욘 없고 chatgpt나 검색을 통해 원하는 패턴은 쉽게 얻으실수 있으니 기본적인 사항만 보셔도 됩니다.

 

그런데 복잡한 스트링 패턴엔 적합하지만 어디까지나 적당한 길이에서나 유효하므로 큰 데이터에서 원하시는 정보를 뽑으실거면 검색 시스템을 구축하시는게 더 낫지 않나 싶네요.

[불심]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn 불심 님께
2024.01.11. 21:03

배울게 참 많군요. 감사합니다:)

[Hahn]님의 댓글을 신고합니다. 취소 신고
하루우라라
2등 하루우라라
2024.01.09. 15:09

왜 배우는데 시간이 많이 걸린다는지는 모르겠지만.. 그냥 어떻게 쓰는지 정도만 알고 넘어가시면 될거 같습니다. 어떤걸 책에 적어뒀길래 배우는데 오래 걸린다는지는 몰라도 보통 말하는 정규표현식이면 그렇게 오래걸리는건 아닐텐데.. 그냥 어떻게 쓰는 어떤건지만 알고 넘어가세요. 식 자체는 외우기도 힘들고 걍 필요할 때 찾아 쓰면 됩니다.

[하루우라라]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn 하루우라라 님께
2024.01.09. 15:16

스크린샷 2024-01-09 15-13-05.png

저기 이모티콘 검색하는 부분에 길게 써있는 부분을 이해하기가 조금 힘들어서요^^; 그리고 함수 자체는 책에서 제시한대로 잘 동작하지만 syntax warninig이 나타나는 이유를 파악할 수가 없어서 답답한 마음에 질문 드려 봤습니다. 조언 감사합니다!

[Hahn]님의 댓글을 신고합니다. 취소 신고
포인트봇
포인트봇 섭힝 님께
2024.01.09. 15:45
회원님 2포인트 채굴 성공!
[포인트봇]님의 댓글을 신고합니다. 취소 신고
감이어디감
감이어디감
2024.01.09. 16:12

정규표현식이란게 원하는 규칙을 문법에 맞게 옮겨적는 거라 그때그때 찾아서 쓰면 되긴 해요. 요즘은 LLM에 물어보면 꽤 정확하게 알려줄 것 같구요.

 

SyntaxWarning 관련해서는 인코딩 때문에 발생하는 이슈인데

파이썬은 기본 문자열의 \를 무조건 escape로 인식하는데 \W나 \)는 파이썬 내장 확장열escape sequence이 아니라서 인식을 못해요

정규표현식만 있는 문자열이라면 앞에 r을 붙여서 raw string으로 적어주는게 바람직합니다

raw string 예시: r"(?::|;|=) ..."

Why does Python log a DeprecationWarning saying “invalid escape sequence”? - Adam Johnson

[감이어디감]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn 감이어디감 님께
2024.01.09. 16:15

와웅 말씀하신대로 문자열 앞에 r을 붙이니까 에러가 안뜨네요. 감사합니다!

[Hahn]님의 댓글을 신고합니다. 취소 신고
ONNURI
2024.01.09. 16:49

전공 분야가 아니라서 확실하게 말씀 드릴 수는 없습니다만, 생물 쪽은 염기 서열 같은 것에서 패턴을 찾아내야 하는 경우가 많아서 사용하기도 하던데...

그런데 따로 시간 들여서 배울 만한 거는 아니고 요즘 ChatGPT같은 친구들한테 이 식 뜻이 뭐야? 하면 잘 알려주니 보고 대충 이해만 하시면 될 거 같습니다.

[ONNURI]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn ONNURI 님께
2024.01.11. 21:04

대체적으로 그때그때 검색해서 작성하라는 말씀들이 대군요. 조언 감사합니다.

[Hahn]님의 댓글을 신고합니다. 취소 신고
서리바람
서리바람
2024.01.09. 17:45

저야 자주 쓰는 일을 하고, 예전에 쓸 때마다 상황도 다른데 누가 알려줄 수 있는게 아니라서 일단 배워뒀지만 지금은 GPT가 워낙 잘 해줘서 굳이 배울 필요가 있나 싶습니다.

이제는 그냥 정규식에서 뭘 할 수 있는지만 알아두고 그때그때 물어보는게 좋다고 생각합니다.

[서리바람]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn 서리바람 님께
2024.01.11. 21:05

필요할때만 GPT를 활용해서 작성하는게 효율적이겠네요. 감사합니다.

[Hahn]님의 댓글을 신고합니다. 취소 신고
TODO
TODO
2024.01.09. 19:16

배울 필요 없습니다. 더 자주 등장하면 그때 고려하세요. 챗지피티에 뭔지 물어보세요. 만드는 것도 똑같이요.

 

코드로써도 가독성이 떨어져서 그닥인 것 같구요.

[TODO]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn TODO 님께
2024.01.11. 21:06

가독성이 떨어지긴 하더라구요. 일단은 저게 한번 더 등장하지 않는 이상 진도를 나가도록 해야겠습니다. 감사합니다!

[Hahn]님의 댓글을 신고합니다. 취소 신고
취소
번호 제목 글쓴이 날짜 조회 수
공지 사이트 이용 수칙 240809 수정 admin 19.11.25 7 63608
핫글 복귀하기 싫네요.. [3] file 바고부 09:30 7 212
핫글 원두 필요없는 커피 나왔다...맛·카페인 재현 [6] BarryWhite 14:36 5 159
핫글 폴리 아 되 예매가 풀렸었군요 [2] Alternative 13:19 4 128
121281 자게 첫글 [4] file Minny 18.06.27 0 385
121280 자게 이등 [1] 이룸 18.06.27 0 163
121279 게시판 단축키 기능 추가됐습니다. [3] admin 18.06.28 0 162
121278 복붙한 글이 레이아웃 깨지게 하는데 태그 막아야할듯요 [4] file Minny 18.06.28 0 230
121277 모바일을 시코처럼 올블랙으로 하고 싶은데 [2] 익명의 미붕이 18.06.29 0 302
121276 [2] 갤러리별 18.07.02 0 142
121275 ㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷ [1] BaeJJy 18.07.02 0 117
121274 여러분 지금이 기회입니다! [3] 기립갤식 18.07.02 0 178
121273 쩌러 ㄷㄷㄷ 근데, 가독성은 많이 떨어지는군요 ㅠ [6] mxmaster 18.07.02 0 185
121272 회원간의 최소한의 예의를 지켜주시기 바랍니다 [2] Na1C 18.07.02 0 199
121271 글 읽는 화면에서도 글쓰기 버튼 만들어주세여 [1] Na1C 18.07.02 0 113
121270 와 쩐다 ㅋㅋㅋㅋㅋㅋ [1] 순수돌쇠 18.07.02 0 165
121269 와 전당~~~~ [1] elcid 18.07.02 0 101
121268 피난왓읍니다 [4] Lazarus 18.07.02 0 151
121267 [1] 8n5y 18.07.02 0 84
121266 [5] Lazarus 18.07.02 0 90
121265 여러분들에게 필요한 성지식 ^ㅇ^ [1] file BarryWhite 18.07.02 0 251
121264 야이 [3] file Lazarus 18.07.02 0 133
121263 와 며칠만에 와보니까 진짜 확 좋아졌네요. 이정도면 거의 80% 이상 완성된거 아닌가요? [2] 기븐 18.07.03 0 147
121262 미코 생각보다 조회수가 나오네요 [3] 마직수 18.07.03 0 131
121261 시장이 반찬이다 [1] file BarryWhite 18.07.03 0 93
121260 소문듣고 왔습니다 [4] [성공]함께크는성장 18.07.03 0 111
121259 온난화 [2] Lazarus 18.07.03 0 75
121258 [1] Lazarus 18.07.03 0 81
121257 버그리포트(?) [3] file JordanKwon 18.07.03 0 126

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

확장 변수

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.