로그인 해주세요.

자유 게시판 *자유로운 대화공간입니다. 회원간 예의를 지켜주세요. #정치글 #친목 금지

Hahn

자유 정규표현식 관련 질문 올립니다

  • Hahn
  • 조회 수 333
  • 2024.01.09. 14:58

머신러닝 책에서 자연어 처리 관련 챕터를 보고 있는데 정규표현식을 사용하는 코드가 있네요.

이게 뒤에도 계속 나오는건 아닌거 같고, 책에서도 '배우는데 시간이 많이 걸리고 이 책의 범위가 아니다'라고 써있습니다.

제 전공/업무분야를 감안하면 앞으로 자연어 처리 쪽으로 나갈 가능성은 높지 않아 보이긴 하는데, 그래도 익혀 두는게 좋을까요?

Hahn
#Mobile
Galaxy S21 Ultra
Galaxy Watch Active 2
Galaxy Buds Pro

#At home
Macbook Air (2022, M2, 16GB, 256GB)
Epson Perfection V39
Wacom Intuos Pro M (PTH-660)

#For Machine Learning study
i7 9700 / 16GB / Quadro P400
Ubuntu 22.04.2 LTS

#For Electromagnetic Simulation
i7 9700 / 16GB / Quadro P400
Windows 8.1
댓글
16
불심
1등 불심
2024.01.09. 15:02

무슨 전공이나 업무를 하시는진 모르겠지만, 복잡한 스트링 패턴 처리시엔 정규식(regex)이 필수라서요.

 

뭐 예를들면 회원가입 받을때 비밀번호 패턴분석에도 쓸수있고, 활용처는 많습니다.

[불심]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn 불심 님께
2024.01.09. 15:11

저는 화학 계열 엔지니어고, 실험데이터 처리에 ML을 적용하고자 하는게 목적이었기 때문에 주로 숫자를 다룹니다. (물론 요즘 평생직업이란게 있을수 없다보니 고민이 많긴 합니다ㅎㅎ)

뜬구름잡는 얘기일수 있지만 다량의 논문을 전부 읽지 않고 뭔가 정보를 뽑아낸다거나 하는 쪽으로도 응용이 가능하긴 하겠네요. 시간날때 한번 들여다봐야겠습니다. 감사합니다!

[Hahn]님의 댓글을 신고합니다. 취소 신고
불심
불심 Hahn 님께
2024.01.09. 18:49

요즘은 굳이 정규식 패턴을 외울필욘 없고 chatgpt나 검색을 통해 원하는 패턴은 쉽게 얻으실수 있으니 기본적인 사항만 보셔도 됩니다.

 

그런데 복잡한 스트링 패턴엔 적합하지만 어디까지나 적당한 길이에서나 유효하므로 큰 데이터에서 원하시는 정보를 뽑으실거면 검색 시스템을 구축하시는게 더 낫지 않나 싶네요.

[불심]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn 불심 님께
2024.01.11. 21:03

배울게 참 많군요. 감사합니다:)

[Hahn]님의 댓글을 신고합니다. 취소 신고
하루우라라
2등 하루우라라
2024.01.09. 15:09

왜 배우는데 시간이 많이 걸린다는지는 모르겠지만.. 그냥 어떻게 쓰는지 정도만 알고 넘어가시면 될거 같습니다. 어떤걸 책에 적어뒀길래 배우는데 오래 걸린다는지는 몰라도 보통 말하는 정규표현식이면 그렇게 오래걸리는건 아닐텐데.. 그냥 어떻게 쓰는 어떤건지만 알고 넘어가세요. 식 자체는 외우기도 힘들고 걍 필요할 때 찾아 쓰면 됩니다.

[하루우라라]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn 하루우라라 님께
2024.01.09. 15:16

스크린샷 2024-01-09 15-13-05.png

저기 이모티콘 검색하는 부분에 길게 써있는 부분을 이해하기가 조금 힘들어서요^^; 그리고 함수 자체는 책에서 제시한대로 잘 동작하지만 syntax warninig이 나타나는 이유를 파악할 수가 없어서 답답한 마음에 질문 드려 봤습니다. 조언 감사합니다!

[Hahn]님의 댓글을 신고합니다. 취소 신고
포인트봇
포인트봇 섭힝 님께
2024.01.09. 15:45
회원님 2포인트 채굴 성공!
[포인트봇]님의 댓글을 신고합니다. 취소 신고
감이어디감
감이어디감
2024.01.09. 16:12

정규표현식이란게 원하는 규칙을 문법에 맞게 옮겨적는 거라 그때그때 찾아서 쓰면 되긴 해요. 요즘은 LLM에 물어보면 꽤 정확하게 알려줄 것 같구요.

 

SyntaxWarning 관련해서는 인코딩 때문에 발생하는 이슈인데

파이썬은 기본 문자열의 \를 무조건 escape로 인식하는데 \W나 \)는 파이썬 내장 확장열escape sequence이 아니라서 인식을 못해요

정규표현식만 있는 문자열이라면 앞에 r을 붙여서 raw string으로 적어주는게 바람직합니다

raw string 예시: r"(?::|;|=) ..."

Why does Python log a DeprecationWarning saying “invalid escape sequence”? - Adam Johnson

[감이어디감]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn 감이어디감 님께
2024.01.09. 16:15

와웅 말씀하신대로 문자열 앞에 r을 붙이니까 에러가 안뜨네요. 감사합니다!

[Hahn]님의 댓글을 신고합니다. 취소 신고
ONNURI
2024.01.09. 16:49

전공 분야가 아니라서 확실하게 말씀 드릴 수는 없습니다만, 생물 쪽은 염기 서열 같은 것에서 패턴을 찾아내야 하는 경우가 많아서 사용하기도 하던데...

그런데 따로 시간 들여서 배울 만한 거는 아니고 요즘 ChatGPT같은 친구들한테 이 식 뜻이 뭐야? 하면 잘 알려주니 보고 대충 이해만 하시면 될 거 같습니다.

[ONNURI]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn ONNURI 님께
2024.01.11. 21:04

대체적으로 그때그때 검색해서 작성하라는 말씀들이 대군요. 조언 감사합니다.

[Hahn]님의 댓글을 신고합니다. 취소 신고
서리바람
서리바람
2024.01.09. 17:45

저야 자주 쓰는 일을 하고, 예전에 쓸 때마다 상황도 다른데 누가 알려줄 수 있는게 아니라서 일단 배워뒀지만 지금은 GPT가 워낙 잘 해줘서 굳이 배울 필요가 있나 싶습니다.

이제는 그냥 정규식에서 뭘 할 수 있는지만 알아두고 그때그때 물어보는게 좋다고 생각합니다.

[서리바람]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn 서리바람 님께
2024.01.11. 21:05

필요할때만 GPT를 활용해서 작성하는게 효율적이겠네요. 감사합니다.

[Hahn]님의 댓글을 신고합니다. 취소 신고
TODO
TODO
2024.01.09. 19:16

배울 필요 없습니다. 더 자주 등장하면 그때 고려하세요. 챗지피티에 뭔지 물어보세요. 만드는 것도 똑같이요.

 

코드로써도 가독성이 떨어져서 그닥인 것 같구요.

[TODO]님의 댓글을 신고합니다. 취소 신고
Hahn
글쓴이
Hahn TODO 님께
2024.01.11. 21:06

가독성이 떨어지긴 하더라구요. 일단은 저게 한번 더 등장하지 않는 이상 진도를 나가도록 해야겠습니다. 감사합니다!

[Hahn]님의 댓글을 신고합니다. 취소 신고
취소
번호 제목 글쓴이 날짜 조회 수
공지 사이트 이용 수칙 240809 수정 admin 19.11.25 7 64615
핫글 日 차기 총리: 한국 납득할 때까지 사죄 [17] update BarryWhite 00:40 15 598
핫글 그것이 약속이니까 [6] updatefile 우리애는물어요 12:31 6 129
핫글 뉴진스는 신기한게.... [8] 나르시시스트민희진 00:14 5 379
121360 자게 첫글 [4] file Minny 18.06.27 0 389
121359 자게 이등 [1] 이룸 18.06.27 0 163
121358 게시판 단축키 기능 추가됐습니다. [3] admin 18.06.28 0 164
121357 복붙한 글이 레이아웃 깨지게 하는데 태그 막아야할듯요 [4] file Minny 18.06.28 0 233
121356 모바일을 시코처럼 올블랙으로 하고 싶은데 [2] 익명의 미붕이 18.06.29 0 302
121355 지금 부트스트랩 쓰시나요? [2] 기븐 18.06.29 2 311
121354 [2] 갤러리별 18.07.02 0 144
121353 ㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷ [1] BaeJJy 18.07.02 0 121
121352 여러분 지금이 기회입니다! [3] 기립갤식 18.07.02 0 182
121351 쩌러 ㄷㄷㄷ 근데, 가독성은 많이 떨어지는군요 ㅠ [6] mxmaster 18.07.02 0 187
121350 회원간의 최소한의 예의를 지켜주시기 바랍니다 [2] Na1C 18.07.02 0 205
121349 글 읽는 화면에서도 글쓰기 버튼 만들어주세여 [1] Na1C 18.07.02 0 114
121348 와 쩐다 ㅋㅋㅋㅋㅋㅋ [1] 순수돌쇠 18.07.02 0 167
121347 와 전당~~~~ [1] elcid 18.07.02 0 109
121346 피난왓읍니다 [4] Lazarus 18.07.02 0 155
121345 [1] 8n5y 18.07.02 0 88
121344 [5] Lazarus 18.07.02 0 93
121343 여러분들에게 필요한 성지식 ^ㅇ^ [1] file BarryWhite 18.07.02 0 260
121342 야이 [3] file Lazarus 18.07.02 0 136
121341 와 며칠만에 와보니까 진짜 확 좋아졌네요. 이정도면 거의 80% 이상 완성된거 아닌가요? [2] 기븐 18.07.03 0 151
121340 미코 생각보다 조회수가 나오네요 [3] 마직수 18.07.03 0 133
121339 시장이 반찬이다 [1] file BarryWhite 18.07.03 0 97
121338 소문듣고 왔습니다 [4] [성공]함께크는성장 18.07.03 0 117
121337 온난화 [2] Lazarus 18.07.03 0 80
121336 [1] Lazarus 18.07.03 0 82

추천 IT 소식 [1/]

스킨 기본정보

colorize02 board
2017-03-02
colorize02 게시판

확장 변수

1. 게시판 기본 설정

게시판 타이틀 하단에 출력 됩니다.

일반 게시판, 리스트 게시판, 갤러리 게시판에만 해당

2. 글 목록

기본 게시판, 일반 게시판, 썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

썸네일 게시판만 해당

3. 갤러리 설정

4. 글 읽기 화면

기본 10명 (11명 일 경우, XXXXX 외 1명으로 표시)

5. 댓글 설정

일정 수 이상의 추천을 받은 댓글에 표시를 합니다.

6. 글 쓰기 화면 설정

글 쓰기 폼에 미리 입력해 놓을 문구를 설정합니다.