'html parser'에 해당되는 글 1건

  1. 2008.11.23 perl을 사용한 HTML Parser

Naver Perl Community & Study Cafe


2008.11.23 16:03

perl을 사용한 HTML Parser


얼마전에 KISC에 놀러갔더니 

카페 스텝분이신 이창민(miniuslab)님이 html_parser을

만드신 것을 보고 영감을 얻었다.



perl로 만들어도 괜찮겠다 싶어서...

어제 gtk를 사용하여 약 1시간정도만에 후다닥 만들어보았다 ㅋㅋ (나는 따라쟁이 ;;)

사실... 원리를 아시는 분에게는 이정도야 껌이라고 하실듯...

LWP::Simple 모듈을 사용하면... 금방 만들어 진다..

헤더정도 따위는 없....


처음 실행한 메인화면이다.

타이틀 아이콘 고르는것에 10분이상 투자를 했다.. 결국 파란 별을... ㅡㅡ;



gtk2_textview.pl 을 참고해서 만들었으며

Editable 같은 옵션들이 맘에들어 그대로 남겨 두었다.

나같은 경우에는 URL로 소스를 먼저 얻은 후에, 

정규식을 사용해서 다시 추출을 하도록 만들었는데...

한번 테스트를 해보자.



막상 만들고 보니 Entry 창을 너무 작게 만들어서 url이 짤리는것 것이 아쉽다.

정규표현식 문법이 틀리거나 , URL의 형식이 맞지않게 입력되면 경고창을 띄운다던지.. 

그런 세부적인 코드들은 따로 개선을 해야될 듯 하다.


약 200줄정도의 코드로 이런 프로그램을 만들 수 있는 perl이 대단하다. (더 줄일수도 있겠지만..)

C로 만들었으면...

상상이 안가는...1人...
신고
크리에이티브 커먼즈 라이선스
Creative Commons License
Trackback 0 Comment 0


티스토리 툴바