[TIL] 19.08.17 sprint - article collector

2019. 8. 18. 00:24TIL

오늘 한일

미디엄 블로그의 게시글에서 <body>부분만 가져오는 함수를 만들었다. 처음 파일을 요청해서 받아 왔을때 HTML 전체 파일을 받아 왔다. 

그중에서 <body> 부분만 어떻게 가져올지를 고민하던중 <article>이라는 tag속에 들어가 있는 것을 벌견했다. 그래서 배열로 받아온 파일에서 <article>과 </article>의 인덱스를 찾아서 슬라이스 해준뒤 reaplce로 나머지 다른 tag들을 제거한후 string으로 담았고 원하는 데이터를 얻을수 있었다.

 body = Buffer.concat(body).toString();
 let first = body.indexOf("<article>")
 let last = body.lastIndexOf("</article>")
 body = body.slice(first, last).replace(/(<([^>]+)>)/gi,"")

 

'TIL' 카테고리의 다른 글

[TIL] MySQL  (0) 2019.08.19
[TIL] event loop  (0) 2019.08.18
[TIL] 19.08.16 Promise  (0) 2019.08.16
[TIL] node express  (0) 2019.08.14
[TIL] chatter - server  (0) 2019.08.13