[TIL] 19.08.17 sprint - article collector
2019. 8. 18. 00:24ㆍTIL
오늘 한일
미디엄 블로그의 게시글에서 <body>부분만 가져오는 함수를 만들었다. 처음 파일을 요청해서 받아 왔을때 HTML 전체 파일을 받아 왔다.
그중에서 <body> 부분만 어떻게 가져올지를 고민하던중 <article>이라는 tag속에 들어가 있는 것을 벌견했다. 그래서 배열로 받아온 파일에서 <article>과 </article>의 인덱스를 찾아서 슬라이스 해준뒤 reaplce로 나머지 다른 tag들을 제거한후 string으로 담았고 원하는 데이터를 얻을수 있었다.
body = Buffer.concat(body).toString();
let first = body.indexOf("<article>")
let last = body.lastIndexOf("</article>")
body = body.slice(first, last).replace(/(<([^>]+)>)/gi,"")
'TIL' 카테고리의 다른 글
[TIL] MySQL (0) | 2019.08.19 |
---|---|
[TIL] event loop (0) | 2019.08.18 |
[TIL] 19.08.16 Promise (0) | 2019.08.16 |
[TIL] node express (0) | 2019.08.14 |
[TIL] chatter - server (0) | 2019.08.13 |