현재 장바구니가 비어 있습니다!
- 당초 4000 게시글 + a 를 100권의 전자책을 목표했지만, 현실은 방대한 온라인 지식의 보고, 블로그에 있었다. ‘책이나 있겠나… 블로그나 보겠지 =3=3=3’ 이라는 자조 섞인 결론에 도달하며, 결국 이 파편화된 지식들을 하나의 형태로 묶어주는 EPUB용 프로그램 개발에 착수했다.

개발 과정: 고통의 근원, 포맷
가장 큰 난관은 역시 **’서로 다른 포맷을 맞추는 일’**이었다.
- A 블로그는 콘텐츠가
<p>
태그 안에 깔끔하게 정리되어 있었지만, B 블로그는 줄 바꿈이<br>
태그 대신 이중 엔터로 처리되어 있었다. - C 블로그는 이미지가 외부 링크로, D 블로그는 Base64 인코딩된 문자열로 본문에 삽입되어 있었다.
이처럼 블로그마다 제각각인 HTML/CSS 스타일과 콘텐츠 구조는 마치 ‘포맷 지옥’과 같았다. 특정 포맷만 지원하도록 만들면 당장은 편하지만, 확장성이 떨어진다. 범용적인 솔루션을 만들려니 각 블로그의 파싱(Parsing) 단계부터 엄청난 예외 처리가 필요했다.
*솔직히 이 과정에서 가장 많이 한 생각은 **’아, 그냥 수동으로 복붙하고 말까’*였다.
하지만 수백 개의 포스트를 수동으로 변환하는 **’노가다’**를 상상하며, 이 비효율적인 시간 낭비를 프로그램으로 막아내겠다는 일념 하나로 버텼다. 각 블로그 구조에 맞는 정규 표현식과 DOM 조작 코드를 짜는 데만 전체 개발 시간의 절반 이상을 쏟아부었다.
결과: ‘시간 낭비’를 ‘시간 절약’으로 바꾸다

결과적으로, 블로그 포스트를 카트에 담아 EPUB으로 합쳐주는 프로그램을 완성했다. 비록 포맷을 맞추느라 시간 낭비를 했지만, 이제는 클릭 몇 번으로 수십, 수백 개의 블로그 포스트를 깔끔한 개인 e-book 형태로 소장할 수 있게 되었다.
이 프로그램은 표면적으로는 단순한 변환 툴이지만, 그 안에는 ‘서로 다른 포맷 맞추느라 시간 낭비 ㅠㅠ’ 했던 지난한 고민과 노력이 고스란히 담겨있다. 이 **’100권의 블로그’**는 결국 비효율적인 반복 작업을 효율적인 자동화 사이에 연휴를 다 써버린 결과물이 되었다.
아르고나인에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.
답글 남기기