[태그:] EPUB

  • 100권의 블로그: 포맷 지옥을 건너 EPUB을 엮다

    • 당초 4000 게시글 + a 를 100권의 전자책을 목표했지만, 현실은 방대한 온라인 지식의 보고, 블로그에 있었다. ‘책이나 있겠나… 블로그나 보겠지 =3=3=3’ 이라는 자조 섞인 결론에 도달하며, 결국 이 파편화된 지식들을 하나의 형태로 묶어주는 EPUB용 프로그램 개발에 착수했다.

    개발 과정: 고통의 근원, 포맷

    가장 큰 난관은 역시 **’서로 다른 포맷을 맞추는 일’**이었다.

    • A 블로그는 콘텐츠가 <p> 태그 안에 깔끔하게 정리되어 있었지만, B 블로그는 줄 바꿈이 <br> 태그 대신 이중 엔터로 처리되어 있었다.
    • C 블로그는 이미지가 외부 링크로, D 블로그는 Base64 인코딩된 문자열로 본문에 삽입되어 있었다.

    이처럼 블로그마다 제각각인 HTML/CSS 스타일콘텐츠 구조는 마치 ‘포맷 지옥’과 같았다. 특정 포맷만 지원하도록 만들면 당장은 편하지만, 확장성이 떨어진다. 범용적인 솔루션을 만들려니 각 블로그의 파싱(Parsing) 단계부터 엄청난 예외 처리가 필요했다.

    *솔직히 이 과정에서 가장 많이 한 생각은 **’아, 그냥 수동으로 복붙하고 말까’*였다.

    하지만 수백 개의 포스트를 수동으로 변환하는 **’노가다’**를 상상하며, 이 비효율적인 시간 낭비를 프로그램으로 막아내겠다는 일념 하나로 버텼다. 각 블로그 구조에 맞는 정규 표현식과 DOM 조작 코드를 짜는 데만 전체 개발 시간의 절반 이상을 쏟아부었다.

    결과: ‘시간 낭비’를 ‘시간 절약’으로 바꾸다

    글을 읽고 쇼핑카트에 담아서 글이 하나로 출력되게 편집합니다.

    결과적으로, 블로그 포스트를 카트에 담아 EPUB으로 합쳐주는 프로그램을 완성했다. 비록 포맷을 맞추느라 시간 낭비를 했지만, 이제는 클릭 몇 번으로 수십, 수백 개의 블로그 포스트를 깔끔한 개인 e-book 형태로 소장할 수 있게 되었다.

    이 프로그램은 표면적으로는 단순한 변환 툴이지만, 그 안에는 ‘서로 다른 포맷 맞추느라 시간 낭비 ㅠㅠ’ 했던 지난한 고민과 노력이 고스란히 담겨있다. 이 **’100권의 블로그’**는 결국 비효율적인 반복 작업효율적인 자동화 사이에 연휴를 다 써버린 결과물이 되었다.

  • 웹사이트 페이지 요소 엑셀 분석 도구

    웹 페이지 분석, 이제 엑셀로… 주말 프로젝트 웹사이트 페이지 요소 분석 도구 공개!

    안녕하세요! 주말을 활용해 개발한 따끈따끈한 웹사이트 페이지 요소 분석 도구를 소개합니다.

    평소 전자책(epub) 제작이나 인디자인 작업을 하면서 웹 페이지의 구조를 분석하고, 원하는 요소만 추출하여 재구성하고 싶다는 생각을 자주 했습니다. 기존 방식대로 CSS Selector나 DOM 기반 선택, Xpath 선택기를 일일이 수작업으로 처리하는 것은 번거롭고 비효율적이었죠.

    그래서 만들었습니다!

    이 도구는 웹 페이지의 다양한 요소를 CSS Selector, DOM, Xpath 선택자를 활용하여 엑셀 파일로 일괄 추출해줍니다.

    핵심 기능:

    • 다양한 선택자 지원: CSS Selector, DOM, Xpath 등 웹 페이지 요소 선택에 필요한 모든 선택자를 지원합니다.
    • 엑셀 일괄 편집: 추출된 요소들을 엑셀에서 편리하게 편집하고 관리할 수 있습니다.
    • 데이터 재가공 용이: 엑셀에서 편집된 데이터를 기반으로 원하는 부분만 교체하거나 새로운 데이터를 추가하여 재가공할 수 있습니다.
    • 자동화 기반 마련: 재가공된 데이터를 다른 데이터와 연결하여 보고서를 만들거나, 자동화된 워크플로우를 구축하는 데 활용할 수 있습니다.
    • X-Ray 툴 기능: 브라우저 개발자 도구(DevTools)보다 쉽고 직관적인 인터페이스로 불필요한 코드를 정리하고 원하는 요소만 추출할 수 있습니다.

    활용 예시:

    • 전자책 제작 효율 향상: 웹 페이지 레이아웃 분석 및 요소 추출 자동화를 통해 전자책 제작 시간을 단축하고 효율성을 높일 수 있습니다.
    • 카드뉴스 자동 제작: 웹 페이지에서 필요한 텍스트나 이미지를 추출하여 카드뉴스 형태로 자동 제작하는 데 활용할 수 있습니다.
    • 레이아웃 학습 및 재구성: 인디자인, HTML, PDF, IDML 등 다양한 형식의 레이아웃을 분석하고 재구성하여 새로운 콘텐츠 제작에 활용할 수 있습니다.
    • 데이터 기반 보고서 자동 생성: 웹 페이지 데이터를 분석하여 주식 시장 분석 보고서 등 다양한 형태의 보고서를 자동 생성하는 데 응용할 수 있습니다. (물론, 이 도구의 주 목적은 아닙니다. 😉)

    기대 효과:

    • 업무 효율성 극대화: 반복적인 수작업을 줄이고 자동화하여 업무 효율성을 획기적으로 개선할 수 있습니다.
    • 데이터 활용 범위 확장: 웹 페이지 데이터를 다양한 방식으로 재가공하고 활용하여 새로운 가치를 창출할 수 있습니다.
    • 자동화 기반 프로젝트 확장: 향후 레이아웃 학습 프로젝트, 카드뉴스 자동 제작 등 다양한 자동화 기반 프로젝트에 활용될 수 있습니다.

    마무리:

    이번 주말 프로젝트는 웹 페이지 분석 작업을 획기적으로 간소화하고 자동화할 수 있는 가능성을 보여주었습니다. 단순한 아이디어에서 시작했지만, 앞으로 다양한 프로젝트에 활용될 잠재력을 가진 도구라고 생각합니다.

    폰트 X-Ray 툴에 이어 이번 도구 또한, 업무 자동화와 효율성 향상에 기여할 수 있기를 기대하며, 앞으로 더 많은 분야에서 활용될 수 있도록 지속적으로 발전시켜 나가겠습니다.

    많은 관심과 응원 부탁드립니다!

  • pdf + epub3새로운 전자책 뷰어를 제작

    새로운 전자책 뷰어를 제작하고 있습니다. 폰에 맞춰 영역을 지정하고 실시간 한글 폰트를 교체해버립니다. pdf + epub3 가 될 예정입니다.

    흐린 부분은 휴대폰에서 아예 안나옵니다. 영화감독이 편집하듯 줌인, 줌아웃 영상편집하듯 한 장의 이미지에서 연출이 가능합니다.

    이미 작업된 폰트를 저희 대체폰트로 이미지를 재가공할 수 있습니다. 저작권에 문제가 없는 폰트로 대체해야 업로드 지원되는 국내 유통사에 무조건 지원해줘야 합니다.

    주말이니 프로젝트 마무리 하겠습니다.

  • 폰트로 아바타 만들기

    컬러폰트 + 서로 다른 폰트 결합하기 아이디어

    몇일 딴 짓하고 있었습니다. 폰트로 글씨를 만드는게 아니라 딩벳이 되거나 한글을 입력하면 영어 발음기호(한글)을 표시하거나 한자 자리에 딩벳을 넣는 방식을 고민했습니다. 그래서 결론은 오늘부터 글자가 그림이 되는 것을 해보려 합니다.

    아바타 구성을 하고 한글 꿹 이라고 쓰면 그림이 나옵니다. 궬 이라고 써도 친구 얼굴이 나올 수도 있습니다. 현실에서 안쓰는 자리에 다른 글자를 그림으로 넣거나 아바타 조합이 되게 만들 예정입니다.

    인디자인에서 드로잉 데이터를 폰트로 만들어 더 단순하게 epub을 만든 것처럼 게임에 들어갈 요소를 폰트로 만들어 쓰거나 80년대 개발하는 방법을 폰트에 다 넣어 아이디어를 접목해볼 예정입니다.

    왜 이런 것을 만들까요?

    없던 것을 보여줘야 사람들은 이런게 있다는 것을 알기 때문이죠~ 그리고 우선 저희 회사 책에 써보고 그 다음에 디자이너, 크리에이터, 일러스트레이터 여러분들도 만들어 함께 수익을 공유해볼까 합니다.

    뭔가 먼저가야 다음이 생기잖아요.

  • 인디자인을 자동화하는 IDML 출판 2

    인디자인을 자동화하는 IDML 출판 2

    인디자인 일서 데이터를 idml에서 번역 및 스타일을 직접 바꾸면 인디자인의 느린 속도와 오브젝트에 가려지고 묶인 글뭉치와 스타일을 한 번에 다 변경할 수 있음 안 그러면 하나씩 선택해서 바꿔야 하는데 인디자인은 그렇게 쉽게 고칠 수 없는 단점이 큼 외서 데이터를 DeepLPro에서 번역하고 편집을 전부 xml로 작업 그런데 생각이 다른 쪽으로 나가기 시작함. wordpress에서 인디자인으로 만들거나 예전 에버노트를 어디로든 보낸 것처럼 naver카페나 블로그에서 인디자인 포맷으로 보내거나 반대로 인디자인 포맷을 묶어서 xml-rpc로 워드프레스나 blogger 등등으로 변환 가능
    노션이나 옵시디언 Markdown 기타 등등 뭐가 됐건 인디자인 <->epub, wordpress <->인디자인으로 바꾸는 툴을 새로 설계 중. 이게 더 큰 시장이 될 듯

    브런치 글 이미지 1

    주말 동안 인디자인 포맷을 전부 보고 있었습니다. 스크립트로 된 걸 만드는 게 아니라 아예 외부에서 생성하거나 변환하는 서버단 솔루션으로 구성중이에요.

    https://argo9.com/archives/3825 옛날에 에버노트에서 WordPress로 만든 솔루션처럼

    그리고 당장 2024년에 작업된 가계부, 다이어리 등등 데이터기반으로 된 2025 문구(기존책) 디자인을 네이버 캘린더에 연동해서 출력하려고 합니다. 다이어리 날짜 실수가 아예없게 

  • 인디자인을 자동화하는 IDML 출판의 가능성

    인디자인을 자동화하는 IDML 출판의 가능성

    출판사의 외주를 전부 혼자 하게 만드는 프로그램중

    idml 구조 바꿔서 책을 자동으로 생성하는 것을 작업하는데 인디자인이 epub 출력하면 엉망되는지 전자책을 거의 안만들기 때문에 별로 관심도 없었고 오늘 잠시 들여다 봤습니다. idml 은 인디자인의 독자 파일포맷으로 교환용 xml 데이터 뭉치라고 보시면 됩니다. 어도비 인디자인 이외에 어피니티 퍼블리셔도 idml을 열 수 있습니다. 

    파일을 자세히 보다가 idml은 라인, 드로잉 오브젝트가 들어가면 레이아웃이 엉망이 되는 형태로 만들어집니다. 그러면 답은 아주 쉽게 낼 수 있는데 구조를 바꿔버리면 됩니다. MD포맷으로 바꾸고 드로잉 오브젝트가 포함된 부분은 하나의 이미지로 합치거나 아니면 그룹으로 묶어서 사용하면 단순하면서도 다른 편리한 에디터를 사용해 작업이 용이한 유형으로 바꿉니다. 예를 들어 sigil 같은 프로그램에서 바로 열어서 표준 스타일과 폰트만 정의해 전자책으로 변환이 가능하게 됩니다.

    라인, 드로잉 오브젝트가 들어간 것을 이미지와 하나로 합쳐 SVG로 만들고 그것을 별도 파일로 출력하는 XML로 구성하는 프로그램  제작하여 epub3, epub2, kindle 등 포맷으로 출력하는 것을 테스트해서 파싱하는 것을 다양하게 만들면 끝

    현재 Indesign Server 로 되어 있는 것을 기능별로 전부 별도 프로그램을 사용하여 만들 수 있으리라 예상됩니다. 무슨말인고 하니 만일 어떤 특정포맷의 책이 있다면 그 책에 위젯형태의 자바스크립트로 인터랙티브한 요소를 넣어 전자책을 만들거나 웹앱 게임으로 제작이 가능합니다.

    스도쿠를 인디자인에서 작업했다면 그 데이터에 해당하는 게임을 화면 선택하면 실제 게임으로 진행해볼 수 있게 또는 문제은행 크로스워드, 퍼즐 같은 것을 DB에서 가져오는게 가능합니다. 그리고 잡지에 한 번 쓴 문제는 재사용이 불가능하게 문제 DB에서 사용여부를 체크하면 같은 문제는 잡지나 책에 딱 한 번만 사용이 가능합니다. 구체적인 구현 안은 개발해서 보여드리면 될 것이고 

    브런치 글 이미지 1

    레이아웃 자동화, 넘버링 자동화를 목적으로 하는 퍼즐잡지 디자인을 생성하는 프로그램을 개발중이며 상금, 경품 주는 퍼즐포켓북이라는 잡지 창간을 위해서 별 짓을 다 하고 있습니다.

    참고로 IDML을 이용해서 외서 데이터에 스타일 재정의 및 오브젝트 단위의 검색, 치환 그리고 자동번역, 자동 스타일 수정을 통해 한 번에 책을 만들 수 있게 하려는게 목적입니다. 외서 인디자인파일을 열어서 스타일 정의하고 빠진거 찾아내고 폰트 정의된거 교체하려면 시간낭비가 심합니다. 그냥 텍스트 에디터로 작업하면 쉬운데 인디자인에서 Grep 이나 오브젝트 검색을 통해 찾고 변경하는게 의외로 선택이 안되고 찾아지는 것도 엉망입니다.

    그냥 밖에서 작업해서 변환해서 여는 것으로 하고 구조를 재생성해서 하이브리드 전자책, 앱, 웹을 만들 수 있게 됩니다. 

    그리고 외서 작업을 하기 귀찮아서… 한 번에 해결하고 타사에 서비스로 제공하는게 편할거 같아요. 자동화만 해줘도 디자이너 일할 시간이 1/30 로 줄어드니까.

    20년 만에 전자책을 만들어 보겠습니다. epub이 아닌 다른 포맷 리퀴드 pdf 비슷한 ^^

     #인디자인 #출판 #전자책

  • 아르고나인 에버프레스 OSX 새로운 기능

    아르고나인 에버프레스 OSX 새로운 기능

    5년 전에 개발한 소프트웨어로 그동안 고민만 하고 별로 업데이트를 안하다 이번에 Gnuboard, Wiki 등 클립핑 기능 및 네이버 카페 게시글을 긁어서 정리하는 기능을 추가하는 중입니다. 벌써 몇가지는 완성되어 활용하고 있습니다.

    올해 해보려고 하는 것은 인디자인의 DB 연동을 에버프레스로 진행하거나 인디자인의 IDML 패키지, epub으로 만들어주는 플러그인을 제작하려고 합니다.

    블로그 번역기능이나 몇가지 공동작업에 대한 생각이 있어 진행하다. 에버노트를 기반으로 하는 것에 대한 부담감도 있고 있어 프로젝트를 외부판매용 보다는 내부에서 사용하기로 결정 했었습니다.

    기능적으로 분리해서 제품화 하기로 하고 올해는 인디자인에 맞는 협업툴로서 1차 작업을 완료할 생각입니다.

     

    everpress OSX- evernote to wordpress, xpressengine 컨버터 아르고나인 출판사에서 제작한 에버노트 데이터를 XMLRPC로 워드프레스, 제로보드 등 대량 컨텐츠 변환 솔루션

     

    https://www.youtube.com/watch?v=CtI9eV8iOAA

  • 페이퍼원더랜드 본문 미리보기 테스트

    [real3dflipbook id=”1″]

    저희 출판사는 인쇄용 출판물을 주로 하고 있습니다. epub이나 전자책에는 사용하기 어려운 부분입니다. 도면이나 인쇄를 해야 하는 학습서, 퍼즐, 게임, 연습장, 템플릿 기반의 문구 도면 등을 기존 출판사와는 다른 방식으로 제공할 예정입니다.

    월 결제시 봄봄스쿨, 아르고나인의 미출간원고 및 기존 도서와 함께 사용하는 동영상, 인쇄용 자료, 도서를 문구나 교구와 함께 만나보실 수 있게 됩니다.

    https://booktable.kr/shop/%ED%8E%98%EC%9D%B4%ED%8D%BC-%EC%9B%90%EB%8D%94%EB%9E%9C%EB%93%9C-2/