notebookLM 에 영문팟케스트 만들어 주는 것을 음성을 반대로 자동번역 및 자막 생성하고 문서화 하는 것을 만들었습니다.
스크립트로 영상을 만들거나 캔바로 보내 카드뉴스 마케팅하는데 도움은 될 듯 하지만 웹에서는 그런데 현재로서 완성도를 더 높이려면 맥OS에 가지고 있는 기능을 사용해서 만드는 것이 훨씬 나을거 같습니다.
쉽게는 아니지만 컨텐츠 뽑아내는 실험은 그만해야 할거 같아요 문제는 오픈소스로는 한계가 있어보입니다. 단어장을 계속 추가해줘야 해서 어느정도 인간이 교정봐야 할게 있으나 (Deepl 돈안써서 만든거라 딱 그정도) 다시 OpenAI, 클로드 로 번역 및 교정을 하는 것으로 처리하면 잘 나오기는 할텐데
이제 srt를 더 음성부분을 세밀하게 나눠 두사람의 대화를 카톡채팅 비슷하게 애니메이션으로 만드는 것이면 책 안의 캐릭터가 책소개 하려는 부분까지는 어찌 될듯합니다.
기계가 만든 스크립트를 다시 텍스트로 추출 해서 대화 콘텐츠를 영문, 한글로 번역
혼자 프로그램으로 자막 만들고 영상만들고… md + srt + json – animation epub을 아 머리 복잡해 osx m3 에 최적화 코드로 속도 8배 빨라집니다.
노트북LM 을 이용해서 잠깐 만들었지만 테스트해서 비슷하게 나오는 템플릿 만드는데 시간 낭비 다 했지습니다. 전자책으로 이렇게 구성되서 한글 음성도 나올 수 있게 작업중이며 본인 목소리로 학습할 수 있는 오픈소스도 많이 있고 기존에 구축되어 있는 것도 상당히 많이 있습니다. 일단 coqui-ai/TTS 를 학습한 자료중 일부를 써볼 준비중입니다.
돈 없으면 싸구려 지식을 얻게 되는 세상이 되니 돈 내는 컨텐츠를 또 다른 형식으로 제작해볼 생각입니다. 제가 GPT 나 에이전트 관련 책을 출간 안하는 이유가 OS단에서 처리하면 끝나는데 오늘 미국에서는 발표됐네요 앞으로 오리지널을 생각못하면 대부분의 서비스는 곧 사망!
지난 2주간 miniERP를 만들고 기능정의용 작은 프로그램을 하고 있었습니다. 모아시스를 대체해야겠다는 것보다는 그냥 작은 프로그램으로 요즘 출판에 맞는 형태로 전부 바꿔서 작업을 테스트 했습니다.
일단 작은 단위 테스트가 되어야 그 다음에 묶는 일을 할 수 있고 가능하면 저렴하게 운영할 수 있도록 설치형 AI에 연동해서 필요한 정보를 일종의 세트로 만들어 넣으면 동작할 수 있도록 구성했습니다.
예를 들어 ISBN만 넣으면 정보를 모두 수집해서 도서 홍보용 블로그 글, 트위터, SNS에 쓸 글을 자동으로 생성합니다. 요즘 유튜브 보면 그런게 많이 보이죠? 그런데 그걸 제대로 학습해서 다시 결과물을 뽑으려면 프로그램을 따로 해야합니다.
GUI로 자동화 하고 싶죠 안됩니다. ^^
output2.txt 라는 파일은 포맷이 전부 구글 NotebookLM에 맞춘 데이터를 Yes24에서 받아와서 봄봄스쿨의 전체도서를 가지고 대화를 뽑아낼 수 있습니다. 그런데 해당 파일은 md 및 json 구조의 데이터를 가지고 있습니다. 기계가 알아들을 수 있게 거꾸로 인간이 가공해서 넣어줘야합니다. 대부분 이걸 몰라서 텍스트 블록을 넣기만 합니다. 그래서는 온전한 학습을 통해 얻을 수 있는게 별로 없습니다.
AI 데이터 input에 가장 최적화된 문서 포맷은 markdown, json인데 대부분 출판사는 준비가 안되어 있어요. 그래서 제가 아예 다른 전자책 컨버터 및 전자책 제작 툴도 함께 하려는 이유입니다.
간단히 말하면 이런거예요. 책 한 권이 되었건 100권이 되었건 마케팅적인 접근으로 보면 데이터가 유의미한 정보와 연결되어야 그걸 기반으로 경영정보를 한 눈에 볼 수 있고 의사결정을 할 수 있게 됩니다.
마케팅을 해야할지 책정가를 개정하면 판매가 어떻게 될지 창고비용을 줄일 수 있을지 쇼핑몰을 직접 운영했을 때 스마트스토어, 쿠팡, 기타등등 어디서 무엇이 팔리고 있는지 지역별로 어떤 책이 판매되는지 한 눈에 볼 수 있어야 합니다.
그래서 GEO 지역 정보에서 서점 그리고 온라인에서 수 많은 서평, 도서블로그, 유튜브 등의 검색을 통해서 내 책이 어디에 노출되고 있는지 찾아냅니다. 그런데 이건 사람이 할 일은 아니고 일정부분 유료API를 써야되는 일이 생기기도 합니다.
어찌됐건 책에 대한 모든 정보 뿐 아니라 현재 판매지수로 특정도서를 모니터링하는 프로그램을 하고 있습니다. 어떤 도서가 반응이 있다면 그 도서의 예상판매추이나 이벤트 등 함께 분석할 수 있게 합니다.
그동안은 자사책 이외에는 하고있지 않았는데 이 기능에 대해서는 고민중입니다. 왜냐하면 모아서 볼 수 있게 한다고 데이터는 저희게 아니라서 API를 제공하는 업체 또는 공공DB를 활용해볼 계획입니다.
지금 거의 모든 업체들의 DB를 봐야하는데 그것도 저희가 일절 보지 않는 형태로 운영할 준비를 하고 있습니다. 소프트웨어를 제공해도 데이터는 아예 안보는 설치형 DB와 데이터 암호화해서 서버에 백업하는 형식을 취할 예정입니다.
결론은 자동화가 되었건 어떤 일이 되었건 모듈화해서 기능을 어떤업체건 추가로 제공하기 시작하면 함께 프로그램이 운영될 수 있게 할 생각입니다.
최근에 캔바, 어도비익스프레스에 도서정보를 바로 가짜 3차원 이미지로 도서정보 포함해서 넣는 것과 판매데이터를 기준으로 책 순위가 바뀌는 것을 만들고 있는데 매일매일 도서판매에 대한 영상이 자동으로 생성되게 하려고 합니다.
출판사는 망해도 폐업은 잘 안한다는 이야기가 있습니다. 왜냐하면 서점에 깔린 책을 회수하려면 아주 오래걸리기 때문에 망하고싶어도 망할 수 없다는 이야기예요… 그런데 이제 달라졌습니다. 바로 폐업하는 회사들이 늘어나고 있습니다. 2025 공공DB를 분석해서 지역에 맞춘 간단한 인포그래픽을 제작해봤습니다.
울릉군 출판사 폐업율 100%, 용산구 출판사 폐업율 47% 등등 서울 출판사 폐업율 30%에 육박 2025년 공공DB로 분석한 자료를 오픈트스트리트맵에 맞춰 비율이 표시되게 만들었습니다. 원래는 3D로 분석자료가 나오게 할 생각이었는데 일단 해당 출판사 2024년 도서 종수랑 붙여서 데이터를 재가공중입니다.
문화체육관광부에서 조사 및 취합한 전국에 위치한 출판사, 인쇄사 영업,폐업 정보, 지역정보 및 업체 주소 정보를 제공
데이터를 분석해서 25MB의 자료를 DB에 넣고 간단한 정보를 기준으로 프로그램을 만들어서 돌려봤습니다. 지리정보에 맞춰서 인터그래픽으로 올려야 하는데 그건 일단 나중에 하기로 하고 간단하게 구분만 하면 출판사는 30% 정도 폐업하고 인쇄업종은 22% 정도 인거 같습니다. 그에 비해 지방은 조금 20% 폐업, 인쇄소는 16.5% 폐업된 상태입니다.
어떤 URL도 가능하고 특히 온라인 서점에 도서리스트를 만들어 놓은게 있으면 해당 URL을 입력하면 나만의 책장을 생성할 수 있습니다. 책을 불러오는 포맷은 곧 공개할 예정입니다. 구글스프레드시트 URL을 넣어주면 서재를 만들어주거나 웹에 txt파일을 올리면 서재로 만들어 줄 생각입니다.
약간의 시간이 걸리는 것은 저희가 이미지를 가지고 있지 않기 때문에 재구성하는데 시간이 조금 걸립니다. 현재는 몇가지 버그가 있는데 그게 아직 출판사에서 책등 정보를 제공하지 않아서 오래된 책들은 안나오는 경우가 있습니다. 현재 대체할 수 있는 아이디어를 찾고 있고 다른 서점에서 데이터를 검색해서 비교하고 있습니다.
이 서비스의 미래는 아이폰, 아이패드 앱으로 발전할 예정이며 몇가지 게임과 책을 중심으로 하는 SNS나 중고판매가 될 수 있을겁니다.
그 전에 보이는 이미지를 인스타나 틱톡에 최적화할 수 있는 애니메이션 구성에 대해 고민하고 있습니다. 애프터이펙트나 프리미어 그리고 데이터 자체를 스프레드시트, 데이터베이스화 할 수 있게 노션, 옵시디언 플러그인이나 변환 서비스도 준비중입니다.
재미있는 인포그래픽도 만들 수 있을거 같기도 하고 기획한게 자꾸 확장되고 있습니다. 오랜만에 figma도 사용해보고 있구요. 책도 만들어야하고 팔아야하고 창고도 정리해야하고 ㅠㅠ 미치겠습니다.