notebookLM 에 영문팟케스트 만들어 주는 것을 음성을 반대로 자동번역 및 자막 생성하고 문서화 하는 것을 만들었습니다.
스크립트로 영상을 만들거나 캔바로 보내 카드뉴스 마케팅하는데 도움은 될 듯 하지만 웹에서는 그런데 현재로서 완성도를 더 높이려면 맥OS에 가지고 있는 기능을 사용해서 만드는 것이 훨씬 나을거 같습니다.
쉽게는 아니지만 컨텐츠 뽑아내는 실험은 그만해야 할거 같아요 문제는 오픈소스로는 한계가 있어보입니다. 단어장을 계속 추가해줘야 해서 어느정도 인간이 교정봐야 할게 있으나 (Deepl 돈안써서 만든거라 딱 그정도) 다시 OpenAI, 클로드 로 번역 및 교정을 하는 것으로 처리하면 잘 나오기는 할텐데
이제 srt를 더 음성부분을 세밀하게 나눠 두사람의 대화를 카톡채팅 비슷하게 애니메이션으로 만드는 것이면 책 안의 캐릭터가 책소개 하려는 부분까지는 어찌 될듯합니다.
기계가 만든 스크립트를 다시 텍스트로 추출 해서 대화 콘텐츠를 영문, 한글로 번역
혼자 프로그램으로 자막 만들고 영상만들고… md + srt + json – animation epub을 아 머리 복잡해 osx m3 에 최적화 코드로 속도 8배 빨라집니다.
노트북LM 을 이용해서 잠깐 만들었지만 테스트해서 비슷하게 나오는 템플릿 만드는데 시간 낭비 다 했지습니다. 전자책으로 이렇게 구성되서 한글 음성도 나올 수 있게 작업중이며 본인 목소리로 학습할 수 있는 오픈소스도 많이 있고 기존에 구축되어 있는 것도 상당히 많이 있습니다. 일단 coqui-ai/TTS 를 학습한 자료중 일부를 써볼 준비중입니다.
돈 없으면 싸구려 지식을 얻게 되는 세상이 되니 돈 내는 컨텐츠를 또 다른 형식으로 제작해볼 생각입니다. 제가 GPT 나 에이전트 관련 책을 출간 안하는 이유가 OS단에서 처리하면 끝나는데 오늘 미국에서는 발표됐네요 앞으로 오리지널을 생각못하면 대부분의 서비스는 곧 사망!
지난 2주간 miniERP를 만들고 기능정의용 작은 프로그램을 하고 있었습니다. 모아시스를 대체해야겠다는 것보다는 그냥 작은 프로그램으로 요즘 출판에 맞는 형태로 전부 바꿔서 작업을 테스트 했습니다.
일단 작은 단위 테스트가 되어야 그 다음에 묶는 일을 할 수 있고 가능하면 저렴하게 운영할 수 있도록 설치형 AI에 연동해서 필요한 정보를 일종의 세트로 만들어 넣으면 동작할 수 있도록 구성했습니다.
예를 들어 ISBN만 넣으면 정보를 모두 수집해서 도서 홍보용 블로그 글, 트위터, SNS에 쓸 글을 자동으로 생성합니다. 요즘 유튜브 보면 그런게 많이 보이죠? 그런데 그걸 제대로 학습해서 다시 결과물을 뽑으려면 프로그램을 따로 해야합니다.
GUI로 자동화 하고 싶죠 안됩니다. ^^
output2.txt 라는 파일은 포맷이 전부 구글 NotebookLM에 맞춘 데이터를 Yes24에서 받아와서 봄봄스쿨의 전체도서를 가지고 대화를 뽑아낼 수 있습니다. 그런데 해당 파일은 md 및 json 구조의 데이터를 가지고 있습니다. 기계가 알아들을 수 있게 거꾸로 인간이 가공해서 넣어줘야합니다. 대부분 이걸 몰라서 텍스트 블록을 넣기만 합니다. 그래서는 온전한 학습을 통해 얻을 수 있는게 별로 없습니다.
AI 데이터 input에 가장 최적화된 문서 포맷은 markdown, json인데 대부분 출판사는 준비가 안되어 있어요. 그래서 제가 아예 다른 전자책 컨버터 및 전자책 제작 툴도 함께 하려는 이유입니다.
간단히 말하면 이런거예요. 책 한 권이 되었건 100권이 되었건 마케팅적인 접근으로 보면 데이터가 유의미한 정보와 연결되어야 그걸 기반으로 경영정보를 한 눈에 볼 수 있고 의사결정을 할 수 있게 됩니다.
마케팅을 해야할지 책정가를 개정하면 판매가 어떻게 될지 창고비용을 줄일 수 있을지 쇼핑몰을 직접 운영했을 때 스마트스토어, 쿠팡, 기타등등 어디서 무엇이 팔리고 있는지 지역별로 어떤 책이 판매되는지 한 눈에 볼 수 있어야 합니다.
그래서 GEO 지역 정보에서 서점 그리고 온라인에서 수 많은 서평, 도서블로그, 유튜브 등의 검색을 통해서 내 책이 어디에 노출되고 있는지 찾아냅니다. 그런데 이건 사람이 할 일은 아니고 일정부분 유료API를 써야되는 일이 생기기도 합니다.
어찌됐건 책에 대한 모든 정보 뿐 아니라 현재 판매지수로 특정도서를 모니터링하는 프로그램을 하고 있습니다. 어떤 도서가 반응이 있다면 그 도서의 예상판매추이나 이벤트 등 함께 분석할 수 있게 합니다.
그동안은 자사책 이외에는 하고있지 않았는데 이 기능에 대해서는 고민중입니다. 왜냐하면 모아서 볼 수 있게 한다고 데이터는 저희게 아니라서 API를 제공하는 업체 또는 공공DB를 활용해볼 계획입니다.
지금 거의 모든 업체들의 DB를 봐야하는데 그것도 저희가 일절 보지 않는 형태로 운영할 준비를 하고 있습니다. 소프트웨어를 제공해도 데이터는 아예 안보는 설치형 DB와 데이터 암호화해서 서버에 백업하는 형식을 취할 예정입니다.
결론은 자동화가 되었건 어떤 일이 되었건 모듈화해서 기능을 어떤업체건 추가로 제공하기 시작하면 함께 프로그램이 운영될 수 있게 할 생각입니다.
최근에 캔바, 어도비익스프레스에 도서정보를 바로 가짜 3차원 이미지로 도서정보 포함해서 넣는 것과 판매데이터를 기준으로 책 순위가 바뀌는 것을 만들고 있는데 매일매일 도서판매에 대한 영상이 자동으로 생성되게 하려고 합니다.
출판사는 망해도 폐업은 잘 안한다는 이야기가 있습니다. 왜냐하면 서점에 깔린 책을 회수하려면 아주 오래걸리기 때문에 망하고싶어도 망할 수 없다는 이야기예요… 그런데 이제 달라졌습니다. 바로 폐업하는 회사들이 늘어나고 있습니다. 2025 공공DB를 분석해서 지역에 맞춘 간단한 인포그래픽을 제작해봤습니다.
울릉군 출판사 폐업율 100%, 용산구 출판사 폐업율 47% 등등 서울 출판사 폐업율 30%에 육박 2025년 공공DB로 분석한 자료를 오픈트스트리트맵에 맞춰 비율이 표시되게 만들었습니다. 원래는 3D로 분석자료가 나오게 할 생각이었는데 일단 해당 출판사 2024년 도서 종수랑 붙여서 데이터를 재가공중입니다.
문화체육관광부에서 조사 및 취합한 전국에 위치한 출판사, 인쇄사 영업,폐업 정보, 지역정보 및 업체 주소 정보를 제공
데이터를 분석해서 25MB의 자료를 DB에 넣고 간단한 정보를 기준으로 프로그램을 만들어서 돌려봤습니다. 지리정보에 맞춰서 인터그래픽으로 올려야 하는데 그건 일단 나중에 하기로 하고 간단하게 구분만 하면 출판사는 30% 정도 폐업하고 인쇄업종은 22% 정도 인거 같습니다. 그에 비해 지방은 조금 20% 폐업, 인쇄소는 16.5% 폐업된 상태입니다.
어떤 URL도 가능하고 특히 온라인 서점에 도서리스트를 만들어 놓은게 있으면 해당 URL을 입력하면 나만의 책장을 생성할 수 있습니다. 책을 불러오는 포맷은 곧 공개할 예정입니다. 구글스프레드시트 URL을 넣어주면 서재를 만들어주거나 웹에 txt파일을 올리면 서재로 만들어 줄 생각입니다.
약간의 시간이 걸리는 것은 저희가 이미지를 가지고 있지 않기 때문에 재구성하는데 시간이 조금 걸립니다. 현재는 몇가지 버그가 있는데 그게 아직 출판사에서 책등 정보를 제공하지 않아서 오래된 책들은 안나오는 경우가 있습니다. 현재 대체할 수 있는 아이디어를 찾고 있고 다른 서점에서 데이터를 검색해서 비교하고 있습니다.
이 서비스의 미래는 아이폰, 아이패드 앱으로 발전할 예정이며 몇가지 게임과 책을 중심으로 하는 SNS나 중고판매가 될 수 있을겁니다.
그 전에 보이는 이미지를 인스타나 틱톡에 최적화할 수 있는 애니메이션 구성에 대해 고민하고 있습니다. 애프터이펙트나 프리미어 그리고 데이터 자체를 스프레드시트, 데이터베이스화 할 수 있게 노션, 옵시디언 플러그인이나 변환 서비스도 준비중입니다.
재미있는 인포그래픽도 만들 수 있을거 같기도 하고 기획한게 자꾸 확장되고 있습니다. 오랜만에 figma도 사용해보고 있구요. 책도 만들어야하고 팔아야하고 창고도 정리해야하고 ㅠㅠ 미치겠습니다.
지난 1년간 출판사 매출의 변화가 있기 시작했습니다. 아실 분들은 아시겠지만 출판은 완전 주먹구구식이라 LPO한 페이지에 뷰수나 구매매칭을 하기 힘든 구조로 되어 있습니다. 우리나라에서 3위 안에 꼽는 인터넷 서점들을 보면 정말 가관입니다. 온라인에서 한달 몇 백만원짜리 광고를 해도 어떻게 유입되거 있는지 어디서 구매포인트가 생기는지 보고서 한 장 안 주는 일이 대부분입니다. 인생이 랜덤이니까 그러려니 해야겠죠 ^^ 원래 5년 전에는 Viddler 를 써오다가 2년 전부터 Video 확산 내역을
분석할 수 있는 Vimeo pro 버전을 사용하고 있어서 최근 2년정도 자료를 분석해봤습니다. 그나마 유효한 데이터를 추출할 수 있는 1년간 자료를 공개합니다. 1년간 노출과 매출의 사이. 데이터는 주당으로 분석을 해보면 됩니다. 저희가 작년 6월부터 모 인터넷서점과 연단위 광고계약을 통해 광고를 집행한 시점부터 노란색 Loads 수가 증가합니다. 하지만 실제 Plays 수가 그다지 증가하는 것으로 보이지 않습니다. 최근 강제 Play를 하는 옵션을 바꾼 경우 끝까지 다 보는 경우가 증가하는 것으로 생각됩니다. 전체적으로 Loads 수가 증가하면 일시적으로 좋을지는 몰라도 결국 Play를 자동으로 해서 고객의 눈을 먼저 끌어야 한다는 점입니다. 재미있는건 어떤 도서는 비디오나 도서정보를 자세히 넣는게 오히려 궁금증을 유발시키는 것을 줄여 판매에 도움이 안되는 경우도 있다는 것입니다. 하지만 대부분의 도서는 좀 어눌하고 잘못만들은 UCC 같은 동영상에 흥미를 가지고 지켜본다는 점이죠. 결국 매출로 이어지는 %는 유입량의 5% 정도로 생각되지만 최소한 Finishes 같이 끝까지 본 숫자 *2배 정도는 구매한다고 보여집니다. 관심이 있으니 들어왔고 구매까지 이어진거죠. 2/4분기 출판 매출을 5억정도(반올림)해서 이런 성장의 배경 한 부분에는 블로그나 트위터, 페이스북을 통한 다양한 채널로 도서정보를 노출하고 실제 판매할 사이트로 유입시켜준 역할이 크지 않았나 생각합니다. http://www.autotwit.co.kr도 여전히 잘 쓰고 말이죠 ^^ 물론 광고비용도 꽤 많이 지출했지만 성장율이 더 크기 때문에 다음분기에 어떤 성적을 보여줄지 기대를 하고 있습니다. 그래프에서는 다소 떨어지는 듯한 기분이 들지만 여름 휴가철이라 그런 것이고 생각보다는 선전하고 있습니다. (전년에 비하면) 모든 성장은 그래프로만 보거나 숫자로 봐서는 모릅니다. 실 내용은 또 다르기 때문이죠. 매출은 단순히 노력해서 오르거나 하지 않으니까 지켜보면서 계속 방법을 바꿔가야 합니다. 더 효율적이고 바로 알 수 있도록 말이죠. 페이스북 http://www.facebook.com/argo9 도서 동영상 포트폴리오 http://vimeopro.com/argo9/spectrumbookshttp://vimeopro.com/argo9/argo9 트위터 자동화툴 http://www.autotwit.co.kr