notebookLM 에 영문팟케스트 만들어 주는 것을 음성을 반대로 자동번역 및 자막 생성하고 문서화 하는 것을 만들었습니다.
스크립트로 영상을 만들거나 캔바로 보내 카드뉴스 마케팅하는데 도움은 될 듯 하지만 웹에서는 그런데 현재로서 완성도를 더 높이려면 맥OS에 가지고 있는 기능을 사용해서 만드는 것이 훨씬 나을거 같습니다.
쉽게는 아니지만 컨텐츠 뽑아내는 실험은 그만해야 할거 같아요 문제는 오픈소스로는 한계가 있어보입니다. 단어장을 계속 추가해줘야 해서 어느정도 인간이 교정봐야 할게 있으나 (Deepl 돈안써서 만든거라 딱 그정도) 다시 OpenAI, 클로드 로 번역 및 교정을 하는 것으로 처리하면 잘 나오기는 할텐데
이제 srt를 더 음성부분을 세밀하게 나눠 두사람의 대화를 카톡채팅 비슷하게 애니메이션으로 만드는 것이면 책 안의 캐릭터가 책소개 하려는 부분까지는 어찌 될듯합니다.
기계가 만든 스크립트를 다시 텍스트로 추출 해서 대화 콘텐츠를 영문, 한글로 번역
혼자 프로그램으로 자막 만들고 영상만들고… md + srt + json – animation epub을 아 머리 복잡해 osx m3 에 최적화 코드로 속도 8배 빨라집니다.
노트북LM 을 이용해서 잠깐 만들었지만 테스트해서 비슷하게 나오는 템플릿 만드는데 시간 낭비 다 했지습니다. 전자책으로 이렇게 구성되서 한글 음성도 나올 수 있게 작업중이며 본인 목소리로 학습할 수 있는 오픈소스도 많이 있고 기존에 구축되어 있는 것도 상당히 많이 있습니다. 일단 coqui-ai/TTS 를 학습한 자료중 일부를 써볼 준비중입니다.
돈 없으면 싸구려 지식을 얻게 되는 세상이 되니 돈 내는 컨텐츠를 또 다른 형식으로 제작해볼 생각입니다. 제가 GPT 나 에이전트 관련 책을 출간 안하는 이유가 OS단에서 처리하면 끝나는데 오늘 미국에서는 발표됐네요 앞으로 오리지널을 생각못하면 대부분의 서비스는 곧 사망!
지난 2주간 miniERP를 만들고 기능정의용 작은 프로그램을 하고 있었습니다. 모아시스를 대체해야겠다는 것보다는 그냥 작은 프로그램으로 요즘 출판에 맞는 형태로 전부 바꿔서 작업을 테스트 했습니다.
일단 작은 단위 테스트가 되어야 그 다음에 묶는 일을 할 수 있고 가능하면 저렴하게 운영할 수 있도록 설치형 AI에 연동해서 필요한 정보를 일종의 세트로 만들어 넣으면 동작할 수 있도록 구성했습니다.
예를 들어 ISBN만 넣으면 정보를 모두 수집해서 도서 홍보용 블로그 글, 트위터, SNS에 쓸 글을 자동으로 생성합니다. 요즘 유튜브 보면 그런게 많이 보이죠? 그런데 그걸 제대로 학습해서 다시 결과물을 뽑으려면 프로그램을 따로 해야합니다.
GUI로 자동화 하고 싶죠 안됩니다. ^^
output2.txt 라는 파일은 포맷이 전부 구글 NotebookLM에 맞춘 데이터를 Yes24에서 받아와서 봄봄스쿨의 전체도서를 가지고 대화를 뽑아낼 수 있습니다. 그런데 해당 파일은 md 및 json 구조의 데이터를 가지고 있습니다. 기계가 알아들을 수 있게 거꾸로 인간이 가공해서 넣어줘야합니다. 대부분 이걸 몰라서 텍스트 블록을 넣기만 합니다. 그래서는 온전한 학습을 통해 얻을 수 있는게 별로 없습니다.
AI 데이터 input에 가장 최적화된 문서 포맷은 markdown, json인데 대부분 출판사는 준비가 안되어 있어요. 그래서 제가 아예 다른 전자책 컨버터 및 전자책 제작 툴도 함께 하려는 이유입니다.
간단히 말하면 이런거예요. 책 한 권이 되었건 100권이 되었건 마케팅적인 접근으로 보면 데이터가 유의미한 정보와 연결되어야 그걸 기반으로 경영정보를 한 눈에 볼 수 있고 의사결정을 할 수 있게 됩니다.
마케팅을 해야할지 책정가를 개정하면 판매가 어떻게 될지 창고비용을 줄일 수 있을지 쇼핑몰을 직접 운영했을 때 스마트스토어, 쿠팡, 기타등등 어디서 무엇이 팔리고 있는지 지역별로 어떤 책이 판매되는지 한 눈에 볼 수 있어야 합니다.
그래서 GEO 지역 정보에서 서점 그리고 온라인에서 수 많은 서평, 도서블로그, 유튜브 등의 검색을 통해서 내 책이 어디에 노출되고 있는지 찾아냅니다. 그런데 이건 사람이 할 일은 아니고 일정부분 유료API를 써야되는 일이 생기기도 합니다.
어찌됐건 책에 대한 모든 정보 뿐 아니라 현재 판매지수로 특정도서를 모니터링하는 프로그램을 하고 있습니다. 어떤 도서가 반응이 있다면 그 도서의 예상판매추이나 이벤트 등 함께 분석할 수 있게 합니다.
그동안은 자사책 이외에는 하고있지 않았는데 이 기능에 대해서는 고민중입니다. 왜냐하면 모아서 볼 수 있게 한다고 데이터는 저희게 아니라서 API를 제공하는 업체 또는 공공DB를 활용해볼 계획입니다.
지금 거의 모든 업체들의 DB를 봐야하는데 그것도 저희가 일절 보지 않는 형태로 운영할 준비를 하고 있습니다. 소프트웨어를 제공해도 데이터는 아예 안보는 설치형 DB와 데이터 암호화해서 서버에 백업하는 형식을 취할 예정입니다.
결론은 자동화가 되었건 어떤 일이 되었건 모듈화해서 기능을 어떤업체건 추가로 제공하기 시작하면 함께 프로그램이 운영될 수 있게 할 생각입니다.
최근에 캔바, 어도비익스프레스에 도서정보를 바로 가짜 3차원 이미지로 도서정보 포함해서 넣는 것과 판매데이터를 기준으로 책 순위가 바뀌는 것을 만들고 있는데 매일매일 도서판매에 대한 영상이 자동으로 생성되게 하려고 합니다.
서대문구 도서관 정보를 확인하고 그 구분 200m 정도를 반경으로 해서 도서를 기증하거나 거래할만한 편의점이나 거점 장소를 찾고 다시 만날 장소를 찾거나 위탁으로 주차가 가능한 장소를 확보해서 차량을 대고 거래하는 퇴근후 물물교환 이라는 앱을 만드는 중… 당근마켓 차 트렁크 버전이라고 생각하면 됩니다.
네이버 꿈꾸는 책공장에 출판사 위치 지도를 기반으로 출판사랑 Cafetalk® 이나 하게 해줄까 하는… 출판사 가서 책도 사고 동네 서평단도 운영하고 택배비를 줄여가며 뭔가를 할 생각도 했었습니다. 그리고 책 출간 조언도 듣고 출판강의도 듣는 그런걸 할 생각했습니다.
사실 몇년 전에 책공장 회원들이 기록했던 구글스프레드에서 구글맵 kml 기반으로 변환 한 것을 이번에는 거꾸로 전부 데이터베이스화 하고 그걸 다시 오픈스트리트맵 위에 맵핑해서 출판사가 직접 수정할 수 있게 작업을 하고는 있습니다. 그리고 도서관 DB, 대출 DB도 주말에 다 받고 정리중입니다.
GIS로 현재 위치에서 가장 가까운 출판사, 도서관, 서점도 분석일단 서대문 도서관에 대출 순위 좋은 것들이랑 책을 기증하는 서비스도 마련중입니다. 공공데이터로 API를 줘도 도서 이미지가 없어서 그걸 또 맞춰서 찾아내고 받아놓기는 하는데 디스크가 얼마나 남아있으려나 모르겠습니다.
일단 출판사들이 도서관에 자기 책이 있는지 검색할 수 있게 하는 것이랑 사서넷 같은 곳에 책소개 정보를 보내는 것을 만들면 마케팅에 도움이 조금 될까 모르겠어요.
그것보다 이제 근처 서점에서 내 책 재고파악하고 도서에 대한 정리를 해야하는데 어떻게 해결할지는 아이디어가 떠올랐는데 그것보다 이걸 배포하는 방법에 대해서 더 고민하고 있습니다.
사실 내 서가를 다른 사람에게 공개하는 앱을 만들려고 한지 꽤 됐는데 이렇게 도서관, 서점, 커피값으로 책을 거래하거나 편의점에 놓고 교환해가거나 뭐 그런 생각을 해봤습니다.