Do you also collect a lot of scanned PDF documents? Those academic papers, e-books or work materials, although the content is precious, are very difficult to read - rigid layout, unadjustable fonts, always need to zoom in and out when reading on mobile phones.
Now, these PDFs can be easily converted into comfortable EPUB format through pdf-craft. Just like organizing a pile of paper documents into a portable e-book, you can finally browse these contents in the most suitable way for you on your favorite EPUB reader: adjust the font size, switch to night mode, or even listen to AI reading.
pdf-craft is an open source library dedicated to processing scanned book PDFs. It can accurately identify text content, headers and footers, reference annotations, etc. in PDF files. It can maintain the coherence of cross-page content and restore the correct reading order. In addition, it will use LLM to build a complete EPUB contents structure.
It is very simple to use pdf-craft in oomol. First, create a blank project. Then type "pdf-craft" in the search box in the oomol store to find it.
Drag the “Analyse PDF” and “Generate EPUB” blocks onto the empty flow. Then, connect their output_dir and analysed_dir fields as shown in the figure.
Then, set the pdf field to the PDF source file to be processed, and then set the epub_file_path to the converted EPUB file path. Finally, click the Run button in the upper right corner to start the conversion.
在 oomol studio 中,我们重新定义了工作流工具的交互方式,让它真正理解程序员的工作习惯。想象一下,当你正在构建一个数据处理流程时,突然发现需要添加一个特殊的数据转换步骤——这时你可以直接插入一个代码编辑器窗口。这个代码块就像乐高积木一样自然地融入整个流程,与其他可视化节点平起平坐。
写代码的过程就像在熟悉的 IDE 中一样流畅,你可以使用 Python、TypeScript、JavaScript 来写代码。在 oomol studio 中,依赖管理采用容器化方案确保稳定性。当你需要使用第三方库时,可以确保工作流在任何机器上运行时,第三方库的版本和行为都保持一致。不需要用户手动处理虚拟环境或包安装,常用库开箱即用。
现在的工作流工具中充斥着把一个文件转换为另一个格式的文件,或者是根据搜索内容生成一段话发送到社交媒体上之类的任务,你知道这一类任务不可能是客户想要的完整的业务,他们在文件转换为另一个格式之后需要将文件分享或者分析,发送到社交媒体上的话是为了吸引用户获得某些数据或者收益,但是剩下的步骤不是现在的工作流工具可以完成的,它们太过复杂,无法用简单的 if / else 来处理。
所以不是用户不想把业务自动化,而是现在做不到。
因此 OOMOL Studio 支持代码是为了让用户真正实现全部业务的自动化,Python 和 Node.js 社区存在大量开源的各类问题的解决方案,我们希望用户能使用这些已经存在的工具来解决问题,或者让用户可以根据自己的需要亲手构建自动化流程。我们相信真正的高附加值工作一定是相对复杂的,客户能够赚取的利润应该取决于问题的困难程度和节省的时间。
我们不认为社交媒体上随处可见的"我靠这个工作流自动生成 AI 视频已经赚了数万美元"的文章真的想提高所有人的生产力,他们的目标只是你的咨询费而已,或者更简单只是一个广告。这只是把一个实际问题的最简单部分的自动化流程重复分享传播,实际上他们确实提高了一部分生产力,但是真正困难的事情在于需要让用户手动参与定制的流程。
OOMOL Studio 选择在这条困难的道路上探索,也许我们不是最终正确的方案,但是至少我们做出了一部分努力,就是让想要真正解决复杂问题并自动化的用户可以有机会实现目标。