主要特性
- 支持多种文件格式转换:PowerPoint、Word、Excel、图像、音频和 HTML
- 内置视觉理解和图片矫正模型
- 零成本实现高质量数据提取
- 支持并发处理,显著提升转换效率
- 集成 UVDoc 图像矫正技术
快速开始
使用 Docker 部署服务,支持CPU:性能优化
本次更新重构了处理逻辑,采用”切分-分批-解析-合并”的并行处理架构。性能测试显示,44页 PDF 的平均处理时间已优化至每页1秒以内。得益于并行处理架构,页数越多,性能优势越显著(考虑模型加载时间)。
图像矫正能力
集成了基于神经网格的 UVDoc 图形矫正工具,该工具源自 ETH Zurich 的研究成果。UVDoc 提供了一个仅 30MB 的轻量级模型,支持应用内嵌运行,在 CPU 环境下也能实现秒级的图片矫正。如果追求更高性能,office2md 同时支持 GPU 加速。此外,用户也可以选择使用 Gitee AI 提供的 UVDoc 在线服务。
扩展:大模型结构化处理
office2md 支持通过大模型进行文档内容的结构化处理。以下是使用 Java 和 langchain4j SDK 的示例实现:1. 定义 AI 助手接口
2. 配置 AI 服务
- office2md 项目地址:https://gitee.com/log4j/office2md
- 如果您对 Java AI 应用开发感兴趣,可以学习一下笔者录制的这个系列视频:Java AI应用开发,当然是开源免费的啦。
- 当然如果对Java AI 开发感兴趣可以加入我们社群
