
简介介绍
Zerox OCR是一款专为高效转换PDF、DOCX、图片等格式文件至Markdown设计的开源AI文档智能工具。它利用先进的AI视觉模型实现OCR识别,处理复杂文档布局、表格和图表等多样化内容,支持批量文档处理,并与文档存储系统实时同步,帮助用户快速构建数据管道。
主要特点
- AI视觉模型:使用GPT-4o-mini等先进模型进行OCR识别。
- 多格式支持:支持PDF、DOCX、图片等多种文件格式。
- 批量处理:支持批量文档处理,提高效率。
- 实时同步:与文档存储系统实时同步,构建数据管道。
- Node.js SDK:支持多家平台的视觉模型,如OpenAI、Azure OpenAI等。
- 灵活性和扩展性:提供极高的灵活性和扩展性,适用于多种场景。
- 在线演示与文档:官网提供在线演示和详细文档,方便用户体验。
工具地址
GitHub:https://github.com/getomni-ai/zerox
演示地址:https://getomni.ai/ocr-demo