工具介绍
一个文档处理工具,它可以解析 PDF、DOCX、PPTX、HTML 等多种文档格式,并转换为 Markdown 或 JSON 格式。
Docling 提供了强大的 PDF 分析功能,包括页面布局、读取顺序和表格结构,并支持 OCR 识别扫描的 PDF。
工具地址
GitHub:https://github.com/DS4SD/docling
一个文档处理工具,它可以解析 PDF、DOCX、PPTX、HTML 等多种文档格式,并转换为 Markdown 或 JSON 格式。
Docling 提供了强大的 PDF 分析功能,包括页面布局、读取顺序和表格结构,并支持 OCR 识别扫描的 PDF。
GitHub:https://github.com/DS4SD/docling
之前