# document-server **Repository Path**: kernelstudio/document-server ## Basic Information - **Project Name**: document-server - **Description**: 文档服务器,支持Dify文档提取,OCR识别 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-06-10 - **Last Updated**: 2025-06-11 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 文档服务器 * python3.11+ * 支持文档批量提取 * OCR批量识别 * 文档标注(开发中) ### 1. 文档提取支持的格式 * csv * doc,docx * xls,xlsx * html,htm,xml * png,jpg,jpeg * json * txt,md,markdown * ppt,pptx * properties * yaml,yml * pdf ### 2. Dify适配 需要将`.env`文件中的数据库配置信息修改为dify环境的对应值, [Dify文档提取插件](https://github.com/kernelstudio/ksai-dify-plugin-document)