Stirling-PDF项目介绍
github地址: https://github.com/Frooodle/Stirling-PDF

docker-compose 私有化部署
我们此处使用的镜像是作者给我们提供好的,如果家人们需要最新代码镜像的话可以根据作者在项目中给我们提供好的Dockerfile文件自行构建。
首相我们要创建docker-compose.yml文件
version: '3.3'
services:
stirling-pdf:
image: frooodle/s-pdf:latest
ports:
- 8070:8080
volumes:
- ./trainingData:/usr/share/tesseract-ocr/4.00/tessdata
#Required for extra OCR languages
- ./extraConfigs:/configs
- ./customFiles:/customFiles/
environment:
- DOCKER_ENABLE_SECURITY=false
创建好之后我们只需要在docker-compose.yml的同级目录下执行如下启动命令
docker-compose up -d
然后浏览器访问8080端口即可使用。
OCP 增加中文
cd /opt/pdf/trainingData
wget https://github.com/tesseract-ocr/tessdata/blob/4.1.0/chi_sim.traineddata
其他配置
/opt/pdf/extraConfigs/settings.yml
编辑配置文件可增加认证,可修改默认Web语言。