# OCR Service

**Repository Path**: kernelstudio/ocr-service

## Basic Information

- **Project Name**: OCR Service
- **Description**: 使用PaddleOCR搭建简单的PDF OCR识别服务
- **Primary Language**: Unknown
- **License**: MIT
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 2
- **Forks**: 0
- **Created**: 2025-04-15
- **Last Updated**: 2025-06-12

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# OCR 服务

使用`PaddleOCR`搭建简单的PDF OCR识别服务, 可按实际需求进行修改完善.

## 1. 制作镜像

首先按照[docker-cuda-ocr-runtime](https://gitee.com/kernelstudio/docker-cuda-ocr-runtime)文档制作`cuda-ocr`运行环境.

```shell
sh build.sh
```

## 2. 启动服务

```shell
docker-compose up -d 

# 查看日志
docker logs -f ocr-service
```

命令行方式启动

```shell
docker run -ti --name ocr-service --restart always -d ocr-service
```

## 3. 停止删除容器

```shell
docker stop ocr-service && docker rm ocr-service
```

## 4. 测试上传识别

```python
import io

import requests

url = 'http://ocr-service/api/v1/open/service/ocr'

# 直接发送字节数据（例如图片二进制流）
with open('/Users/u/Downloads/36.pdf', 'rb') as f:
    raw_bytes = f.read()

doc_file = io.BytesIO(raw_bytes)
files = {'file': (
    'ocr.pdf',  # 文件名
    doc_file,  # 文件流
    'application/pdf',  # 请求头Content-Type字段对应的值
    {'Expires': '0'})
}
response = requests.post(url, files=files)
print(response.json().get('text'))

```