easyocr

Compare original and translation side by side

🇺🇸

Original

English

🇨🇳

Translation

Chinese

easyocr

EasyOCR es un motor OCR basado en deep learning que soporta más de 80 idiomas y scripts. Funciona como alternativa/fallback a PaddleOCR con mejor rendimiento en caracteres especiales y alfabetos no latinos.

EasyOCR是一款基于深度学习的OCR引擎，支持超过80种语言和文字脚本。它可作为PaddleOCR的替代/备用方案，在特殊字符和非拉丁字母识别上表现更优。

When to use

适用场景

Usar en el

ocr_agent

como segundo motor OCR cuando PaddleOCR tiene baja confianza (< 0.7) en la extracción. Especialmente útil para documentos con caracteres árabes, cirílicos o asiáticos.

当PaddleOCR的提取置信度较低（< 0.7）时，可在

ocr_agent

中作为第二OCR引擎使用。尤其适用于包含阿拉伯文、西里尔文或亚洲文字的文档。

Instructions

使用说明

Instalar:
```
pip install easyocr
```
.

Inicializar reader con idiomas:

reader = easyocr.Reader(['es', 'en', 'fr'], gpu=True)

Ejecutar OCR:
```
results = reader.readtext(image)
```
.
Cada resultado contiene:
```
[bbox, text, confidence]
```
.
Filtrar resultados con confianza < 0.5.
Comparar resultados con PaddleOCR y usar el de mayor confianza por campo.
Normalizar texto extraído con el
```
regex_data_normalizer
```
.

安装：
```
pip install easyocr
```
。

初始化支持指定语言的读取器：

reader = easyocr.Reader(['es', 'en', 'fr'], gpu=True)

。

执行OCR识别：
```
results = reader.readtext(image)
```
。
每个返回结果包含：
```
[bbox, text, confidence]
```
。
过滤掉置信度低于0.5的结果。
将结果与PaddleOCR的输出对比，每个字段选用置信度更高的结果。
使用
```
regex_data_normalizer
```
对提取的文本进行归一化处理。

Notes

注意事项

EasyOCR es más lento que PaddleOCR (~2x); usar solo como fallback.
El modelo se descarga automáticamente la primera vez; pre-descargar en el Docker build.
No soporta MRZ de forma nativa; usar
```
mrz_parser
```
para la zona MRZ.

EasyOCR速度比PaddleOCR慢（约2倍），仅作为备用方案使用。
首次使用时会自动下载模型，建议在Docker构建阶段提前预下载。
原生不支持MRZ识别，MRZ区域请使用
```
mrz_parser
```
处理。