easyocr

Compare original and translation side by side

🇺🇸

Original

English
🇨🇳

Translation

Chinese

easyocr

easyocr

EasyOCR es un motor OCR basado en deep learning que soporta más de 80 idiomas y scripts. Funciona como alternativa/fallback a PaddleOCR con mejor rendimiento en caracteres especiales y alfabetos no latinos.
EasyOCR是一款基于深度学习的OCR引擎,支持超过80种语言和文字脚本。它可作为PaddleOCR的替代/备用方案,在特殊字符和非拉丁字母识别上表现更优。

When to use

适用场景

Usar en el
ocr_agent
como segundo motor OCR cuando PaddleOCR tiene baja confianza (< 0.7) en la extracción. Especialmente útil para documentos con caracteres árabes, cirílicos o asiáticos.
当PaddleOCR的提取置信度较低(< 0.7)时,可在
ocr_agent
中作为第二OCR引擎使用。尤其适用于包含阿拉伯文、西里尔文或亚洲文字的文档。

Instructions

使用说明

  1. Instalar:
    pip install easyocr
    .
  2. Inicializar reader con idiomas:
    reader = easyocr.Reader(['es', 'en', 'fr'], gpu=True)
    .
  3. Ejecutar OCR:
    results = reader.readtext(image)
    .
  4. Cada resultado contiene:
    [bbox, text, confidence]
    .
  5. Filtrar resultados con confianza < 0.5.
  6. Comparar resultados con PaddleOCR y usar el de mayor confianza por campo.
  7. Normalizar texto extraído con el
    regex_data_normalizer
    .
  1. 安装:
    pip install easyocr
  2. 初始化支持指定语言的读取器:
    reader = easyocr.Reader(['es', 'en', 'fr'], gpu=True)
  3. 执行OCR识别:
    results = reader.readtext(image)
  4. 每个返回结果包含:
    [bbox, text, confidence]
  5. 过滤掉置信度低于0.5的结果。
  6. 将结果与PaddleOCR的输出对比,每个字段选用置信度更高的结果。
  7. 使用
    regex_data_normalizer
    对提取的文本进行归一化处理。

Notes

注意事项

  • EasyOCR es más lento que PaddleOCR (~2x); usar solo como fallback.
  • El modelo se descarga automáticamente la primera vez; pre-descargar en el Docker build.
  • No soporta MRZ de forma nativa; usar
    mrz_parser
    para la zona MRZ.
  • EasyOCR速度比PaddleOCR慢(约2倍),仅作为备用方案使用。
  • 首次使用时会自动下载模型,建议在Docker构建阶段提前预下载。
  • 原生不支持MRZ识别,MRZ区域请使用
    mrz_parser
    处理。