PP-StructureV3 Document Parsing

Relevant source files

Purpose and Scope

PP-StructureV3 is a complex document parsing pipeline that converts document images and PDFs into structured, machine-readable formats (Markdown and JSON) while preserving the original document layout and hierarchical structure. This page documents the architecture, components, configuration, and usage of PP-StructureV3.

Related Pages:

For basic text recognition without layout analysis, see PP-OCRv5 Universal Text Recognition
For intelligent Q&A and information extraction from parsed documents, see PP-ChatOCRv4 Intelligent Document Understanding
For vision-language model-based document parsing, see PaddleOCR-VL Vision-Language Model

Scope: This page covers the PP-StructureV3 pipeline architecture, module composition, configuration parameters, inference workflows, and output formats. Training individual modules is covered in their respective module documentation pages.

Overview and Position in Ecosystem

PP-StructureV3 is one of the four core pipelines in PaddleOCR 3.x, designed specifically for complex document understanding tasks. It extends basic OCR capabilities with comprehensive layout analysis and specialized element recognition.

Key Differentiators:

vs PP-OCRv5: Adds layout understanding and element-specific recognition
vs PaddleOCR-VL: Uses pipeline approach instead of VLM; more modular and customizable
vs PP-StructureV2: Enhanced layout detection (20 vs 17 categories), improved table/formula recognition, added chart parsing and multi-column reading order

Sources: README.md1-30 docs/version3.x/pipeline_usage/PP-StructureV3.md1-20 docs/version3.x/pipeline_usage/PP-StructureV3.en.md1-20

Architecture and Components

PP-StructureV3 follows a modular pipeline architecture where different modules process specific document elements. The pipeline class PPStructureV3 inherits from PaddleXPipelineWrapper to integrate with the PaddleX infrastructure.

Component Architecture

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md11-20 docs/version3.x/pipeline_usage/PP-StructureV3.en.md11-20

Module Composition

PP-StructureV3 consists of seven modules or subpipelines:

Module	Purpose	Optional	Models
Layout Detection	Identify document regions (text, table, formula, image, seal, etc.)	No	PP-DocLayout_plus-L, PP-DocBlockLayout, PP-DocLayout-L/M/S
General OCR	Extract text from detected regions	No	PP-OCRv5, PP-OCRv4 (detection + recognition)
Document Preprocessing	Correct orientation and distortion	Yes	PP-LCNet_x1_0_doc_ori, UVDoc
Table Recognition V2	Parse table structure and content	Yes	SLANeXt_wired, SLANeXt_wireless, PP-TableMagic
Seal Text Recognition	Recognize curved seal text	Yes	PP-OCRv4 seal detection
Formula Recognition	Convert formulas to LaTeX	Yes	PP-FormulaNet, UniMERNet
Chart Parsing	Extract data from charts	Yes	PP-Chart2Table

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md11-20 docs/version3.x/pipeline_usage/PP-StructureV3.en.md11-20

Layout Categories

The default layout detection model (PP-DocLayout_plus-L) recognizes 20 categories:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md82-106 docs/version3.x/pipeline_usage/PP-StructureV3.en.md82-106

Pipeline Workflow

The PP-StructureV3 pipeline processes documents through a multi-stage workflow, with each stage handling specific document elements.

Data Flow

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md700-800 docs/version3.x/pipeline_usage/PP-StructureV3.en.md700-800

Region Processing Logic

Each detected region is processed based on its category:

Region Type	Processing Module	Output Format
`text`, `paragraph title`, `document title`	OCR Subpipeline	Plain text with bounding boxes
`table`	Table Recognition V2	HTML table structure + cell content
`formula`	Formula Recognition	LaTeX source code
`seal`	Seal Text Recognition	Curved text content
`chart`	Chart Parsing	Extracted table data
`image`, `figure`	Image Handler	Image file path/reference
`page number`, `header`, `footer`	OCR or Skip	Text or ignored based on config

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md800-900

Module Details

Layout Detection Module

The layout detection module identifies and localizes different document regions. PP-StructureV3 uses PP-DocLayout_plus-L by default.

Key Models:

PP-DocLayout_plus-L: 83.2% [email protected], 20 categories, 126MB
PP-DocBlockLayout: 95.9% [email protected], 1 category (Block), 124MB for sub-region detection
PP-DocLayout-L/M/S: 23-category models (90.4% / 75.2% / 70.9% mAP)

Configuration:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md79-320 docs/version3.x/pipeline_usage/layout_detection.md

Table Recognition V2 Subpipeline

PP-StructureV3 uses an enhanced table recognition approach with separate handling for wired and wireless tables.

Architecture:

Key Models:

SLANeXt_wired: 69.65% accuracy, 351MB, for tables with borders
SLANeXt_wireless: 69.65% accuracy, 351MB, for borderless tables
Table Classifier: Automatically determines table type

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md322-360 docs/version3.x/pipeline_usage/table_recognition_v2.md

Formula Recognition Subpipeline

Converts mathematical formulas in images to LaTeX source code.

Models:

PP-FormulaNet: 85.09% BLEU score, 88MB, optimized for printed formulas
UniMERNet: 90.83% ExpRate, 1030MB, handles complex and handwritten formulas

Configuration:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md360-420 docs/version3.x/pipeline_usage/formula_recognition.md

Chart Parsing Module

Extracts structured data from chart images using the PP-Chart2Table model.

Capabilities:

Converts bar charts, line charts, pie charts to tabular data
Outputs both parsed table and original image
Metric: RMS-F1 80.60%

Configuration:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md420-460 README.md171-173

Seal Text Recognition Subpipeline

Specialized for recognizing curved text in seals/stamps.

Components:

Seal text detection (curved bounding polygons)
OCR recognition adapted for curved text
Integration with layout detection to locate seals

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md460-520 docs/version3.x/pipeline_usage/seal_recognition.md

Configuration System

PP-StructureV3 configuration follows the PaddleX hierarchical structure with pipeline-level and module-level parameters.

Configuration Hierarchy

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md520-640

Key Configuration Parameters

Pipeline-Level Parameters:

Parameter	Type	Default	Description
`layout_detection_model_name`	str	`"PP-DocLayout_plus-L"`	Layout detection model
`use_doc_orientation_classify`	bool	`False`	Enable document orientation correction
`use_doc_unwarping`	bool	`False`	Enable document unwarping
`use_doc_block_layout`	bool	`False`	Enable sub-region detection
`use_table_recognition`	bool	`True`	Enable table parsing
`use_formula_recognition`	bool	`True`	Enable formula recognition
`use_seal_text_detection`	bool	`True`	Enable seal text recognition
`use_chart_parsing`	bool	`True`	Enable chart parsing
`page_range`	list	`[0, None]`	Page range for PDF processing
`save_path`	str	`"./output"`	Output directory

Module-Level Parameters:

Module	Key Parameters
Layout Detection	`layout_detection_batch_size`, `layout_detection_device`
Text Detection	`text_detection_model_name`, `text_detection_batch_size`
Text Recognition	`text_recognition_model_name`, `text_recognition_batch_size`
Table Recognition	`table_recognition_model_name`, `table_classifier_model_name`
Formula Recognition	`formula_recognition_model_name`, `formula_recognition_batch_size`

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md640-700

Configuration File Format

PP-StructureV3 supports YAML configuration files:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1800-1900

Usage Examples

Command Line Interface

Basic usage:

With configuration file:

Batch processing with options:

Specific page range:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md900-1000 docs/version3.x/pipeline_usage/PP-StructureV3.en.md900-1000

Python API Usage

Basic inference:

With preprocessing:

Custom model configuration:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1000-1200 docs/version3.x/pipeline_usage/PP-StructureV3.en.md1000-1200

Batch Processing

Process multiple files:

Process specific page ranges:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1200-1300

Output Formats

PP-StructureV3 generates structured outputs in multiple formats to support different downstream applications.

Output Structure

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1600-1700

Markdown Output

The Markdown output preserves document structure and hierarchy:

Features:

Hierarchical headers (# ## ###) for document/section/paragraph titles
Tables in Markdown format
LaTeX formulas in $...$ or $$...$$ blocks
Image references with paths
Multi-column reading order preserved

Example:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1700-1800

JSON Output

The JSON output provides machine-readable structured data:

Schema:

Field Descriptions:

type: Region category (text, table, formula, image, seal, chart, etc.)
bbox: Bounding box coordinates [x1, y1, x2, y2]
score: Detection confidence score
content: Recognized text content
html: Table structure in HTML format
latex: Formula in LaTeX format
order: Reading order in document

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1800-2000

Result Access in Python

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md2000-2100

Reading Order Recovery

PP-StructureV3 includes sophisticated reading order recovery for multi-column layouts, essential for preserving document semantics.

Multi-Column Sorting Algorithm

The pipeline uses block-level layout detection and spatial analysis to determine reading order:

Algorithm:

Detect layout blocks using PP-DocBlockLayout (if enabled)
Cluster regions into columns based on x-coordinates
Sort columns left-to-right
Within each column, sort regions top-to-bottom
Assign global reading order

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md110-135

Performance Considerations

Model Selection Guidelines

Scenario	Recommended Configuration	Rationale
High accuracy	`PP-DocLayout_plus-L` + `PP-OCRv5_server` + `UniMERNet`	Best accuracy across all modules
Balanced	`PP-DocLayout-M` + `PP-OCRv5_mobile` + `PP-FormulaNet`	Good accuracy/speed tradeoff
High speed	`PP-DocLayout-S` + `PP-OCRv5_mobile` + disabled optional modules	Minimal processing time
Server deployment	`PP-DocLayout_plus-L` + all features enabled	Leverage GPU acceleration
Edge/Mobile	`PP-DocLayout-S` + selective features	Minimize memory/compute

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md700-750

Batch Size Optimization

GPU Memory Constraints:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md640-700

Feature Toggle Impact

Disabling optional modules can significantly improve speed:

Configuration	Relative Speed	Use Case
All features enabled	1.0x (baseline)	Complete document understanding
No preprocessing	1.3x	Clean, well-oriented documents
No table recognition	2.0x	Documents without tables
No formula recognition	1.5x	Non-technical documents
No chart parsing	1.2x	Documents without charts
Text-only (all optional disabled)	3.0x	Simple text extraction

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md2-100

Integration with PaddleX

PP-StructureV3 inherits from PaddleXPipelineWrapper to integrate with PaddleX infrastructure.

Integration Architecture

Key Integration Points:

Configuration transformation from flat to hierarchical format
Hardware abstraction (GPU/XPU/NPU/MLU/DCU/CPU)
Model management and caching
Deployment backend selection (Paddle/ONNX/TensorRT)

Sources: README.md80-82 High-level architecture diagrams

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1-2500 docs/version3.x/pipeline_usage/PP-StructureV3.en.md1-2500

PP-StructureV3 Document Parsing

Relevant source files

Purpose and Scope

Related Pages:

For basic text recognition without layout analysis, see PP-OCRv5 Universal Text Recognition
For intelligent Q&A and information extraction from parsed documents, see PP-ChatOCRv4 Intelligent Document Understanding
For vision-language model-based document parsing, see PaddleOCR-VL Vision-Language Model

Overview and Position in Ecosystem

Key Differentiators:

vs PP-OCRv5: Adds layout understanding and element-specific recognition
vs PaddleOCR-VL: Uses pipeline approach instead of VLM; more modular and customizable
vs PP-StructureV2: Enhanced layout detection (20 vs 17 categories), improved table/formula recognition, added chart parsing and multi-column reading order

Sources: README.md1-30 docs/version3.x/pipeline_usage/PP-StructureV3.md1-20 docs/version3.x/pipeline_usage/PP-StructureV3.en.md1-20

Architecture and Components

Component Architecture

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md11-20 docs/version3.x/pipeline_usage/PP-StructureV3.en.md11-20

Module Composition

PP-StructureV3 consists of seven modules or subpipelines:

Module	Purpose	Optional	Models
Layout Detection	Identify document regions (text, table, formula, image, seal, etc.)	No	PP-DocLayout_plus-L, PP-DocBlockLayout, PP-DocLayout-L/M/S
General OCR	Extract text from detected regions	No	PP-OCRv5, PP-OCRv4 (detection + recognition)
Document Preprocessing	Correct orientation and distortion	Yes	PP-LCNet_x1_0_doc_ori, UVDoc
Table Recognition V2	Parse table structure and content	Yes	SLANeXt_wired, SLANeXt_wireless, PP-TableMagic
Seal Text Recognition	Recognize curved seal text	Yes	PP-OCRv4 seal detection
Formula Recognition	Convert formulas to LaTeX	Yes	PP-FormulaNet, UniMERNet
Chart Parsing	Extract data from charts	Yes	PP-Chart2Table

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md11-20 docs/version3.x/pipeline_usage/PP-StructureV3.en.md11-20

Layout Categories

The default layout detection model (PP-DocLayout_plus-L) recognizes 20 categories:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md82-106 docs/version3.x/pipeline_usage/PP-StructureV3.en.md82-106

Pipeline Workflow

The PP-StructureV3 pipeline processes documents through a multi-stage workflow, with each stage handling specific document elements.

Data Flow

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md700-800 docs/version3.x/pipeline_usage/PP-StructureV3.en.md700-800

Region Processing Logic

Each detected region is processed based on its category:

Region Type	Processing Module	Output Format
`text`, `paragraph title`, `document title`	OCR Subpipeline	Plain text with bounding boxes
`table`	Table Recognition V2	HTML table structure + cell content
`formula`	Formula Recognition	LaTeX source code
`seal`	Seal Text Recognition	Curved text content
`chart`	Chart Parsing	Extracted table data
`image`, `figure`	Image Handler	Image file path/reference
`page number`, `header`, `footer`	OCR or Skip	Text or ignored based on config

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md800-900

Module Details

Layout Detection Module

The layout detection module identifies and localizes different document regions. PP-StructureV3 uses PP-DocLayout_plus-L by default.

Key Models:

PP-DocLayout_plus-L: 83.2% [email protected], 20 categories, 126MB
PP-DocBlockLayout: 95.9% [email protected], 1 category (Block), 124MB for sub-region detection
PP-DocLayout-L/M/S: 23-category models (90.4% / 75.2% / 70.9% mAP)

Configuration:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md79-320 docs/version3.x/pipeline_usage/layout_detection.md

Table Recognition V2 Subpipeline

PP-StructureV3 uses an enhanced table recognition approach with separate handling for wired and wireless tables.

Architecture:

Key Models:

SLANeXt_wired: 69.65% accuracy, 351MB, for tables with borders
SLANeXt_wireless: 69.65% accuracy, 351MB, for borderless tables
Table Classifier: Automatically determines table type

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md322-360 docs/version3.x/pipeline_usage/table_recognition_v2.md

Formula Recognition Subpipeline

Converts mathematical formulas in images to LaTeX source code.

Models:

PP-FormulaNet: 85.09% BLEU score, 88MB, optimized for printed formulas
UniMERNet: 90.83% ExpRate, 1030MB, handles complex and handwritten formulas

Configuration:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md360-420 docs/version3.x/pipeline_usage/formula_recognition.md

Chart Parsing Module

Extracts structured data from chart images using the PP-Chart2Table model.

Capabilities:

Converts bar charts, line charts, pie charts to tabular data
Outputs both parsed table and original image
Metric: RMS-F1 80.60%

Configuration:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md420-460 README.md171-173

Seal Text Recognition Subpipeline

Specialized for recognizing curved text in seals/stamps.

Components:

Seal text detection (curved bounding polygons)
OCR recognition adapted for curved text
Integration with layout detection to locate seals

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md460-520 docs/version3.x/pipeline_usage/seal_recognition.md

Configuration System

PP-StructureV3 configuration follows the PaddleX hierarchical structure with pipeline-level and module-level parameters.

Configuration Hierarchy

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md520-640

Key Configuration Parameters

Pipeline-Level Parameters:

Parameter	Type	Default	Description
`layout_detection_model_name`	str	`"PP-DocLayout_plus-L"`	Layout detection model
`use_doc_orientation_classify`	bool	`False`	Enable document orientation correction
`use_doc_unwarping`	bool	`False`	Enable document unwarping
`use_doc_block_layout`	bool	`False`	Enable sub-region detection
`use_table_recognition`	bool	`True`	Enable table parsing
`use_formula_recognition`	bool	`True`	Enable formula recognition
`use_seal_text_detection`	bool	`True`	Enable seal text recognition
`use_chart_parsing`	bool	`True`	Enable chart parsing
`page_range`	list	`[0, None]`	Page range for PDF processing
`save_path`	str	`"./output"`	Output directory

Module-Level Parameters:

Module	Key Parameters
Layout Detection	`layout_detection_batch_size`, `layout_detection_device`
Text Detection	`text_detection_model_name`, `text_detection_batch_size`
Text Recognition	`text_recognition_model_name`, `text_recognition_batch_size`
Table Recognition	`table_recognition_model_name`, `table_classifier_model_name`
Formula Recognition	`formula_recognition_model_name`, `formula_recognition_batch_size`

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md640-700

Configuration File Format

PP-StructureV3 supports YAML configuration files:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1800-1900

Usage Examples

Command Line Interface

Basic usage:

With configuration file:

Batch processing with options:

Specific page range:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md900-1000 docs/version3.x/pipeline_usage/PP-StructureV3.en.md900-1000

Python API Usage

Basic inference:

With preprocessing:

Custom model configuration:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1000-1200 docs/version3.x/pipeline_usage/PP-StructureV3.en.md1000-1200

Batch Processing

Process multiple files:

Process specific page ranges:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1200-1300

Output Formats

PP-StructureV3 generates structured outputs in multiple formats to support different downstream applications.

Output Structure

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1600-1700

Markdown Output

The Markdown output preserves document structure and hierarchy:

Features:

Hierarchical headers (# ## ###) for document/section/paragraph titles
Tables in Markdown format
LaTeX formulas in $...$ or $$...$$ blocks
Image references with paths
Multi-column reading order preserved

Example:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1700-1800

JSON Output

The JSON output provides machine-readable structured data:

Schema:

Field Descriptions:

type: Region category (text, table, formula, image, seal, chart, etc.)
bbox: Bounding box coordinates [x1, y1, x2, y2]
score: Detection confidence score
content: Recognized text content
html: Table structure in HTML format
latex: Formula in LaTeX format
order: Reading order in document

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1800-2000

Result Access in Python

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md2000-2100

Reading Order Recovery

PP-StructureV3 includes sophisticated reading order recovery for multi-column layouts, essential for preserving document semantics.

Multi-Column Sorting Algorithm

The pipeline uses block-level layout detection and spatial analysis to determine reading order:

Algorithm:

Detect layout blocks using PP-DocBlockLayout (if enabled)
Cluster regions into columns based on x-coordinates
Sort columns left-to-right
Within each column, sort regions top-to-bottom
Assign global reading order

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md110-135

Performance Considerations

Model Selection Guidelines

Scenario	Recommended Configuration	Rationale
High accuracy	`PP-DocLayout_plus-L` + `PP-OCRv5_server` + `UniMERNet`	Best accuracy across all modules
Balanced	`PP-DocLayout-M` + `PP-OCRv5_mobile` + `PP-FormulaNet`	Good accuracy/speed tradeoff
High speed	`PP-DocLayout-S` + `PP-OCRv5_mobile` + disabled optional modules	Minimal processing time
Server deployment	`PP-DocLayout_plus-L` + all features enabled	Leverage GPU acceleration
Edge/Mobile	`PP-DocLayout-S` + selective features	Minimize memory/compute

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md700-750

Batch Size Optimization

GPU Memory Constraints:

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md640-700

Feature Toggle Impact

Disabling optional modules can significantly improve speed:

Configuration	Relative Speed	Use Case
All features enabled	1.0x (baseline)	Complete document understanding
No preprocessing	1.3x	Clean, well-oriented documents
No table recognition	2.0x	Documents without tables
No formula recognition	1.5x	Non-technical documents
No chart parsing	1.2x	Documents without charts
Text-only (all optional disabled)	3.0x	Simple text extraction

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md2-100

Integration with PaddleX

PP-StructureV3 inherits from PaddleXPipelineWrapper to integrate with PaddleX infrastructure.

Integration Architecture

Key Integration Points:

Configuration transformation from flat to hierarchical format
Hardware abstraction (GPU/XPU/NPU/MLU/DCU/CPU)
Model management and caching
Deployment backend selection (Paddle/ONNX/TensorRT)

Sources: README.md80-82 High-level architecture diagrams

Sources: docs/version3.x/pipeline_usage/PP-StructureV3.md1-2500 docs/version3.x/pipeline_usage/PP-StructureV3.en.md1-2500

PP-StructureV3 Document Parsing

Purpose and Scope

Overview and Position in Ecosystem

Architecture and Components

Component Architecture

Module Composition

Layout Categories

Pipeline Workflow

Data Flow

Region Processing Logic

Module Details

Layout Detection Module

Table Recognition V2 Subpipeline

Formula Recognition Subpipeline

Chart Parsing Module

Seal Text Recognition Subpipeline

Configuration System

Configuration Hierarchy

Key Configuration Parameters

Configuration File Format

Usage Examples

Command Line Interface

Python API Usage

Batch Processing

Output Formats

Output Structure

Markdown Output

JSON Output

Result Access in Python

Reading Order Recovery

Multi-Column Sorting Algorithm

Performance Considerations

Model Selection Guidelines

Batch Size Optimization

Feature Toggle Impact

Integration with PaddleX

Integration Architecture

Related Documentation

On this page

PP-StructureV3 Document Parsing

Purpose and Scope

Overview and Position in Ecosystem

Architecture and Components

Component Architecture

Module Composition

Layout Categories

Pipeline Workflow

Data Flow

Region Processing Logic

Module Details

Layout Detection Module

Table Recognition V2 Subpipeline

Formula Recognition Subpipeline

Chart Parsing Module

Seal Text Recognition Subpipeline

Configuration System

Configuration Hierarchy

Key Configuration Parameters

Configuration File Format

Usage Examples

Command Line Interface

Python API Usage

Batch Processing

Output Formats

Output Structure

Markdown Output

JSON Output

Result Access in Python

Reading Order Recovery

Multi-Column Sorting Algorithm

Performance Considerations

Model Selection Guidelines

Batch Size Optimization

Feature Toggle Impact

Integration with PaddleX

Integration Architecture

Related Documentation

On this page