news 2026/2/13 8:49:52

PaddleOCR免费调用API额度提高到3000页每天啦

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
PaddleOCR免费调用API额度提高到3000页每天啦

PaddleOCR,github 60K star,OCR效果非常好,目前是最好的OCR软件。

官网:PaddleOCR - 文档解析与智能文字识别 | 支持API调用与MCP服务 - 飞桨星河社区

除了在官网直接提交文档进行文字识别,还可以使用api调用官方的api服务,尤其是现在免费调用额度已经提高到每个模型每天3000页啦!

PaddleOCR三个模型的介绍

PaddleOCR-VL 介绍

PaddleOCR-VL是一款先进、高效的文档解析模型,专为文档中的元素识别设计。其核心组件为 PaddleOCR-VL-0.9B,这是一种紧凑而强大的视觉语言模型(VLM),它由 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型组成,能够实现精准的元素识别。该模型支持 109 种语言,并在识别复杂元素(如文本、表格、公式和图表)方面表现出色,同时保持极低的资源消耗。通过在广泛使用的公开基准与内部基准上的全面评测,PaddleOCR-VL 在页级级文档解析与元素级识别均达到 SOTA 表现。它显著优于现有的基于Pipeline方案和文档解析多模态方案以及先进的通用多模态大模型,并具备更快的推理速度。这些优势使其非常适合在真实场景中落地部署。

PP-OCRv5 介绍

OCR(光学字符识别,Optical Character Recognition)是一项将图片中的文字内容转换为可编辑文本的技术,广泛应用于文档数字化、信息提取、数据处理等场景。OCR 能够识别印刷体、手写体等多种类型的文本,帮助用户高效获取图像中的关键信息。

PP-OCRv5是 PP-OCR 系列最新一代的文字识别解决方案,专为多场景、多文字类型的识别任务设计。相比前代版本,PP-OCRv5 在文字类型支持和应用场景适应性方面实现了全面升级。该方案不仅能够返回文本行的坐标信息,还可输出对应文本内容及其置信度,有效提升了文字检测与识别的准确性和实用性,

PP-StructureV3 产线介绍

PP-StructureV3是一套高效、全面的文档解析解决方案,能够从各类文档图像和PDF文件中提取结构化信息。通过结合光学字符识别(OCR)、图像处理和深度学习等前沿技术,PP-StructureV3能够识别并提取文档中的文本块、标题、段落、图片、表格、公式、图表等多种元素,将复杂的文档内容转化为机器可读的数据格式(如Markdown、JSON),极大提升了文档数据处理的效率和准确性。

调用说明

每个模型每天3000页额度,每次调用为100页额度,如果超过100页,只会返回前100页的识别结果。

超过额度系统会返回 429 (Too Many Requests) 错误码

返回的错误码说明

错误码说明解决建议
403Token 错误检查 Token 是否正确,或 URL 是否与 Token 匹配
429超出单日解析最大页数请使用其他模型或稍后再试
500传参错误请确保参数类型及 fileType 正确
503当前请求过多请稍后再试
504网关超时请稍后再试

python调用api

其中的url使用星河社区url,每个用户会给一个单独的url和token。比如我的PaddleOCR-VLAPI_URL = "https://e3vdv522q82encq6.aistudio-app.com/layout-parsing" ,PP-OCRv5则是:API_URL = "https://a35cc4ma17eea0x4.aistudio-app.com/ocr"

# Please make sure the requests library is installed # pip install requests import base64 import os import requests # API_URL 及 TOKEN 请访问 [PaddleOCR 官网](https://aistudio.baidu.com/paddleocr/task) 在 API 调用示例中获取。 API_URL = "<your url>" TOKEN = "<access token>" file_path = "<local file path>" with open(file_path, "rb") as file: file_bytes = file.read() file_data = base64.b64encode(file_bytes).decode("ascii") headers = { "Authorization": f"token {TOKEN}", "Content-Type": "application/json" } required_payload = { "file": file_data, "fileType": <file type>, # For PDF documents, set `fileType` to 0; for images, set `fileType` to 1 } optional_payload = { "useDocOrientationClassify": False, "useDocUnwarping": False, "useChartRecognition": False, } payload = {**required_payload, **optional_payload} response = requests.post(API_URL, json=payload, headers=headers) print(response.status_code) assert response.status_code == 200 result = response.json()["result"] output_dir = "output" os.makedirs(output_dir, exist_ok=True) for i, res in enumerate(result["layoutParsingResults"]): md_filename = os.path.join(output_dir, f"doc_{i}.md") with open(md_filename, "w", encoding="utf-8") as md_file: md_file.write(res["markdown"]["text"]) print(f"Markdown document saved at {md_filename}") for img_path, img in res["markdown"]["images"].items(): full_img_path = os.path.join(output_dir, img_path) os.makedirs(os.path.dirname(full_img_path), exist_ok=True) img_bytes = requests.get(img).content with open(full_img_path, "wb") as img_file: img_file.write(img_bytes) print(f"Image saved to: {full_img_path}") for img_name, img in res["outputImages"].items(): img_response = requests.get(img) if img_response.status_code == 200: # Save image to local filename = os.path.join(output_dir, f"{img_name}_{i}.jpg") with open(filename, "wb") as f: f.write(img_response.content) print(f"Image saved to: {filename}") else: print(f"Failed to download image, status code: {img_response.status_code}")

实践

api调用

url和token获取

代码里面的token和url都可以从官网获取:

登录账户后,点击官网首页API按钮,给出的代码就已经包含了用户的url和token。

api代码中还有两个地方需要填写,

其一为:file_path = "<local file path>" ,即待文字识别的图片或pdf文件。

其二为"fileType": <file type>, 如果是 PDF 文档,填0,如果是图片,填1

调用代码

代码参考如下:

# Please make sure the requests library is installed # pip install requests import base64 import os import requests API_URL = "https://e3vdv522q82encq6.aistudio-app.com/layout-parsing" TOKEN = "6cac**" file_path = "<local file path>" with open(file_path, "rb") as file: file_bytes = file.read() file_data = base64.b64encode(file_bytes).decode("ascii") headers = { "Authorization": f"token {TOKEN}", "Content-Type": "application/json" } required_payload = { "file": file_data, "fileType": <file type>, # For PDF documents, set `fileType` to 0; for images, set `fileType` to 1 } optional_payload = { "useDocOrientationClassify": False, "useDocUnwarping": False, "useChartRecognition": False, } payload = {**required_payload, **optional_payload} response = requests.post(API_URL, json=payload, headers=headers) print(response.status_code) assert response.status_code == 200 result = response.json()["result"] output_dir = "output" os.makedirs(output_dir, exist_ok=True) for i, res in enumerate(result["layoutParsingResults"]): md_filename = os.path.join(output_dir, f"doc_{i}.md") with open(md_filename, "w", encoding="utf-8") as md_file: md_file.write(res["markdown"]["text"]) print(f"Markdown document saved at {md_filename}") for img_path, img in res["markdown"]["images"].items(): full_img_path = os.path.join(output_dir, img_path) os.makedirs(os.path.dirname(full_img_path), exist_ok=True) img_bytes = requests.get(img).content with open(full_img_path, "wb") as img_file: img_file.write(img_bytes) print(f"Image saved to: {full_img_path}") for img_name, img in res["outputImages"].items(): img_response = requests.get(img) if img_response.status_code == 200: # Save image to local filename = os.path.join(output_dir, f"{img_name}_{i}.jpg") with open(filename, "wb") as f: f.write(img_response.content) print(f"Image saved to: {filename}") else: print(f"Failed to download image, status code: {img_response.status_code}")

输出信息

输出:

901
Markdown document saved at output\doc_0.md
19307
Image saved to: output\imgs/img_in_image_box_112_116_523_426.jpg
34806
Image saved to: output\imgs/img_in_image_box_790_467_1278_840.jpg
313812
Image saved to: output\layout_det_res_0.jpg

可以看到输出了1个md文件和3个图片,是因为图片里面有一部分被识别为图片了。

原图

执行效果

补:等边△ABC,边长为a <div style="text-align: center;"><img src="imgs/img_in_image_box_112_116_523_426.jpg" alt="Image" width="32%" /></div> $$ S_{\Delta A B C}=\frac{1}{2}a\cdot\frac{\sqrt{3}}{2}a=\frac{\sqrt{3}}{4}a^{2} $$ 专题:旋转构造、—奔驰模型 已知:△ABC为等边△ $ PA=6, PB=8 PC=10 $ ① 求 $ ∠APB=150° $ <div style="text-align: center;"><img src="imgs/img_in_image_box_790_467_1278_840.jpg" alt="Image" width="38%" /></div> $$ \textcircled{2}S_{\Delta}A B C=36+25\sqrt{3} $$ 解:将△ABC绕点A逆时针旋转 $ 60^{\circ} $ 得到△AP',连接由旋转得: $ P^{\prime}A = PA = 6 \cdot 1 $ , $ P^{\prime}B = PC = 10 $ $ \angle PAP^{\prime} = 60^{\circ} $ $ \therefore \triangle PAP^{\prime} $ 为等边三角形 $ PP^{\prime} = PA = 6 $ , $ \angle APP^{\prime} = 60^{\circ} $ $ PP^{\prime} = 6 $ ,PB = 8, $ P^{\prime}B = 10 $ $ \therefore PP^{\prime\prime2} + PB^{2} = P^{\prime}B^{2} $ $ \therefore \angle BPP^{\prime} = 90^{\circ} $

效果还是可以的,我这里看着输出有点乱是因为手里的md渲染软件表现拉胯。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/29 20:51:24

django-flask基于python的大学生兼职网站的设计与实现

目录摘要关于博主开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&#xff01;摘要 随着互联网技术的快速发展&#xff0c;在线兼职平台已成为大学生获取社会实践机会的重要渠道。本文基于Python技术栈&…

作者头像 李华
网站建设 2026/2/5 18:04:43

学霸同款9个AI论文软件,本科生轻松搞定毕业论文!

学霸同款9个AI论文软件&#xff0c;本科生轻松搞定毕业论文&#xff01; 1.「千笔」—— 一站式学术支持“专家”&#xff0c;从初稿到降重一步到位&#xff08;推荐指数&#xff1a;★★★★★&#xff09;对于本科生来说&#xff0c;论文写作不仅是对知识的综合运用&#xff…

作者头像 李华
网站建设 2026/2/5 16:26:46

槽型光电开关传感器原理图设计,已量产(光电传感器)

目录 1、光电检测前端:信号的 “源” 电路 2、信号缓冲:小器件解决电平与驱动问题 3、电路工作流程:从遮挡到信号输出 4、设计细节:避免踩坑的几个小技巧 在嵌入式设备的位置限位、物料计数等场景中,槽型光电开关是性价比极高的传感器方案 —— 它通过遮挡发射器与接收…

作者头像 李华
网站建设 2026/2/5 9:15:51

零基础学习大语言模型之十四:注意力机制

本文首先介绍了自然语言处理从基于规则到深度学习的演进过程,重点分析了词嵌入技术在语义表示中的关键作用。随后详细阐述了编码器-解码器结构,引入了注意力机制和多头注意力的讨论。注意力机制是当前生成式AI取得突破的技术基础。 生成式人工智能是指通过学习训练数据的分布…

作者头像 李华
网站建设 2026/2/7 22:42:16

高性能32位MCU微控制器数字电源参考方案

在电源管理领域&#xff0c;数字电源凭借其智能化、可编程与高集成度优势&#xff0c;正逐步取代传统开关电源。数字电源不仅具备基本的电压转换功能&#xff0c;还集成了实时通信、数控调节及环境参数监测等能力&#xff0c;大幅提升了系统的可靠性与灵活性。英尚微电子基于MM…

作者头像 李华
网站建设 2026/2/13 5:32:42

导师严选2026 AI论文软件TOP10:专科生毕业论文写作全测评

导师严选2026 AI论文软件TOP10&#xff1a;专科生毕业论文写作全测评 2026年专科生论文写作工具测评&#xff1a;为何需要一份专业榜单&#xff1f; 随着AI技术在学术领域的广泛应用&#xff0c;越来越多的专科生开始借助智能写作工具提升论文效率。然而&#xff0c;市面上的AI…

作者头像 李华