通用场景文字识别

覆盖多种通用场景、20+种语言的高精度整图文字检测和识别服务，包括各类印刷和手写文档、表格、印章、数字、二维码等；可用于纸质文档电子化、办公文档/报表识别、图像内容审核等场景

产品列表
特色优势
使用方式
支持交流
相关推荐

产品列表

通用文字识别

基于业界领先的深度学习技术，提供多场景、多语种、高精度的整图文字检测和识别服务

网络图片文字识别

针对网络图片进行专项优化，对艺术字体或背景复杂的文字内容具有更优的识别效果

办公文档识别

可对办公类文档的版面进行分析，输出图、表、标题、文本的位置，并输出分版块内容

表格文字识别

对单据或报表中的表格内容进行结构化识别，并以JSON或Excel形式返回

印章识别


检测并识别合同文件或常用票据中的印章，已支持圆形章、椭圆形章、方形章等常见印章

手写文字识别

支持对图片中的手写中文、手写数字进行检测和识别，针对不规则的手写字体进行专项优化，识别准确率可达90%以上

二维码识别

对二维码、条形码中对应的文字内容进行识别，返回存储的文字信息

数字识别


识别图片中的数字，适用于手机号提取、快递单号提取、充值号码提取等场景

OCR图文转换器

识别图片/PDF文件中的文本和版式，并转换为保留原文档版式的Word、Excel文档

特色优势

服务稳定

依托百度智能云技术实力，提供高可靠性、弹性可伸缩、高并发承载的公有云服务，服务可用性高达99.9%以上

多语种识别

可识别中、英、法、俄、西、葡、德、意、日、韩、中英混合等20+语种内容，并支持中、英、日、韩四语种的类型检测

准确率高

模型针对图片模糊、倾斜、翻转等情况进行专项优化，鲁棒性强，且支持2W+大字库，总体识别准确率高

使用方式

公有云服务

提供文字识别的在线服务接口，可直接调用API或使用HTTP SDK进行集成应用

离线SDK

这里是产品的集成到移动设备中（Windows、Android、iOS)，在无网、弱网环境中实现文字识别功能文案介绍

私有化部署

可部署至本地服务器或专有云，在内网/局域网中实现文字识别功能，支持 CPU/GPU 环境及主流国产化操作系统部署

支持交流

新手指南

接入AI服务的基本介绍，包括账号认证、应用创建与管理、鉴权机制、常见问题等

服务端SDK下载

标准化封装的HTTP SDK，支持Java、PHP等6种语言，快速进行服务端的API调用集成

社区交流

丰富的技术板块和精华内容，与数以万计的开发者在线交流，快速上手