通用场景文字识别

覆盖多种通用场景、20+种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、表格、印章、数字、二维码等;可用于纸质文档电子化、办公文档/报表识别、图像内容审核等场景

  • 产品列表
  • 特色优势
  • 使用方式
  • 支持交流
  • 相关推荐

产品列表

  • 通用文字识别

    基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务
  • 网络图片文字识别

    针对网络图片进行专项优化,对艺术字体或背景复杂的文字内容具有更优的识别效果
  • 办公文档识别

    可对办公类文档的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容
  • 表格文字识别

    对单据或报表中的表格内容进行结构化识别,并以JSON或Excel形式返回
  • 印章识别

    
    检测并识别合同文件或常用票据中的印章,已支持圆形章、椭圆形章、方形章等常见印章
  • 手写文字识别

    支持对图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化,识别准确率可达90%以上
  • 二维码识别

    对二维码、条形码中对应的文字内容进行识别,返回存储的文字信息
  • 数字识别

    
    识别图片中的数字,适用于手机号提取、快递单号提取、充值号码提取等场景
  • OCR图文转换器

    识别图片/PDF文件中的文本和版式,并转换为保留原文档版式的Word、Excel文档

特色优势

服务稳定

依托百度智能云技术实力,提供高可靠性、弹性可伸缩、高并发承载的公有云服务,服务可用性高达99.9%以上

多语种识别

可识别中、英、法、俄、西、葡、德、意、日、韩、中英混合等20+语种内容,并支持中、英、日、韩四语种的类型检测

准确率高

模型针对图片模糊、倾斜、翻转等情况进行专项优化,鲁棒性强,且支持2W+大字库,总体识别准确率高

使用方式

公有云服务
提供文字识别的在线服务接口,可直接调用API或使用HTTP SDK进行集成应用
离线SDK
这里是产品的集成到移动设备中(Windows、Android、iOS),在无网、弱网环境中实现文字识别功能文案介绍
私有化部署
可部署至本地服务器或专有云,在内网/局域网中实现文字识别功能,支持 CPU/GPU 环境及主流国产化操作系统部署

支持交流

新手指南

接入AI服务的基本介绍,包括账号认证、应用创建与管理、鉴权机制、常见问题等

服务端SDK下载

标准化封装的HTTP SDK,支持Java、PHP等6种语言,快速进行服务端的API调用集成

社区交流

丰富的技术板块和精华内容,与数以万计的开发者在线交流,快速上手

相关推荐

未登录
需要实名认证