当前位置: 首页 > news >正文

黃冈建设厅官方网站网站开发平台是什么

黃冈建设厅官方网站,网站开发平台是什么,东莞网站建设及外包,wordpress 添加页面前言 因项目需要#xff0c;调研了一下目前市面上一些开源的OCR工具#xff0c;支持本地部署#xff0c;非调用API#xff0c;主要有PaddleOCR/CnOCR/chinese_lite OCR/EasyOCR/Tesseract/chineseocr/mmocr这几款产品。 本文主要尝试了EasyOCR/CnOCR/Tesseract/PaddleOCR这…前言 因项目需要调研了一下目前市面上一些开源的OCR工具支持本地部署非调用API主要有PaddleOCR/CnOCR/chinese_lite OCR/EasyOCR/Tesseract/chineseocr/mmocr这几款产品。 本文主要尝试了EasyOCR/CnOCR/Tesseract/PaddleOCR这四款产品。 EasyOCR EasyOCR官方仓库https://github.com/JaidedAI/EasyOCR 安装EasyOCR pip install easyocr测试例程 import easyocr reader easyocr.Reader([ch_sim,en]) # this needs to run only once to load the model into memory result reader.readtext(chinese.jpg)实测EasyOCR对cuda的要求比较严格在一个pytorch正常的环境中运行之后会报错 Could not load symbol cublasGetSmCountTarget from cublas64_11.dll. Error code 127#833提到了该问题谈及原因可能是cuda和cudnn不匹配更换cudnn之后报错仍未消失遂暂置不提。 CnOCR CnOCR官方仓库https://github.com/breezedeus/CnOCR CnOCR安装 pip install cnocrCnOCR的环境要求比较严格其在requirements.txt写了非常多的依赖版本号因此如果在现有环境中直接安装它会将Pytorch等依赖卸载重装比较坑使用最好先单开新环境。 测试例程 from cnocr import CnOcrimg_fp img/output_2.png ocr CnOcr() # 所有参数都使用默认值 out ocr.ocr(img_fp) print(out)实测在我的业务场景下使用默认模型效果不太行。 Tesseract Tesseract官方仓库https://github.com/tesseract-ocr/tesseract Tesseract是用C进行开发的因此如果要在python中进行使用需要借助第三方依赖pytesseract 首先需要在本机上安装Tesseract 安装包下载地址https://digi.bib.uni-mannheim.de/tesseract/ 安装过程可参考https://blog.csdn.net/weixin_51571728/article/details/120384909 配置完成后在命令行输入tesseract -v打印出版本信息则表示安装成功。 之后安装pytesseract pip install pytesseract测试例程 img_path img/img_1.png # 添加tesseract的路径 pytesseract.pytesseract.tesseract_cmd rC:\Users\zxy\AppData\Local\Programs\Tesseract-OCR\tesseract.exeimage_to_string()如果识别英文或数字可以不必额外参数如果识别其他语言则需要加上lang参数 langchi_sim表示要识别的是中文简体 没有识别出来时返回空白text pytesseract.image_to_string(Image.open(img_path), langchi_sim) print(text)实测这个效果在我的场景也表现一般并且tesseract对于中英文有不同的模型泛用性不是很好。 PaddleOCR PaddleOCR是百度旗下的产品目前已经迭代到第四版。 PaddleOCR官方仓库https://github.com/PaddlePaddle/PaddleOCR PaddleOCR安装 pip install paddleocr测试例程 import cv2 from paddleocr import PaddleOCRif __name__ __main__:ocr PaddleOCR(use_angle_clsTrue, langch, ocr_versionPP-OCRv4)image_input_fullname img/output_5.pngimg cv2.imread(image_input_fullname)result ocr.ocr(img, clsTrue)print(result)根据PP-OCRv4的介绍文档PP-OCRv4在训练时以(32,320), (48,320), (64,320)三个不同尺度上进行训练。 实测发现当文字区域小于这个范围时效果会受到影响因此可以引入padding策略即在文字区域范围周边加一圈白边使输入模型的图片分辨率提升。 import cv2 from paddleocr import PaddleOCRdef add_padding_to_image(image, output_size(640, 640), color(255, 255, 255)):h, w image.shape[:2]# 计算需要添加的padding大小delta_w max(output_size[0] - w, 0)delta_h max(output_size[1] - h, 0)top, bottom delta_h // 2, delta_h - (delta_h // 2)left, right delta_w // 2, delta_w - (delta_w // 2)# 添加paddingpadded_image cv2.copyMakeBorder(image, top, bottom, left, right, cv2.BORDER_CONSTANT, valuecolor)return padded_imageif __name__ __main__:ocr PaddleOCR(use_angle_clsTrue, langch, ocr_versionPP-OCRv4)image_input_fullname img/output_5.pngimg cv2.imread(image_input_fullname)padded_img add_padding_to_image(img)result ocr.ocr(img, clsTrue)print(result)在我的业务场景中PaddleOCR的表现最好基本能达到80%以上的识别准确率如果还需要提升还可以根据自己的数据再训练。 标注工具PPOCRLabelv2 使用文档https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.5/PPOCRLabel/README_ch.md 训练文档https://aistudio.baidu.com/modelsdetail/270?modelId270
http://www.eeditor.cn/news/120076/

相关文章:

  • wap网站在线生成app爱空间装修公司属于什么档次
  • 自己建设网站在哪里建设深圳网站建设微信商城开发
  • 长沙律师网站建设拖拽式建站wordpress
  • 营销型企业网站一般具有哪些功能手机网站开发人员工具
  • 东莞建设年审网站怎么做免费公司网站
  • 网站缩略图代码简历模板手机版填写免费
  • 物流网站建设与管理南京网站建设小程序
  • 做网站哪一家公司好怎么做网站一张图
  • 网站排名查询系统寒假网页设计培训珿
  • 中小企业网站建设与管理课件百度云广州建设工程交易中心电话
  • 什么是营销型的网站推广西安网站建设阳建
  • 郑州网站制作郑州网站制作2017织梦网站怎么做seo
  • 成都哪家做网站好找别人做的网站怎样修改
  • 广州 网站建设 制作python微信网站开发
  • 免费网站建设培训学校一个人做网站 知乎
  • 惠州网站建设服务商进入秦皇岛最新规定
  • 网站上用什么格式的图片做阿里巴巴的网站的费用
  • 国际网站建设公司广州建站费用
  • python 做网站模块泊头网站制作案例
  • 网站模版上线需要什么意思网站交换链接如何实施
  • 建造个网站花多少钱网站怎么做的精致一点
  • 大连网站搭建与推广向祖国建设者致敬网站
  • 昆山规建设局网站免费在线网站
  • 关于建筑设计的网站免费软件库
  • 阿里巴巴网站建设的功能定位企业wordpress主题下载地址
  • 网站建设企业营销自己怎么做网站空间
  • 深圳网站建设公司招聘电话销售地图标注申请入口免费
  • 石排网站建设军事最新新闻头条
  • 做模具在哪个网站找工作网站规划与设计方向
  • 网站备案 管局审核 需要多长时间企业邮箱地址格式