当前位置: 首页 > news >正文

重庆网站快速排名优化网站开发企业组织结构

重庆网站快速排名优化,网站开发企业组织结构,凌峰wordpress百度云,福建省住房和城乡建设局网站微信公众号“dotNET跨平台”的文章《c#实现图片文体提取》#xff08;参考文献3#xff09;介绍了C#图像文本识别模块Tesseract#xff0c;后者是tesseract-ocr#xff08;参考文献2#xff09; 的C#封装版本#xff0c;目前版本为5.2#xff0c;关于Tesseract的详细介绍…  微信公众号“dotNET跨平台”的文章《c#实现图片文体提取》参考文献3介绍了C#图像文本识别模块Tesseract后者是tesseract-ocr参考文献2 的C#封装版本目前版本为5.2关于Tesseract的详细介绍请见参考文献1和5本文主要测试Tesseract模块的基本用法。   之前测试过IronOCR和PaddleSharp本文复用IronOCR的测试代码在NuGet包管理器中安装Tesseract包如下图所示   主要调用TesseractEngine类加载语言包、设置识别语言等其构造函数原型如下所示。其中输入参数中的datapath指定语言包路径安装NuGet包时不会安装语言包需要单独下载可以在参考文献2或者Tesseract官网中下载language参数指定识别语言语言名称对应语言包中文件名的开头部分如chi_sim.traineddata对应的简体中文语言为chi_simeng.traineddata对应的英文为engengineMode参数对应的是识别引擎类型其可选值如下所示。 public TesseractEngine(string datapath, string language, EngineMode engineMode)public enum EngineMode {//// 摘要:// Only the legacy tesseract OCR engine is used.TesseractOnly,//// 摘要:// Only the new LSTM-based OCR engine is used.LstmOnly,//// 摘要:// Both the legacy and new LSTM based OCR engine is used.TesseractAndLstm,//// 摘要:// The default OCR engine is used (currently LSTM-ased OCR engine).Default }调用TesseractEngine类中的Process函数识别图片内容其函数原型如下第一个参数指定待识别的图片Pix类为Tesseract模块自带类可以调用Pix.LoadFromFile函数生成实例对象第二个参数为图片处理方式取值见下面代码所示。Process函数返回Page类实例对象从中可以获取识别结果。 public Page Process(Pix image, PageSegMode? pageSegMode null)public enum PageSegMode {//// 摘要:// Orientation and script detection (OSD) only.OsdOnly,//// 摘要:// Automatic page sementation with orientantion and script detection (OSD).AutoOsd,//// 摘要:// Automatic page segmentation, but no OSD, or OCR.AutoOnly,//// 摘要:// Fully automatic page segmentation, but no OSD.Auto,//// 摘要:// Assume a single column of text of variable sizes.SingleColumn,//// 摘要:// Assume a single uniform block of vertically aligned text.SingleBlockVertText,//// 摘要:// Assume a single uniform block of text.SingleBlock,//// 摘要:// Treat the image as a single text line.SingleLine,//// 摘要:// Treat the image as a single word.SingleWord,//// 摘要:// Treat the image as a single word in a circle.CircleWord,//// 摘要:// Treat the image as a single character.SingleChar,SparseText,//// 摘要:// Sparse text with orientation and script detection.SparseTextOsd,//// 摘要:// Treat the image as a single text line, bypassing hacks that are specific to Tesseract.RawLine,//// 摘要:// Number of enum entries.Count }Page类中通过调用GetText函数获取图片中所有识别出的汇总的文本其还支持如下函数获取文本内容或文本区域信息后续会继续学习其用法。   采用Tesseract模块的基本用法得到的图片文字识别效果如下所示。大部分可以识别出来但是识别带车牌的图片不管是Tesseract还是之前的IronOCR和PaddleSharp效果都比较差不清楚是设置的问题还是语言包用得不对。 参考文献 [1]https://github.com/charlesw/tesseract/ [2]https://github.com/tesseract-ocr/tesseract/tree/main/src [3]https://www.sohu.com/a/722507167_121124363 [4]https://github.com/tesseract-ocr/tessdata/ [5]https://zhuanlan.zhihu.com/p/578700314
http://www.eeditor.cn/news/125278/

相关文章:

  • 定制网站制作报价电子商务网站建设学什么
  • 云南建设招标网站首页wordpress mysql安装
  • 建设班级网站 沟通无限保定企业官网搭建
  • 成都商务网站建设wordpress模板yunnut
  • 建设部网站业绩如何录入网页转app软件
  • 网站开发费属于软件费吗深建工程集团有限公司
  • 数据库网站建设教程wordpress小说采集
  • 免费建手机网站后台中小企业微网站建设
  • 哪里网站开发好东莞横沥
  • 做流程图用什么网站海南省住房和城乡建设厅官网网站
  • 网站模板预览制作ppt免费软件
  • 卖水果网站模板wordpress淘宝客插件开发
  • 绵阳公司商务网站制作临沂网站建设技术支持
  • 网站建设系统服务用织梦做网站费用
  • 关于我们网站模板定制企业网站多少钱
  • 郑州专业手机网站制作宁乡网站建设
  • 做外贸网站企业一个网站的入口网页又称为
  • 关键词优化好贵州百度seo整站优化
  • 网站开发常用颜色大中型网站开发流程
  • 自己怎样优化网站新手设计师接单网站
  • 外贸网站推广方式个人微信支付宝做购物网站
  • 数据库怎么做两个网站呼和浩特北京网站建设
  • 鼓楼福州网站建设二维码引流推广的平台
  • 视频网站开发流程图动漫制作专业大学有哪些
  • 书店手机网站模板国外做免费网站的
  • 品牌外贸网站建设设计师网站知乎
  • 做网站的 需要续费维护费吗什么叫外链
  • 聊城网站建设代理商whois查询 站长工具
  • 网站域名个人备案跟企业备案怎么在word上做超链接网站
  • 营销网站制作信ls15227易语言 网站开发