当前位置: 首页 > news >正文

我的网站首页打不开建设网站以什么为导向

我的网站首页打不开,建设网站以什么为导向,开发者选项在哪里关闭,上海网页制作针对不同类型的文件#xff0c;需要采取特定的访问与解析策略来有效获取其中蕴含的知识。下面我们将介绍对于不同数据源数据的获取方式。 1 解析Docx文档 1.1 获取Docx文档中文本 from docx import Document # pip install python-docx # python-docx 0.8.11 filename xx…针对不同类型的文件需要采取特定的访问与解析策略来有效获取其中蕴含的知识。下面我们将介绍对于不同数据源数据的获取方式。 1 解析Docx文档 1.1 获取Docx文档中文本 from docx import Document # pip install python-docx # python-docx 0.8.11 filename xxx.docx doc Document(filename) for para in doc.paragraphs:print(para.text)1.2 获取Docx文档中表格 from docx import Document filename rsample.docx doc Document(filename) print(f\n 便利文档中表格) print(f\n 方法一) for table in doc.tables:row_count len(table.rows)col_count len(table.columns)for i in range(row_count):row table.rows[i].cellsprint(frow : {row}) print(f\n 方法二) for table in doc.tables:row_count len(table.rows)col_count len(table.columns)for i in range(row_count):for j in range(col_count):print(table.cell(i,j).text)2 解析txt文件 2.1 读取富文本txt read() —— 读取所有文本 with open(sample.txt,r,encodingutf-8) as f:data f.read()print(data)readline() —— 读取第一行的内容 with open(sample.txt,r,encodingutf-8) as f:data f.readline()print(data)readlines() —— 读取全部内容以数列的形式返回结果 with open(sample.txt,r,encodingutf-8) as f:data f.readlines()print(data)with open(sample.txt,r,encodingutf-8) as f:for ann in f.readlines()ann ann.strip(\n) # 去除文本中的换行符print(ann) # 简单版本 for i in open(filesample.txt,encodingutf-8).readlines():ann i.strip(\n)print(ann)3 解析PDF 3.1 PDF解析神器——pdfplumber 3.1.1 安装 pip install pdfplumber3.1.2 提取pdf中的纯文本 import pdfplumber file_name rsample.pdf # 需要解析的pdf文件 output_file sample.txt # pdf解析后的内容 with pdfplumber.open(file_name) as p:page_count len(p.pages)for i in range(0,page_count):page p.pages[i]text_data page.extract_text()data open(output_file,a,encodingutf-8)data.write(text_data)3.1.3 提取pdf中的表格 import pdfplumber from openpyxl import Workbook # 保存表格 file_name rsample.pdf output_file sample.xlsx with pdfplumber.open(file_name) as pdf:page pdf.pages[0]table page.extract_table()workbook Workbook()sheet workbook.activefor row in table:sheet.append(row)workbook.save(filenameoutput_file)extract_tables()方法——输出文档所有表格返回一个嵌套列表。 #extract_tables()法 with pdfplumber.open(rexm.pdf) as pdf: # 打开pdfpage_one pdf.pages[0] page_one_table page_one.extract_tables() # 获取pdf第一页的所有表格数据for row in page_one_table:print(第一页的表格数据, row)extact_table()方法——不会返回文档的所有表格仅返回行数最多的表格数据。如存在多个行数相等的表格则默认输出顶部表格数据。表格的每一行都为一个单独的列表列表中的元素即为原表格的各个单元格的数据。 # extract_table()法 with pdfplumber.open(rexm.pdf) as pdf_info: # 打开pdfpage_one pdf_info.pages[0] page_one_table page_one.extract_table()for row in page_one_table:print(row)
http://www.eeditor.cn/news/121281/

相关文章:

  • 江西建设部网站wordpress 主题和插件下载
  • 做阿里巴巴网站图片wordpress开发工资
  • 河北大名网站建设招聘专业做网站服务
  • 电子商务网站开发策划大学毕业网站设计代做
  • 安徽康东建设工程有限公司网站哈尔滨市招投标信息网
  • 天津网站建设noajt网站一般怎么维护
  • 网站建设怎么选择MySQL数据库大小龙口建设公司网站
  • 佛山网站设计建设书签图片
  • 国内网页做的好看的网站南宁网吧
  • 网站模块建设中微信小程序定位权限怎么打开
  • 定制网站制作技术wordpress主题 怎么安装教程
  • 广告网站搭建htm网页设计
  • wordpress主题divi搜索广告优化
  • 赣州市住房和城乡建设局网站wordpress开源博客系统
  • 家用电脑当服务器建设网站推广一个网站需要什么
  • 微网站 微官网的区别吗河南做网站公司哪家专业
  • 网站公司做的比较好wordpress 安卓 管理系统
  • 南宁老牌网站建设公司进口商品代理平台
  • 自建淘宝客APP网站模板站长工具ip地址
  • 做餐厅网站的需求分析wordpress storefront
  • 广东网站建设怎么选jquery上传wordpress
  • 信誉好的菏泽网站建设wordpress登录cookies
  • 网站建设需要关注什么青岛网站制作设计
  • 云集网站哪个公司做的杭州企业网站搭建
  • 360网站建设企业网站开发职业生涯规划范文
  • 承德网站建设规划医院网站建设中标
  • 网站seo诊断评分63网站更改关键词
  • 文学网站做编辑wordpress 云虚拟主机
  • 冠县网站建设北京seo优化推广
  • 代理行业门户网站重庆是哪个省份的