当前位置: 首页 > news >正文

广西柳州网站建设小程序公司从搜索引擎访问网站

广西柳州网站建设小程序公司,从搜索引擎访问网站,做外贸网站需要注意些什么,跨境电商需要投资多少前言 本文指的数据集为通用数据集#xff0c;并不单是给机器学习领域使用。包含科研和工业领域需要自己制作数据集的。 首先#xff0c;在制作大型数据集时#xff0c;代码错误和数据问题可能会非常复杂。 前期逻辑总是简单的#xff0c;库库一顿写#xff0c;等排查的时…前言 本文指的数据集为通用数据集并不单是给机器学习领域使用。包含科研和工业领域需要自己制作数据集的。 首先在制作大型数据集时代码错误和数据问题可能会非常复杂。 前期逻辑总是简单的库库一顿写等排查的时候两眼无泪。 后期慢慢摸排和检查的时候不断完善代码前期代码主要是完成功能后期是增加维护性和检测性。 这部分工作其实前期可以考虑进去。 以下提供一些血泪经验 方法 1. 模块化设计 将代码分成多个小模块或函数每个模块负责一个特定的任务。这样更容易定位和修复问题。 模块化在最开始拿到需求和实现思路的时候估计还做不到但代码写到一定程度该考虑拆成模块的就得拆成模块。不然后期调试会特别复杂。 2.单元测试 TDD我是支持的但同时写测试和代码我是做不到的。所以对我来说都是代码写到一定程度再考虑添加单元测试。分为功能测试计算测试还有数据样例测试。 3.日志记录 需要记录过程数据推荐建立单独文件夹存储计算中的过程数据。 注意 这个除了开发阶段非常有用 后期在程序上线生产环境后对于帮助排查bug也是非常有帮助的上线后注意的是控制过程数据文件数量。 如图一般建立check_data文件夹或者logs文件夹。 还可以用logging模块代码如图 import logginglogging.basicConfig(levellogging.DEBUG) logger logging.getLogger(__name__)def process_data(data):logger.debug(Starting data processing)logger.debug(Data processing completed) 但我个人倾向自定义log文件。logging模块的排版虽然整齐无用字符也太多了。自己单独费点时间写个表保存。 晒一下嘿嘿 4. debug 打断点逐步调试啦没有捷径可走加油吧少年 5.数据验证 在每个计算步骤核对计算结果确保计算正确。 6.版本控制 保存每个能跑的版本。不管是不是shit。 可以用管理工具git也可以手动保存。 7.数据抽样 对数据集进行抽样组成小样本数据集代入程序进行验证和核对结果可以大大减少工作量 8.自动化测试 编写自动化测试脚本定期运行这些脚本以检测新引入的错误。可以使用CI/CD工具如Jenkins、GitHub Actions来实现这一点。 9.并行处理 将数据集切分多个进程进行计算加快速度同时也会帮助更快发现问题 提供一个按进程数均分数据集进行计算的代码 from multiprocessing import Process import timedef func_demo(age,name_list)for name in name_list:print(name,:,age)def func(param1,process_number):# 总输入xxx_list [str(i) for i in range(100)]# 统计任务数量number len(xxx_list) # 计算平均每个进程需承担多少任务delta int(number / process_number)p_list []# 启动多进程for i in range(0, process_number):# 按delta遍历取需要计算的任务。if i process_number - 1:s delta * ie numberelse:s delta * ie delta * (i 1)p Process(targetcalculate_name, args(param1, xxx_list[s:e]))p.start()p_list.append(p)for p in p_list:p.join()# 测试划分的对不对 def test_p_delta():number len(xxx_list)delta int(number / 4)for i in range(0, 4):if i 3:s delta * ie numberelse:s delta * ie delta * (i 1)print(s:, s, e:, e)if __name__ __main__:age10process_number 4func(age,process_number)10.文档和注释 确保代码有充分的文档和注释后期翻看的时候也能快速理解代码逻辑和数据处理过程。 希望对看官有所帮助
http://www.eeditor.cn/news/118944/

相关文章:

  • 河北建设厅网站6汕头建设网站的公司
  • 怎么看网站建设企业推广平台排行榜
  • 中国城乡住房建设部网站做网站是如果盈利的
  • 网站怎么才可以不备案域名的网站建设方案书
  • 长沙微网站开发世界互联网峰会官网
  • 邯郸有没有专门做写字楼的网站有什么国企是做网站的
  • 天津建设网站的公司简介佛山新网站建设服务
  • 深圳福田住房和建设局网站官网餐饮网站建设怎样
  • 安丘网站建设梅河口网站开发
  • 合水口网站建设做自己的网站难不难
  • 广州骏域网站建设专家手机电脑版重庆网站建设夹夹虫公司
  • 天津门户网站开发怎样做电商卖货
  • 网站建设的七大主要目的长春网络营销公司
  • 虫虫wap建站源码中企动力z云邮箱
  • 网站建设案例信息阳泉推广型网站开发
  • 免费信息发布网站大全网络营销软件代理
  • 合肥政务新区建设局网站昆山城乡建设局网站
  • 张家口网站建设制作界面设计属于什么专业
  • 上海最专业的集团网站建设企业内训课程
  • 贵州省建设厅网站官网建站工具官网
  • 网站后台的功能做网站子页
  • 常州企业微信网站建设免费发广告平台
  • 贵阳网站优化公司做服务器的网站都有哪些功能
  • 网站二级目录运维管理平台
  • pc端手机网站 样式没居中wap网站怎么打开
  • 淘宝网站建设需要哪些技术个人网站制作设计
  • 上海网站策划宁波网站建设模板下载免费
  • 网站营售个人网站网页设计
  • 天津网站搜索引擎优化jsp网站开发详解
  • 怎么做网站的用户注册wordpress查询页面