当前位置: 首页 > news >正文

网页版梦幻西游红拂女哈尔滨设计优化公司

网页版梦幻西游红拂女,哈尔滨设计优化公司,网站后台登录域名,网站备案被注销karpathy/nanoGPT: The simplest, fastest repository for training/finetuning medium-sized GPTs. (github.com) 原有模型使用的莎士比亚的戏剧数据集, 如果需要一个写唐诗机器人#xff0c;需要使用唐诗的文本数据#xff0c; 一个不错的唐诗#xff0c;宋词数据的下载…karpathy/nanoGPT: The simplest, fastest repository for training/finetuning medium-sized GPTs. (github.com) 原有模型使用的莎士比亚的戏剧数据集, 如果需要一个写唐诗机器人需要使用唐诗的文本数据 一个不错的唐诗宋词数据的下载资源地址 https://github.com/chinese-poet 这个数据集里面包含搜集到的唐诗宋词元曲小说文本数据。 一 数据准备 1. 先下载全唐诗数据保存到 data/poemtext/tang-poetry下 2. 进行数据的预处理 format-data.py # -*- coding: utf-8 -*- import glob import json datas_jsonglob.glob(./tang-poetry/poet*.json) #1匹配所有唐诗json文件for data_json in datas_json[:]: #2处理匹配的每一个文件with open(data_json,r,encodingutf-8) as f:ts_data json.load(f)for each_ts in ts_data[:]: #3处理文件中每段数据只要五言诗和2句的paragraphs_list each_ts[paragraphs]if len(paragraphs_list) 2 and len(paragraphs_list[0])12 and len(paragraphs_list[1]) 12:with open(tang_poet.txt,a,encodingutf-8) as f2:f2.write(.join(paragraphs_list))f2.write(\n)f open(tang_poet.txt,r,encodingutf-8) print(len(f.readlines())) prepare.py import os import requests import tiktoken import numpy as np# download the tiny shakespeare dataset input_file_path os.path.join(os.path.dirname(__file__), tang_poet.txt) with open(input_file_path, r) as f:data f.read() n len(data) train_data data[:int(n*0.9)] val_data data[int(n*0.9):]# encode with tiktoken gpt2 bpe enc tiktoken.get_encoding(gpt2) train_ids enc.encode_ordinary(train_data) val_ids enc.encode_ordinary(val_data) print(ftrain has {len(train_ids):,} tokens) print(fval has {len(val_ids):,} tokens)# export to bin files train_ids np.array(train_ids, dtypenp.uint16) val_ids np.array(val_ids, dtypenp.uint16) train_ids.tofile(os.path.join(os.path.dirname(__file__), train.bin)) val_ids.tofile(os.path.join(os.path.dirname(__file__), val.bin)) 二 配置文件准备 参考   train_shakespeare_char.py 三 开始训练 参考   train_shakespeare_char.py # mac pro m1机器上 python3 train.py config/train_poemtext_char.py --devicemps --compileFalse --eval_iters20 --log_interval1 --block_size64 --batch_size12 --n_layer4 --n_head4 --n_embd128 --max_iters1000 --lr_decay_iters1000 --dropout0.0 四 生成唐诗 python3 sample.py --out_dirout-poemtext-char --devicemps参考 迷你版ChatGPT开源教你怎么用nanoGPT训练一个写小说的AI机器人 - 知乎 (zhihu.com) Gpt进阶(二): 以古诗集为例,训练一个自己的古诗词gpt模型 - 知乎 (zhihu.com)
http://www.eeditor.cn/news/123260/

相关文章:

  • 内丘附近网站建设价格徐州建站平台
  • 小程序网站开发公司建行网站登录
  • 多个域名的网站2023年生鲜电商交易规模超6000亿
  • 建设厅网站举报天津网站建设制作系统
  • 做一个网站成本多少汽车美容网站模板
  • 带音乐网站模板网站建设有几种方法
  • 勉费申请做网站深圳人社局官网
  • 网站采用哪种开发语言上海到北京的火车
  • 新商盟显示 检查网站开发错误呢简单的电子商务网站主页设计图
  • 移动端和pc网站站酷设计师网站
  • 南浔区建设局 网站自媒体平台收益
  • 四面山网站建设广州公关公司有哪些
  • 十堰城市建设网站娄底市网站建设
  • 如何做百度的网站wordpress主页显示浏览数
  • 重庆建站模板平台app创建
  • 福州市连江县建设局网站tom企业邮箱官网
  • 网站建设案例查询网页设计软件dream
  • 做电商的网站自己建设网站教程
  • 网站文章怎么做才能被快速收录编辑器
  • ppt模板做的好的网站有哪些用腾讯云服务器做网站
  • 做网站的数据库wordpress百科汉化
  • 株洲网站开发公司电话移动网站开发基础知识
  • 一流高职院校建设计划项目网站移动端网站建设的请示
  • wordpress图片清晰度阿里巴巴网站优化怎么做
  • wordpress功能强大的主题手机网站优化
  • 什么直播可以做游戏视频网站吗android开发菜鸟教程
  • 网站设计计划书的要求一个小程序开发多少钱
  • 美容设计网站建设找生产建筑模板的厂家
  • 论述网站建设的具体步骤有哪些建设银行网络平台
  • 用asp做网站系统步骤如何查一个公司的营业执照