mashuotian的个人博客分享 http://blog.sciencenet.cn/u/mashuotian

博文

学习周报-马硕天-20250929-20251005

已有 661 次阅读 2025-10-8 15:49 |系统分类:科研笔记

                                      学习周报

姓名

马硕天

时间范围

20250929-20251005

周次

第五周

研究方向

大模型数据高效微调

本周完成工作

1.       智能比价,完成了所有比价反馈问题的修复,完成了通过libreofficesheet xls文件向csv文件的转化。

2.       完成idea的进一步改进,改进后实验效果更好。

本周

问题汇报

目前序列长度仅支持4096以下,8192会爆显存,而现有推理数据集中长度在4096以下的序列占比仅为三分之二,4096-8192之间的数据占据了其余三分之一的相当一部分,应当被纳入实验中。

下周工作计划

1.       继续进行减少算法显存开销的技术研究应用(如acceleratorcpu   offloaddeepspeed技术),目前已经进行了一部分实验,但仍未完全解决问题。

 



https://blog.sciencenet.cn/blog-3623255-1505076.html

上一篇:学习周报-马硕天-20250908-20250914
收藏 IP: 210.30.107.*| 热度|

1 王涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-12-6 04:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部