HaoDanmeng的个人博客分享 http://blog.sciencenet.cn/u/HaoDanmeng

博文

学习周报

已有 346 次阅读 2025-3-30 17:48 |个人分类:学习周报|系统分类:科研笔记

学习周报

姓名

郝丹萌

时间范围

2025.3.10-3.17

周次

十三

研究方向

大模型高效参数微调

一、本周工作

1. 基本完成所有实验:覆盖Qwen/Llama3/Deepseek三个模型,在Final/Identity数据集上验证微调方法。  

2. 对于在两个数据集上用awq+lora+方法训练后的模型,完成Chat前端界面开发,实现前后端API对接。 

1. 论文方面,基于得出的实验数据,主要看了loralora+的论文。总结来说,LoRA+优于LoRA的主要原因包括:(1)差异化的学习率设置协调了AB的梯度更新;(2)优化的初始化策略增强了训练的稳定性。 

 

、后续工作计划

1.AWQ的论文。

2.开始编写毕设论文初稿。



https://blog.sciencenet.cn/blog-3622922-1479958.html


下一篇:学习周报
收藏 IP: 39.144.60.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

1/0 | 鎬昏:0 | 棣栭〉 | 涓婁竴椤� | 璺宠浆

扫一扫,分享此博文

全部作者的其他最新博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-4-16 16:56

Powered by ScienceNet.cn

Copyright © 2007-2025 中国科学报社

返回顶部