刘洋的博客分享 http://blog.sciencenet.cn/u/outcrop 管中窥豹,盲人摸象

博文

人民大学发布大语言扩散模型Large Language Diffusion Models

已有 665 次阅读 2025-2-27 18:58 |个人分类:计算机应用技术|系统分类:博客资讯

19小时之前,人民大学发布了MIT License的大语言扩散模型Large Language Diffusion Models:

We introduce LLaDA (Large Language Diffusion with mAsking), a diffusion model with an unprecedented 8B scale, trained entirely from scratch, rivaling LLaMA3 8B in performance.

从发布时间来看,比前面提到Interception Labs的扩散大语言模型发布还要早5个小时!

见前文:《第一个商业级扩散大语言模型(diffusion large language models)发布 》



https://blog.sciencenet.cn/blog-1750-1475126.html

上一篇:第一个商业级扩散大语言模型(diffusion large language models)发布
收藏 IP: 43.128.115.*| 热度|

3 刘进平 尤明庆 郑永军

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

1/0 | 鎬昏:0 | 棣栭〉 | 涓婁竴椤� | 璺宠浆

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-3-15 23:07

Powered by ScienceNet.cn

Copyright © 2007-2025 中国科学报社

返回顶部