Skip to content

kuangpenghao/ADG_Build_Language_Model_Lectures

Repository files navigation

这里是上海科技大学“从零构建大语言模型”系列讲座的相关课件资料。

讲座信息介绍

  • Lec1:BPE分词系统设计及算法优化
  • Lec2:Transformer模型架构及其现代改进
  • Lec3:Transformer架构的代码实现
  • Lec4:LLM的训练及自回归解码

其中Lec1、3、4为工程实践讲座,涉及了大量代码实现的讲解,主讲人为匡鹏昊;Lec2为基础知识讲座,主要为Lec3、4做重要的基础铺垫,主讲人为洪沐天。

开源链接:源代码

完整源代码链接:https://github.com/kuangpenghao/CS336-Assignment1

开源链接:课件

开源链接:讲座回放

该系列讲座取材自斯坦福大学同名课程《CS336:Language Modeling From Scratch》的Assignment1,并已获得该课程开课者:斯坦福大学Hashimoto教授授权。

Contributor: 23 CS 匡鹏昊 & 22 CS 洪沐天

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published