Home

Awesome

LLM-Travel

Authour License Apache 2.0 python_version

Introduction

欢迎来到 "LLM-travel" 仓库!探索大语言模型(LLM)的奥秘 🚀。致力于深入理解、探讨以及实现与大模型相关的各种技术、原理和应用。 文章在知乎:https://www.zhihu.com/people/allenvery/posts

这里会有什么 🌟

加入旅程 🌏

搭乘 "LLM-travel" 列车,一起探索大语言模型的奇妙世界!

已更新内容

DateTitle(知乎链接)CodeNote
2024-06-23LLM大模型之Hallucination幻觉LLM大模型之Hallucination幻觉
2024-06-03LLM大模型之分布式训练小结LLM大模型之分布式训练小结
2024-05-10LLM大模型之训练优化方法LLM大模型之训练优化方法
2024-04-09Transformer实践Transformer_torchTransformer实践
2023-12-16LLM之Deepspeed实践Deepspeed实践
2023-11-11LLM之数据质量quality_hash.ipynbLLM大模型之大规模数据文本质量(Text Quality)实践一
2023-11-04LLM之TrainerLLM大模型之Trainer以及训练参数
2023-10-14LLM之数据处理二LLM大模型之大规模数据处理工具篇Hadoop-Spark集群安装
2023-10-10LLM之开源数据整理LLM_Pretrain_Datasets开源的可用于LLM Pretrain数据集
2023-10-10LLM之数据处理一LLM大模型之大规模数据处理工具篇Hadoop-Spark集群介绍
2023-09-30LLM之显存占用memory_precision.ipynb不同精度下显存占用与相互转换实践
2023-09-29LLM之精度问题详解precision.ipynb精度问题(FP16,FP32,BF16)详解与实践
2023-09-24LLM之Embedding初始化embedding_init.ipynb扩充词表后Embedding和LM_head层的初始化
2023-09-23LLM之扩充词表sentencepiece.ipynb基于SentencePiece扩充LLaMa中文词表实践
2023-09-16LLM之Generate参数详解generate_parameter.ipynbGenerate/Inference(生成/推理)中参数与解码策略原理及其代码实现
2023-09-09LLM之Tokenization分词方法tokenization.ipynbWordPiece,Byte-Pair Encoding (BPE),Byte-level BPE(BBPE)原理及其代码实现