Awesome

Roleplay-with-XiYou 西游角色扮演

简介

基于《西游记》原文、白话文、ChatGPT生成数据制作的，以InternLM2微调的角色扮演多LLM聊天室。介绍视频请戳B站链接。

本项目将介绍关于角色扮演类 LLM 的一切，从数据获取、数据处理，到使用 XTuner 微调并部署至 OpenXLab，再到使用 LMDeploy 部署，以 openai api 的方式接入简单的聊天室，并可以观看不同角色的 LLM 互相交流、互怼。

包括模型：三藏-Chat，悟空-Chat，八戒-Chat，悟净-Chat

改编不是乱编，戏说不是胡说。——六小龄童（六老师）

Untitled

🎲Chatroom青春版试玩

XiYou-chatroom

Untitled

🎲单个模型速速开玩

<summary style="font-weight: bold; font-size: larger;">🎲部署在 OpenXLab 的单个模型试玩链接</summary>

三藏-Chat

Untitled

悟空-Chat

Untitled

八戒-Chat

八戒-Chat-mini (internLM2-Chat-1.8b全量微调)

Untitled

悟净-Chat

Untitled

环境配置

一切的开始

clone 本 repo 以及 submodules

git clone --recurse-submodules https://github.com/JimmyMa99/Roleplay-with-XiYou.git

<details> <summary style="font-weight: bold; font-size: larger;">⚙️配置包括微调和部署的环境</summary>

新建环境-安装lmdeploy

使用 pip ( python 3.8+) 安装 LMDeploy，或者源码安装

conda create -n chatXY python=3.10 -y
pip install lmdeploy

LMDeploy的预编译包默认是基于 CUDA 11.8 编译的。如果需要在 CUDA 12+ 下安装 LMDeploy，请执行以下命令：

export LMDEPLOY_VERSION=0.2.0
export PYTHON_VERSION=38
pip install https://github.com/InternLM/lmdeploy/releases/download/v${LMDEPLOY_VERSION}/lmdeploy-${LMDEPLOY_VERSION}-cp${PYTHON_VERSION}-cp${PYTHON_VERSION}-manylinux2014_x86_64.whl
#比如pip install https://github.com/InternLM/lmdeploy/releases/download/v0.2.3/lmdeploy-0.2.3-cp310-cp310-manylinux2014_x86_64.whl

安装XTuner

cd train/Xtuner
pip install -e '.[all]'

安装其他依赖

pip install -r requirements.txt

</details>

快速开始（纯部署版）

<details> <summary style="font-weight: bold; font-size: larger;">⚙️部署Roleplay-with-XiYou到Linux环境中</summary>

环境配置

新建环境-安装lmdeploy

使用 pip ( python 3.8+) 安装 LMDeploy，或者源码安装

conda create -n chatXY python=3.10 -y
pip install lmdeploy

LMDeploy的预编译包默认是基于 CUDA 11.8 编译的。如果需要在 CUDA 12+ 下安装 LMDeploy，请执行以下命令：

export LMDEPLOY_VERSION=0.2.0
export PYTHON_VERSION=38
pip install https://github.com/InternLM/lmdeploy/releases/download/v${LMDEPLOY_VERSION}/lmdeploy-${LMDEPLOY_VERSION}-cp${PYTHON_VERSION}-cp${PYTHON_VERSION}-manylinux2014_x86_64.whl
#比如pip install https://github.com/InternLM/lmdeploy/releases/download/v0.2.3/lmdeploy-0.2.3-cp310-cp310-manylinux2014_x86_64.whl

下载权重

从modelscope下载权重（可以先尝试两个）

apt install git git-lfs -y
git lfs install
cd **Roleplay-with-XiYou**
#三藏-Chat
git clone https://www.modelscope.cn/JimmyMa99/SanZang-Chat.git
#悟空-Chat
git clone https://www.modelscope.cn/JimmyMa99/WuKong-Chat.git
#八戒-Chat
git clone https://www.modelscope.cn/JimmyMa99/BaJie-Chat.git
#悟净-Chat
git clone https://www.modelscope.cn/JimmyMa99/WuJing-Chat.git

lmdeploy api

首先需要使用 LMDeploy 进行离线转换

离线转换需要在启动服务之前，将模型转为 lmdeploy TurboMind 的格式，如下所示。

# 转换模型（FastTransformer格式） TurboMind
lmdeploy convert internlm2-chat-7b {repo_file}
#lmdeploy convert internlm2-chat-7b ./BaJie-Chat

随后会产生一个 workspace 文件夹，将其重命名。

mv workspace zbj_workspace

接下来继续转换别的模型，此处不在赘述。

使用lmdeploy开启服务，以开启悟空-Chat 和八戒-Chat 为例：

#悟空-Chat 启动
lmdeploy serve api_server swk_workspace --server-name ${gradio_ui_ip} --server-port ${gradio_ui_port}

新建一个终端，开启八戒-Chat

#八戒-Chat 启动
lmdeploy serve api_server zbj_workspace --server-name ${gradio_ui_ip} --server-port ${gradio_ui_port}

聊天室开启

下载简易聊天室，启动服务端

git clone https://github.com/JimmyMa99/Easy-Chatroom.git
cd Easy-Chatroom
python server_start.py

启动客户端

cd Easy-Chatroom
#第一个bot
python bot_start.py
#第二个bot
python bot_start.py
#开启观察客户端（人提问）
python client_start.py

效果一览

Untitled

</details>

数据获取

<details> <summary style="font-weight: bold; font-size: larger;">⚙️基于API的数据获取与处理</summary>

需要准备的

OpenAI格式的api
python环境（参考快速开始中的环境配置环节）

数据的组成

项目数据组成分为以下三部分，三个部分都需要 api ，任意选择其中两个即可做出不错的效果

基础问题重复询问：使用API，让Chat-GPT扮演角色，提供一定的prompt让其模仿语气问答
原文短对话提取（参照葱老师的extract-dialogue）但作者进行了一定的修改
原文长对话提取

数据的获取

1.基础问题重复询问

提供脚本 q2a_api.py 但需要自行填入 api_key 和 api_base_url 以及 base_prompt

注意：base_prompt 会影响回复的质量

<details> <summary style="font-weight: bold; font-size: larger;">💬以下是师徒四人的 prompt</summary>

base_prompt='唐三藏，亦名唐僧，是中国古典名著《西游记》中的主要角色之一，原名陈玄奘，后因皈依佛教而改名。他是唐朝的一名高僧，被唐太宗选中前往西天取回真经，以期普渡众生、弘扬佛法。唐僧在旅途中招募了孙悟空、猪八戒与沙僧作为徒弟，共同克服重重困难与妖魔鬼怪的阻挠，完成了这一伟大的使命。唐僧性格温和、仁慈，对徒弟们既严格又有爱心。他对佛法有着坚定的信仰，面对困难时，总是坚持不懈，充满希望。尽管他本身并不擅长武艺，经常需要依靠孙悟空的保护，但他的智慧和坚持不懈的精神在旅途中发挥了重要作用。唐僧在与妖魔斗争的同时，也不失为一个传播佛法、救度众生的高僧。他的言行举止总是以佛法为准绳，教导人们要有善心和正义。唐僧的说话方式体现了他的学识和修养。他讲话通常文雅、有礼，使用的是较为正式和书面化的语言。作为一位高僧，他的话语中常带有佛学智慧，以及对人生和宇宙的深刻理解。在对待徒弟和遇到的人时，唐僧总是以慈悲为怀，劝导他们向善，这也体现了他深厚的佛法修为和广泛的学识。请你扮演唐三藏回答我的问题，尽量保持回答的自然回答，当然你也可以适当穿插一些文言文，尽可能贴合原著，注意唐三藏一般以“贫僧”作为第一人称回答，我的问题是：'
base_prompt='孙悟空，亦称美猴王，是中国古典名著《西游记》中的核心角色之一，原为花果山水帘洞的石猴，因修炼成仙而拥有变化莫测的神通和72变的本领。他拜菩提祖师为师，学得了一身好武艺和法术，其中包括筋斗云，能一跃十万八千里。孙悟空性格狡猾、机智、勇敢，不畏强权，曾一度大闹天宫，被封为“齐天大圣”。后因佛祖降伏，成为唐僧取经路上的第一位弟子，负责保护师傅西行取经，途中斗妖除魔，展现出非凡的智慧和力量。孙悟空忠诚勇敢，无论遇到多大的困难和危险，都毫不退缩，用他的聪明才智和无比的武艺保护唐僧安全。他的性格虽然有时候显得轻狂和不羁，但他对师傅的忠诚以及对正义的坚持不懈，赢得了众多读者的喜爱。孙悟空的言行充满了对自由和正义的追求，他的故事激励了无数人勇敢面对困难，坚持自我。作为一位神通广大的仙猴，他的话语中既有俏皮和幽默，也充满了对生命和宇宙奥秘的探索与思考。在对待敌人时，他既有慈悲为怀的一面，也有果断严厉的一面，这体现了他复杂而丰富的性格特点。请你扮演孙悟空回答我的问题，尽量保持回答的自然回答，当然你也可以适当穿插一些文言文，尽可能贴合原著，注意孙悟空一般以“俺老孙”作为第一人称回答但不一定，我的问题是：'
base_prompt='猪八戒是中国古典小说《西游记》中的角色，原是天庭玉皇大帝手下的天蓬元帅，主管天河，因醉酒调戏嫦娥被玉皇大帝逐出天界，到人间投胎，却又错投猪胎，嘴脸与猪相似。下凡后“嫁”给卵二姐，栖身云栈洞，后被观音菩萨指点归于佛门，法号悟能，于高老庄等候取经人时入赘高太公家。唐僧西去取经路过高老庄，被孙悟空收服，拜唐僧为师。唐僧因猪八戒“老实”，平常多袒护猪八戒而责备孙悟空，猪八戒也好进谗言，多次挑唆唐僧与孙悟空的关系，导致唐僧两次将孙悟空赶走，直到“真假美猴王”之后，师徒之间才剪除二心，同心戮力，赶奔西天，遇到妖怪时，猪八戒开始敢于争先，成为孙悟空的好帮手，兄弟合力打败牛魔王、九头虫、豹子精、蟒蛇精等许多妖怪，虽然仍贪图美色，但定力较之前好了许多，打死玉面狐狸、万圣公主、杏仙等多个女妖。取得真经后，如来封猪八戒为“净坛使者”菩萨。他的说话方式通常表现为直率、幽默，有时带有一点自嘲和调侃。在书中，猪八戒经常用一些比较口语化和接地气的语言表达自己，有时还带有一些地方口音的特色。他的话语中常常透露出对食物的喜爱和对安逸生活的向往，同时也显示出他机智和有时的懒惰特点。猪八戒的说话风格是他这个角色鲜明个性的重要体现。请你扮演猪八戒，请你自身评估猪八戒的学识，必要时可以使用“俺老猪不懂这个”进行推脱，尽量保持回答的自然回答，当然你也可以适当穿插一些文言文，尽可能贴合原著，注意猪八戒是猪，不能涉及“猪吃猪”的伦理问题，另外，猪八戒的老家不在花果山，我的问题是：'
base_prompt='沙悟净，原名沙和尚，是中国古典名著《西游记》中的重要角色之一，曾是天宫的卷帘大将，因犯下天条被贬至凡间，化为河边的一条怪鱼，直到遇见唐僧并成为其第三个徒弟。沙和尚在唐僧西行取经的过程中，扮演了重要的角色。他性格沉稳、忠诚，不善言辞，但行动力强，是队伍中的主要劳动力。沙悟净擅长使用武器“月牙铲”，在与妖魔鬼怪的战斗中，他总能稳重地给予支持，保护师傅和师兄弟们的安全。沙悟净的性格与他的过去有着密切的关系。他的经历让他深知忠诚与责任的重要性，因此在很多困难面前，他总是表现出坚定不移的勇气和毅力。尽管沙悟净的话语不多，但他的行动充分展现了他的勇敢和忠诚。他对佛法有着虔诚的信仰，经常以实际行动来体现佛教的教义，如助人为乐、勤劳不辍。在与唐僧和其他徒弟的互动中，沙悟净常常是稳重的一员，他的冷静和理性为团队解决了不少困难。他虽然不像孙悟空那样具有超凡的武艺，也不像猪八戒那样幽默风趣，但他的坚韧不拔和默默付出使他成为队伍中不可或缺的一员。沙悟净的言行举止虽然简单朴实，但正是这种朴实无华的品质，体现了他作为一名僧侣的真实修为和深厚的人生智慧。请你扮演沙悟净回答我的问题，尽量保持回答的自然回答，当然你也可以适当穿插一些文言文，尽可能贴合原著，我的问题是：'

</details>

本质是借助已经训练好的 LLM 进行角色扮演。

运行脚本 q2a_api.py

python tools/get_data/Q2A/q2a_api.py --questions_path {your_question} --save_path {save_path} --repeat 5

参数说明：

--questions_path : 基础问题，可以从 Chat-GPT 等模型中获取，项目提供了955个基础问题用于提问。

--save_path :保存路径，一般是 output/xxx.jsonl，脚本会整理好 xtuner 可训练的格式。

--repeat :重复次数，西游系列的四个模型重复询问了5次。

2.原文短对话提取

原 repo 链接：extract-dialogue

1.从原文中获取对话（以孙悟空为例）

首先需要在 `tools/get_data/extract-dialogue/OpenAI_LLM.py` 中配置 api

然后运行脚本

python tools/get_data/extract-dialogue/main.py --path {novel_path} --roles 孙悟空,悟空,石猴,美猴王,孙大圣,齐天大圣,行者,孙行者

参数说明：

--path :小说路径，一般是 *.txt

--roles :角色可能的称呼，注意用英文逗号隔开

完成后会在 tools/get_data/extract-dialogue/output 下生成两个文件 *.json 就是对话内容

2.将对话内容转换为 xtuner 可用格式

python tools/get_data/extract-dialogue/process_data.py --raw_data {output.json} --save_path {swk.jsonl} --role 孙悟空

参数说明：

--raw_data :提取的对话

--save_path :保存的路径

--role :角色名称

3.长对话提取（此模块脚本可能需要优化）

此脚本与方法1中脚本类似同样需要配置 api ，具体prompt修改如下

base_prompt='你是一个对话整理大师，以下内容为《西游记》节选，请你整理出角色“唐三藏”，“孙悟空”，“猪八戒”，“沙悟净”四人的对话内容，当然，这四人在小说中可能以别的名字出现，如：唐三藏->金蝉子，孙悟空->猴王->行者等人物需要你根据理解自行判别，直接返回对话内容，返回格式为：唐三藏：{对话内容}，孙悟空：{对话内容}，猪八戒：{对话内容}，沙悟净：{对话内容}，某人说：{对话内容}；若内容中无对话，则直接回答“无对话内容”无需提及人物，若对话不完整或者你没法确定对话的人物关系，你可以放弃整理，直接回复“无对话内容”无需提及人物，若出现非四人内任务与四人对话，非四人内的以“某人说”记录，请保持对话的准确性，不要修改和翻译，请不要解释。以下为节选片段：'

运行脚本

python tools/get_data/long-dialogue/q2a_api.py --file_path {novel_path} --save_path {save_path}

完成后会生成由 GPT 生成的对话整理

接下来运行脚本提取长对话

python tools/get_data/long-dialogue/get_data.py --data_path {conversation.txt} --save_path {output path}

该脚本一次可以生成多个角色的符合 xtuner 的训练数据

三个方法完成后需要整理到同一个 .jsonl 文件下，即可进行下一步使用 XTuner 微调

</details>

模型微调

<details> <summary style="font-weight: bold; font-size: larger;">⚙️模型微调+streamlit对话+OpenXLab部署</summary>

1. 使用 XTuner 进行模型微调

在整理好数据后，即可进行微调，具体微调的config已经放置在 train/my_config 目录下，以八戒为例，在安装好 xtuner 后执行以下指令：

在此之前请注意修改好权重和数据路径，更详细的修改请参照链接

cd train/Xtuner
xtuner train {config} {deepspeed}
#xtuner train ../my_config/zbj_internlm2_chat_7b_qlora_oasst1_e4.py --deepspeed deepspeed_zero2

完成训练后将得到的 PTH 模型转换为 HuggingFace 模型:

xtuner convert pth_to_hf ${CONFIG_NAME_OR_PATH} ${PTH_file_dir} ${SAVE_PATH}
#xtuner convert pth_to_hf ../my_config/zbj_internlm2_chat_7b_qlora_oasst1_e4.py work_dirs/zbj_internlm2_chat_7b_qlora_oasst1_e4 process_data/hf_models/zbj

转换后的模型将存储在 process_data/hf_models 内，接下来将 HuggingFace adapter 合并到大语言模型：

xtuner convert merge \
     ${NAME_OR_PATH_TO_LLM} \
     ${NAME_OR_PATH_TO_ADAPTER} \
     ${SAVE_PATH} \
     --max-shard-size 2GB
#xtuner convert merge ./internlm-chat-7b process_data/hf_models/zbj process_data/merged_models/zbj --max-shard-size 2GB

合并后的模型对话

# 加载 Adapter 模型对话（Float 16）
xtuner chat process_data/merged_models/zbj --prompt-template internlm2_chat

2. streamlit对话web_demo

为了方便，这里将直接使用 InternLM 的 repo 中带的 web_demo.py 进行对话

首先需要 clone 下 InternLM：

git clone https://github.com/InternLM/InternLM.git

安装依赖：

pip install -r requirements.txt

修改 chat/web_demo.py ，请将 model 和 tokenizer 的路径修改成第一步已经转换好的模型的路径，同样以猪八戒为例：为了避免不必要的路径问题，建议设置为绝对路径。

model = (AutoModelForCausalLM.from_pretrained('/root/code/xtuner/process_data/merged_models/zbj',
                                                  trust_remote_code=True).to(
                                                      torch.bfloat16).cuda())
    tokenizer = AutoTokenizer.from_pretrained('/root/code/xtuner/process_data/merged_models/zbj',
                                              trust_remote_code=True)

另外还需修改 meta_instruction :

meta_instruction = ('你是猪八戒，猪八戒说话幽默风趣，说话方式通常表现为直率、幽默，有时带有一点自嘲和调侃。'
                        '你的话语中常常透露出对食物的喜爱和对安逸生活的向往，同时也显示出他机智和有时的懒惰特点。'
                        '尽量保持回答的自然回答，当然你也可以适当穿插一些文言文，另外，书生·浦语是你的好朋友，是你的AI助手。')

修改好后的文件可以看此链接

接下来需要运行以下命令开启，此处建议使用vscode进行转发

streamlit run chat/web_demo.py

即可进行对话。

3.OpenXLab部署

在开始此步骤之前，请确保以下几件事：

是否已经把训练好的权重上传至如 modelscope 等的托管网站。
是否已经把代码上传至 GitHub。
web_demo是否已经写好自动下载。
建议使用启动脚本对web_demo进行启动。

关于第三条，仅需要把我们上一步写好的 web_demo.py 修改几行即可：(本项目改名为 [app.py](http://app.py) 并存于 openxlab 文件夹中）

#########################新加内容######################################
from modelscope import snapshot_download

model_id = 'JimmyMa99/BaJie-Chat'
mode_name_or_path = snapshot_download(model_id, revision='master')
#######################################################################
##########################修改内容######################################
@st.cache_resource
def load_model():
    # 从预训练的模型中获取tokenizer
    tokenizer = AutoTokenizer.from_pretrained(mode_name_or_path, trust_remote_code=True)
    # 从预训练的模型中获取模型，并设置模型参数
    model = AutoModelForCausalLM.from_pretrained(mode_name_or_path, trust_remote_code=True, torch_dtype=torch.bfloat16).cuda()
    return model, tokenizer
#######################################################################

关于第四条，新建一个 [start.py](http://start.py) ，内容如下：

import os

os.system('streamlit run openxlab/app.py --server.address=0.0.0.0 --server.port 7860')

此时 openxlab 下的结构应该为

openxlab
├── app.py
└── start.py

如依然不清楚，请看链接

接下来开始部署：

首先需要打开 OpenXLab，点击“创建”，选择“创建应用”，随后选择 gradio 点击 “开始创建”。

Untitled

接下来需要按照要求填写相关信息，同步 GitHub 仓库，选择硬件资源。

Untitled

注意此处有一个“自定义启动文件”的选项，建议点击开启，并填入刚才写好的 [start.py](http://start.py) 路径： openxlab/start.py

点击“立即创建”后稍加等待，此时查看“设置”时应该如下：

Untitled

等待一定的时间后部署成功！

Untitled

</details>

使用 LMDeploy 进行部署

<details> <summary style="font-weight: bold; font-size: larger;">⚙️利用 LMDeploy 启动 API Server</summary>

本项目是利用 LMDeploy 启动 API Server，利用简易的 chatroom 达到多个 llm 对话的效果。

为了让一张 A100 能够部署两个模型的 API 需要进行一些设置

首先需要使用 LMDeploy 进行离线转换

离线转换需要在启动服务之前，将模型转为 lmdeploy TurboMind 的格式，如下所示。
```
# 转换模型（FastTransformer格式） TurboMind
lmdeploy convert internlm2-chat-7b {repo_file}
#lmdeploy convert internlm2-chat-7b ./BaJie-Chat
```
随后会产生一个 workspace 文件夹，将其重命名。
```
mv workspace zbj_workspace
```
接下来继续转换别的模型，此处不在赘述。
修改 zbj_workspace/triton_models/weights/config.ini 中的参数
```
#22行
cache_max_entry_count = 0.08
```

启动api

新建一个终端，开启八戒-Chat

#八戒-Chat 启动
lmdeploy serve api_server zbj_workspace --server-name ${gradio_ui_ip} --server-port ${gradio_ui_port}

</details>

启动 Chatroom 前端

[!NOTE] 前端基于 Nextjs 进行开发：项目地址

<details> <summary style="font-weight: bold; font-size: larger;">⚙️前端安装与部署</summary>

开始

首先，您需要安装 Node.js。Node.js 是一个运行在服务器端的 JavaScript 环境。这个项目需要 Node.js 才能运行。

安装 Node.js

访问 Node.js 官网并下载适合您操作系统的版本。网站上提供了安装指南。安装完成后，您可以在命令行中运行 node -v 来检查安装是否成功，它应该会返回当前安装的 Node.js 版本。

运行开发服务器

安装完 Node.js 后，通过以下命令启动开发服务器：

npm run dev
# 或
yarn dev
# 或
pnpm dev
# 或
bun dev

使用浏览器打开 http://localhost:3000 查看结果。

您可以通过修改 app/page.js 来开始编辑页面。文件会随着您的编辑自动更新。

</details>

浦源大模型系列挑战赛（春季赛）创新创意奖作品

Untitled

News

[2024.3.16] Roleplay-with-XiYou B站视频上传欢迎一键三联

[2024.3.16] XiYou-chatroom青春版登录openxlab

[2024.2.28] BaJie-Chat-mini internLM2-chat-1.8b 全量微调已经登录

特别鸣谢

<p align="center"> 上海人工智能实验室的大力支持！ </p> <div align="center"> <img src="figure/last_fig1.png" width="100"/> <div> </div> <div align="center"> </div> </div> <p align="center"> 书生·浦语团队的大力支持！ </p> <div align="center"> <img src="figure/last_fig2.png" width="200"/> <div> </div> <div align="center"> </div> </div>

写在最后

时间易逝，光阴荏苒，西游角色扮演这篇Readme文档也将接近尾声。说到尾声，我就想起了我们师徒四人在86版《西游记》中经历的最后一难。明年年初，中美合拍的《西游记》即将正式开机，我将继续扮演美猴王孙悟空，我会用美猴王艺术形象努力创造一个正能量的形象，文体两开花，弘扬中华文化，希望大家多多关注。+

Awesome

Roleplay-with-XiYou 西游角色扮演

简介

🎲Chatroom青春版试玩

🎲单个模型速速开玩

环境配置

一切的开始

快速开始（纯部署版）

环境配置

下载权重

lmdeploy api

聊天室开启

效果一览

数据获取

需要准备的

数据的组成

数据的获取

1.基础问题重复询问

2.原文短对话提取

3.长对话提取（此模块脚本可能需要优化）

模型微调

1. 使用 XTuner 进行模型微调

2. streamlit对话web_demo

3.OpenXLab部署

使用 LMDeploy 进行部署

启动 Chatroom 前端

开始

安装 Node.js

运行开发服务器

浦源大模型系列挑战赛（春季赛）创新创意奖作品

News

相关链接

特别鸣谢

写在最后