Home

Awesome

SakuraLLMServer

要求

步骤

显存大小模型规模下载链接
8G7BGaltransl-7B-v2-IQ4_XS.gguf
8G14Bsakura0.92_1.11_IQ3XSS.gguf
10G14Bsakura0.92_1.11_IQ3XSS.gguf
11G/12G/16G/24G14Bsakura-14b-qwen2beta-v0.9.2-iq4xs.gguf

启动

  SakuraLLMServer\llama\...
                    \00_Core.bat
                    \01_768_NP4_KVQ4.bat
                    \Galtransl-7B-v2-IQ4_XS.gguf
                    \...
显存大小模型规模启动脚本
8G7B01_800_NP8_KVQ4.bat
8G14B01_768_NP4_KVQ4.bat
10G14B01_800_NP8_KVQ4.bat
11G/12G/16G/24G14B01_800_NP16_KVQ4.bat
24G14B01_800_NP32_KVQ4.bat

设置 AiNiee

选项设置
翻译设置 - 发送设置 - 使用 Tokens 模式启用
翻译设置 - 发送设置 - 每次翻译 Tokens384
翻译设置 - 发送设置 - 最大线程数启动脚本名称中 NP 后的数字
翻译设置 - 发送设置 - 错误重翻最大次数限制1
翻译设置 - 发送设置 - 翻译流程最大轮次限制10
翻译设置 - 专项设置 - 执行替换后翻译启用
翻译设置 - 专项设置 - 处理首尾非字符文本启用

常见问题