酒馆宝宝教程
不能确定萌新有多新——不只是指AI聊天,还有关于网页、计算机网络、数据传输、大模型、各种计算机语言的一小块内容(xml、css、正则等等)……啊,这些东西通通没必要,因为你只是一个来玩的萌新!虽然了解它们有助于你更快自主了解上手各种内容
酒馆是一个可以连接各种AI模型使用的网页平台,未来可能会做成APP,现在的酒馆更像是APP的裸露版,提供了很多功能接口,但是没有封装,可以直接看到/修改设置项而非普通APP那样只需要点点按钮就能完成操作。如果不自己做个性化修改的话,在了解如何导入文件和文件种类后的使用体验和正常APP基本一致。如果你知道github,那么可以继续了解到酒馆也是一个在gihub上开发的开源项目,而我们平时使用酒馆就是把这个项目下载/拉取到本地(自己的手机/平板/电脑等能够存储和运行的电子设备)进行使用。
酒馆开发分为两个分支,一个为release,即稳定版,修改更新频率偏慢;一个为staging,为测试版,开发团队会在这个分支上高频更新新版本,修bug,加功能,有一定积累后才会更新稳定版。二者没有严格的优劣好坏之分,但是由于更新过快(ai发展快速也是一部分原因),会出现不同版本的功能有不兼容的情况,一些以前的预设、说明、酒馆界面的部分功能或许不会适用或者使用时有bug,所以还是推荐大家及时更新酒馆
使用酒馆聊天
在此我进行以下假设
使用酒馆的目的是文字聊天:即交替和AI发送文字消息
已经能够与AI建立稳定的链接:即你发送的消息AI可以接受,AI发送的消息你可以接收
这两个假设将教程限制在无扩展功能(如画图、语音等)、无获取各类AI模型和具体连接的方法介绍上(会介绍连接界面)
一般所有人第一次安装成功打开酒馆后会看到如下界面(左图电脑,右图手机):


以左图为例,上方白色条中的九个图标为主菜单,下方白色条中的左侧两个图标也属于菜单,但功能不同,后续会详细说明。
通常,社区聊天中对这些菜单的图标会依次称其为(如右图所示):预设/破限、插头、A 、世界书、用户设置、图片、三个小方块堆起来(扩展)、笑脸(用户)、角色(角色设置)
下方图标称呼(从左至右):三横线/三横杠、魔术棒、小飞机/纸飞机/发送
从这些称呼中可以看出,主要从图标样式和实际功能代指它们以在沟通中达成共识
以下为各菜单区功能的一句话简介:

预设/破限:可以导入文件,其中有规范的指令指导AI回复(预设)和防止AI道歉(破限),预设为主体,破限通常为指令中的一部分,可能单独可能与预设混合也可能没有。因此两种称呼时有混用

插头:连接模型(红色带感叹号代表不能与AI建立链接,不符合前述第二假设,无法聊天)

A:高级文本设置。太高级、不会、没用、非萌新向,不用管不用动

世界书:像书一样方便你写入一类信息并存储,提供结构组织功能,像书一样每本是独立的,这是针对你的理解而非AI

用户设置:类比理解为每个APP都存在的账户、设置等内容,可以管理用户信息,提供个性化设置,如各个区域的颜色设置,UI显示设置等等

图片:仅仅是用作背景的图片,会做为底图填充整个界面,等价于手机/电脑壁纸

扩展:有诸多功能组成的二级菜单,常用的有安装扩展、快速回复、正则。

用户:特指聊天时你的身份,可以在这里创建多个身份并管理切换

角色设置:特指聊天时AI模型用于和你的角色对话的身份,可以在这里导入创建管理角色卡。
因此,__基础__使用就只需要连上AI模型、新建一个角色卡(什么都不填就起一个名字就行)、给自己创建一个身份(最基础的只填一个名字)、点击这个角色条目四步,酒馆就可以新建一个聊天界面,你就可以和AI进行聊天,和在官方网站聊天一样,十分简单~
接下来,开始进阶:
- 我想它回答得长/有文采/聊瑟瑟/像写小说/像语聊==想要某种特定风格/范式的回答==添加预设破限
- 我想它作为小说角色/动漫角色/我的OC/原创角色和我玩角色扮演 或者 想要它帮我写作业/解答 ==想要AI作为某一特定身份回应==添加角色卡
- 我想它在回复时加入xx/给它加世界观/对xx进行强化==想让AI对某个内容有特定理解==添加世界书(又名知识书)
- 我想让回复时不要出现xx/这前面一大段是什么/……==针对特定文字处理==添加正则
以上为问题==归纳==解决方案,所有的添加内容均是导入文件,或者自行新建,除角色卡会有图片格式外,文件均为json格式,正则常常会在各种文件中附带需要导入,例如一个预设文件搭配三个配套的正则文件,注意查阅作者介绍,区分不同文件,分别导入对应位置
酒馆各常见图标及功能简介汇总
可以自行意会的萌新可跳过此处,是电脑也不用看,部分UI鼠标悬停会出现文字说明
汇总:

- 勾选:打勾选中启用,再点一下取消

- 导入:形状就是箭头指向里面,所以是导入,对应下面那个是导出。(🔥新人导入无反应不用怀疑自己理解错了,很可能在常见问题中有解答)

- 导出:将酒馆里面的相关内容导出为json文件,角色卡例外,有png(图片格式)选项

- 删除:垃圾桶,不多解释了

- 保存:不点保存的话,切换后修改作废哦,不过可以在不小心动了某个地方时,通过切换其他内容再切回来的方式恢复

- 添加:自己在酒馆里写东西,可以不用大佬们写好的

- 列表(最下面一行才是没有点开的样子):点击后可以弹出列表,切换想用的各种(世界书、预设等等)

- 下拉菜单:🔥注意它是可以折叠展开的!尤其是新人使用时反向代理那里!!!展开才能看到完整设置内容,不要再把各种链接填错位置或者忘了反代也要修改,不仔细检查还问为什么连不上

- 添加:添加“子”条目

- 链接:常在预设处使用,左侧点击可以弹出显示所有预设条目,部分条目是作者自行添加的,需要用链接才能在下方呈现(🔥关条目时不小心点到这里不要慌,没有删掉,可以在列表里选择条目重新链接进去)

- 白叉:关闭弹出提示框

- 红叉:删除左侧显示的子条目内容

- 黄色:恢复初始排序(不是作者排好的,意义不大,不要用)

- 笔:命名/重命名

- 问号:点击跳转酒馆官方说明文档链接

- 展开:展开小框内容为弹出提示框,方便编辑,不用在小窗里艰难滑动!

- 红电源:关闭,不启动

- 绿电源:启动

- 其实是左右两个:展开所有条目、收拢所有条目

- 统计:点击查看统计结果


- 眼睛:显示/关闭显示

- ⭐️:收藏角色,可以特殊显示,方便快速找到切换

- 角色高级设置

- 角色绑定世界书、聊天附带世界书

- 删除:通常在角色卡和聊天记录文件中出现,谨慎选择🔥

- 标签:点击可以看到标签,并且进行增删改,为角色添加标签等操作

- 复制:复制一个相同的内容(1)

- 上级列表:点击返回角色列表

- 新建角色

- 群聊设置
当然,这样非常不直观,因此,请看下面:
这是聊天界面的图标:

这是各个菜单界面的有关图标:






部分名词解释
DC:Discord软件简称,在谷歌商店或官网可以下载。
类脑:Discord上的开源AI简中社区,是酒馆爱好者聚集地,禁止商业行为,强调版权意识,推崇原创与共享。
AI/模型:指的是由人工智能驱动的模型,可以进行各种任务,例如文本生成、图像处理等。
语义:指AI理解和处理语言的方式,关注的是语言背后的意思而非单纯的词汇。
Api:应用程序接口(API),是软件系统之间交互的标准协议。它允许不同的软件应用互相通信并交换数据。
Cookie:存储在用户设备上的小段数据,通常用于保存用户的偏好设置或身份信息。
Clewd:一个Github上的项目,可以利用cookie帮助访问需要身份认证的服务。
小克/克劳德/Claude:指Claude模型的昵称,是由A社开发的一个AI模型。
A社:Claude模型的官方公司简称,指的是Anthropic公司。
Gemini/哈基米:谷歌推出的最新AI模型的简称/爱称。
DS:Deepseek的简称,一款强大的搜索引擎或工具,通常用于特定AI数据的查找。
模型:指人工智能的算法、架构和训练方法,通过这些模型,AI能够理解和生成语言或执行任务。
审查:对内容的监管和控制,通常指对不安全、不合适或违反规则的内容进行拦截或过滤。
截断:当生成内容的长度超过了模型的限制时或者被审查时,AI会自动切割或忽略超出的部分,确保回复在设定的范围内。
道歉:
硬道歉:模型拒绝生成不安全或不合适的内容,通过明确的道歉声明进行反馈。
软道歉:回避某些敏感话题或内容,表面上生成正文内容,但情节上避免了不安全或敏感的部分。
降智:指模型的生成质量因某些原因而下降,可能由于超负荷的运算、硬件限制或模型本身的限制。
Thinking/COT:指AI进行思考,指导模型如何在回复之前进行自我推理或拆解问题。
文风:AI生成内容时所采用的表达方式和风格。
宏:指在模板中使用的占位符,例如,会在实际执行时自动替换为你为自己设置的名称或其他动态内容。
快速回复/QR:预设的代码片段,当用户点击按钮时触发,快速生成预设的回复内容或者完成某个操作。
美化:酒馆界面调整,通常是为了提升用户体验或界面美观进行的细节修改。
前端:指网站或应用程序的用户界面部分,用户能够直接交互的部分。
前端助手:一种前端的插件或工具,通常安装在浏览器扩展中,帮助用户进行UI调整、辅助功能或快捷操作。在类脑看到的前端助手是大佬写的github项目,作为插件安装在扩展中,实现前端脚本(如美化、手机界面、编辑世界书、导入快速回复等)运行,为酒馆角色卡编写提供额外支持
帮助文档:提供用户指导和操作说明的文档,帮助用户理解如何使用酒馆的各项功能。
前台:指当前展示在手机或网页上的界面,也叫酒馆页面。与后台相对,后台是程序和服务的运行区域。
小作文:通常指短小的文本内容,用户输入后生成的简短文章或句段。
提示词后处理:指对发送给ai的内容(提示词)进行的处理
摘要:对长篇内容进行简化和提炼,提取出主要信息或核心观点。
总结:对内容或事件的总结性陈述,通常用于简洁地回顾重点。
状态栏:界面底部显示的区域,通常用来展示操作进度、通知或当前系统状态,一般会用在ai回复里,用<statusblock>包裹。
roll:刷新回复(具体请参照酒馆聊天部分)
正式的酒馆功能介绍
预设/破限
导入破限/预设通常会附带正则,可能还需要导入快速回复(QR)或者其它文件,需要按作者说明操作,找到最新版文件,不要遗漏。不同预设因为作者写预设时的语句、用词、倾向等等,AI呈现的风格也不尽相同,可以多多尝试比较选择自己喜欢的。
一般情况/对萌新而言,破限/预设处无需任何调整即可正常使用,作者有额外说明除外
这个界面可大致分为四个部分,依次介绍(会借用两位大佬的预设)
了解破限/预设
不用了解了,直接去下载用吧
字符长度相关
- 上下文长度:
准确来说应该是上文长度,越长ai回复时看到的内容就越多,那自然可以参考的信息就越多。把ai接受上下文当成你在考试做阅读理解,只能从头到尾看一遍,那么你出现的问题就是ai会出现的问题。
- 最大回复长度:
答题纸为格子型,不能挤占格子,超了没地儿写,最大回复长度设置太大没有意义,因为模型可能不会写那么多
- 备选回复
官网模型一般都不支持,可以查看官方对模型的说明文档
- 流式传输:
你是监考老师,开启后你看着它答题,也就是ai回复多少就可以看多少;没有开它交卷后你才看到答题结果,只能等ai全部生成完才能收到回复结果
部分因长度产生的问题举例:
a. 上下文太长(报错 promot is too long):一口气读完所有内容,没气憋死了。claude普通cookies不能超过25k,Gemini的有效注意力一般在40k左右,不排除奇迹发生突然出了一个翻旧账的回复
b. 内容混乱:你在做外国文学阅读理解,看到了一堆家族人名,最后做题时不能回头看文章写出的答案
c. 没有按逻辑变化(比如一些数值):超长篇阅读时出现的忽大忽小的数字,题目:请你分析接下来的情景下的数字时你的答案(ps:你记忆力绝佳,不会忘记所有数字只记住最新的)。这也是时间这类规律变化的内容呈现效果更好的原因。
d. 重复:题目:本题要求写1000字回答,请作答,你能写完,写到最后时能记住前面的内容并保持一致吗?(这里的解决方式:思维链(cot),人话可以说是写作前的大纲)如果你是个差生写不完,后面你是不是会水字数?AI同理

e. 红色框的警告(token budget):上下文长度太小,不足以向AI发送所有的必要内容,就会警告,发送时AI不会回复,聊天界面上会出现报错信息

调整回复稳定
不同模型参数不同,不同参数作用不同,破限作者一般会调好不用动,自己也可微调。但是由于模型和模型所在公司做的限制,这些参数的调整未必有效。
举例:温度。
参数数值大小会让模型回复或者刷新回复(roll)时,稳定写同一个答案到天马行空的答案====温度低到高
**补充** :使用clewd和claude cookies没有温度参数,因为官方禁止传递这个参数,所以设多少都没有用
根据酒馆官方文档搬运的其它参数介绍:
Top-k : 将令牌池限制为 K 个最有可能的令牌。数字越小,一致性越高,但创造性越低。将该值设置为 0 可禁用其效果。举例说明就是ai对你的回复在只有一个字的情况下,ai可能从K个字中选一个回复
Top-p : 将令牌池限制为其概率加起来等于 P 所需的令牌数。较低的数字更一致,但缺乏创造力。将值设置为 1 可禁用其效果。举例说明:ai对某句话的回复可能性有五种,如果50%回复a,30%回复b,10%回复c,6回复d%,4%回复e,那么设置为96%,ai会在abcd中选一种而不会考虑e
频率惩罚:尝试通过根据标记在上下文中出现的频率对其进行惩罚来抑制重复。
- 有时,如果角色专注于某件事或重复相同的短语,增加此参数会有所帮助。
- 如果设置过高,此参数将中断响应。将值设置为 1 可禁用其效果。
存在惩罚:上次生成的标记中有多少个标记将被视为重复惩罚。如果设置得太高,可能会破坏响应,因为“the、a、and”等常用词将受到最大惩罚。将该值设置为 0 可禁用其效果。
下图为gemini参数(左,3个),claude参数(右,4个)


第三部分
这里它自己写了解释,可以根据解释理解。快速提示词部分其实是把预设的一部分提示词通过这个窗口可以直接查看编辑,意义不大
预设具体条目
- 以默认default为例讲解:
预设里的条目就是会发送给ai的全部内容,也就是上下文,如果里面的内容超过模型上下文模型会报错,如果超过设置的上下文长度,酒馆会报错。条目从上到下的内容会依次在点击发送键(飞机图标)发送给ai,其中如果超出长度,只会从chat history处删减(在聊天界面的楼层之间可以看到一条虚线,虚线前的内容就是在发给ai时丢了的=ai不会有虚线前内容的记忆)。条目里面可以填充具体的提示词,有的条目(word info, char Description等等)是在其他的地方填写(对应是世界书、角色设定)就不能在此处修改,点击条目后的弹出窗口内没有提示词详情。
- 补充点:
a. 预设/破限作者通常会用各种方式将各个条目里面的内容包裹并加上xml标签(类比快递理解)常见方式:<thinking>具体内容</thinking>
这种方式可以嵌套(大包裹里装小包裹),优点,调理清晰,大对小有全局、局部效果。不想某个部分起效果就把这个“包裹”关掉,体现为关闭条目右侧开关,条目变暗。
b. 条目里的标题是给你看的,方便你理解处理,标签在内容里,需要点击条目才能查看标签和具体信息
c. 同种类型或者作用的标签最好只有一个,不然容易冲突:你不能既命令ai先迈左脚,又命令ai先迈右脚,ai不会质疑,执行结果显而易见。还有一种情况是破限作者的破限方式都有固定的格式,一旦有冲突或者关闭了不能关的条目导致格式残缺,就会降低破限效果。
d. 标签命名不是随便取的,和代码里面的变量名一样,不会让人看不懂理解不了,大佬一般用英文写的(中文也可以),理解一下就是内容里的命令是关于什么的了。比如<thinking_format>是指导ai如何思考,<writing>是指导ai如何写作等等。
此外,一个常见的词cot,为链式结构,让ai一步步跟着提示做,step by step,没有什么具体含义或者说是使用赋予含义。
(<…>中起名不可包含空格,ai有概率因为空格无视这个标签内的内容,建议下划线连接)
e. 为什么部分有红色链接,部分没有:因为新建预设时会提供基础条目(不能删),不够用自己加条目就要用链接加到下方条目栏呈现
插头
作用是连接ai模型,具体连接方法不在我这里介绍了。
这里讲几个关联存储的内容吧:你可以在预设、插头、反代处分别看到保存按钮。
这些保存就像是在数据库对您当前的设置内容按名称,设置项的组合进行了一条存储,后续通过点击下拉列表的选项(名称)时,会根据这一条对应的设置项的组合快速切换设置。切换预设时会同时切换预设对应在插头里的所有设置,切换插头顶部那一行的菜单时也是如此,只有反代处切换只会切反代,所以有时候会出现反代名称和当时设置的内容不匹配的情况,再切换一下就好了
提示词后处理

不同的模型对对话有不同的要求,以deepseek-r1为例,严格要求消息中各角色消息顺序必须为:系统提示词全部在最前面,然后user发送第一条消息,user与char角色消息互相交替,不能出现某个角色连续发送两条消息的情况,且最后一条消息必须为user发送的,那么这种情况下就需要选择严格提示词后处理,避免报错。
世界书


插入位置
在角色描述和场景之前插入世界信息条目。对对话有中等影响。
在角色描述和场景之后插入世界信息条目。对对话有较大影响。
示例消息之前:世界信息条目被解析为示例对话框,并插入到角色卡提供的示例之前。
示例消息之后:世界信息条目被解析为示例对话框,并插入到角色卡提供的示例之后。
AN 顶部:世界信息条目插入到作者注释内容的顶部。根据作者注释的位置,其影响各不相同。
AN 底部:世界信息条目插入到作者注释内容的底部。根据作者注释的位置,其影响各不相同。
@ D:世界信息条目插入聊天中的特定深度(深度 0 是提示的底部)。
⚙️-作为系统角色消息
👤-作为用户角色消息
🤖 - 作为助手角色的消息
示例消息条目将根据提示构建设置进行格式化:指示模式或聊天完成提示管理器。它们还遵循示例消息行为规则:在完整上下文中逐渐推出、始终保留或完全禁用。
如果您的作者注释被禁用(插入频率 = 0),A/N 位置中的世界信息条目将被忽略!
在条目标题右侧有一个蓝色圈(蓝灯),还可以替换为绿圈(绿灯)、链接符号,分别代表常驻、条件显示和向量显示。蓝灯的内容会一直显示在消息中,绿灯的内容需要设置关键字,只有当你的消息中包含该关键字时才会出现在发送给ai的消息中,向量显示是让AI理解内容中的语义,需要用模型处理,效果不是很明显和稳定。
用户设置
官方文档有UI设置的解释页面,直接搬运的:
- 主题颜色上面一部分不介绍了,默认有五个主题,可以自建或导入主题,最近的妆宜杯让美化区活跃很多,可以自行挑选喜欢的主题下载导入。
2.主题颜色:
可以按喜好进行调色美化。
UI背景是点击上方UI和整体边框的背景颜色
聊天区有三层,从下至上分别为:图片背景、聊天背景、用户/AI消息模糊色调
后面两层都是纯色,可调透明度,点击色块即可调色
调色需要美商,调完后需要保存,不然重启就没了
3.滑动条:
聊天宽度:整个界面(主UI下方)的宽度,手机edge等浏览器开适配可能让它失效
字体比例:可以调整字体大小
模糊强度:整体模糊,调高看不清背景图片,禁用模糊会让运行稍稍快一点
文本阴影宽度:字面意思,在文字周围加一圈阴影
- 勾选框:
第一组主题,字面意思可以理解,有一部分开关没有什么效果,不要纠结
部分解释:

视觉小说模式:聊天界面降低,展示70%的背景图
第二组,角色处理
关于角色卡导入和角色页面展示时的选项

角色列表子标题:选择在角色名称下显示的附加信息角色列表:
角色版本
创建者
导入卡片标签:控制导入角色卡时如何处理标签:
询问 - 每次导入时显示对话框
无 - 不导入任何标签
全部 - 导入所有标签
现有 - 仅导入已存在的标签
高级字符搜索:启用后,使用模糊匹配并搜索所有字符数据字段,而不仅仅是名称。
首选角色提示:如果启用,则在可用时使用角色卡的系统提示覆盖。
首选角色说明:如果启用,则在可用时使用角色卡的后历史说明覆盖。
永不调整头像大小:防止对导入的角色图像进行裁剪/调整大小。禁用后,图像将调整为 512x768显示头像文件名:显示角色列表中角色头像的实际文件名。
无剧透模式:将角色定义隐藏在编辑器面板中的剧透按钮后面。
第三组,杂项:

重新加载聊天:重新加载并重新绘制当前聊天。
调试菜单:访问调试选项。
流畅流:实验性功能,可使文本生成更加流畅。包括速度控制滑块。
消息声音:消息生成完成时播放声音。
仅背景声音:仅在浏览器选项卡未聚焦时播放声音。
放宽 API URL:减少 API URL 的格式要求。
知识书导入对话框:导入嵌入传说的人物时,显示世界信息/传说书的导入对话框。
自动选择输入文本:单击时自动选择某些输入字段中的文本。
Markdown 热键:启用 Markdown 格式化的键盘快捷键。
恢复用户输入:刷新页面时保留未保存的用户输入。
MovingUI:允许通过拖动重新定位 UI 元素(仅限 PC)。
重置按钮恢复默认位置(reset)
用于保存/加载 UI 布局的预设系统
第四组,聊天消息处理:
推荐开启允许char、user两条,不开可能会遇到问题,默认好像是没有开

信息显示设置
控制聊天界面中消息的加载和显示方式。这些设置会影响整体聊天体验和性能。
# 要加载的消息数:分页前要加载的聊天历史消息数(0 = 全部),针对那些可以聊几百楼的,加载少一些
流式 FPS:流式文本的更新速度(5-100 FPS)
示例消息行为:
逐步推出
始终包含示例
切勿包含示例
#输入和响应控制
确定如何发送消息以及 AI 如何继续响应的设置。
输入发送:选择禁用、自动 (PC) 或启用
“发送”继续:使用“发送”按钮继续 AI 响应
快速“继续”按钮:显示按钮以延长AI的最后一条消息
快速“模仿”按钮:显示单消息角色模仿按钮
滑动:显示箭头按钮以选择其他 AI 响应(PC 和移动设备)
手势:启用滑动手势进行生成(仅限移动设备)
删除消息前确认:请勾选,否则当你想要删除重roll的某一条消息时,不会出现以下删除该分支还是整条消息的提示,而是把对user的多次回复都删了

禁止外部媒体:最好不要勾选,部分前端卡,含界面的,图片都是通过链接从而连外部媒体才显示,禁止后就加载不出来了
CSS:高级功能(一种代码)
简要说明:自定义CSS是用来改变界面外观的工具。你可以用它调节颜色、字体、大小、间距,甚至是添加一些酷炫的动画。它就像是给酒馆的装修方案,别人提供了一个默认样子,但你可以按自己的喜好改成更符合你心情或风格的样子。
比喻版:把你的酒馆界面想象成一本书(或者一幅画),CSS就是一套“上色规则”和“装饰说明”。默认的界面是素描图(没啥装饰)。CSS就像你的调色盘和画笔。比如界面是一张纸,内容是空白的图案,而CSS就是涂颜色、贴亮片的工具,涂成啥样完全由你决定。
那在让ai辅助时,就要用这种思路去描述处理的对象、对象在界面中的代码表示(需要处理的图案)、想要的效果
附一个相关教程链接:
https://discord.com/channels/1134557553011998840/1310996336903979008
快速回复
已经在其它区域有了教程
正则

常用正则类别介绍
因为同类正则捕获内容基本相同,所以如果有正则匹配到相同的对象进行替换会产生冲突,一般只有一个生效,如果生效的不是你需要的那一个,那么就会出现问题,所以,仅建议开启必要正则,或者你弄懂之后有选择地开启/自行编写正则
一般可以分为以下几类:
- 添加某个内容:
一般是在user消息前添加角色身份(role),和破限有关
- 删除/隐藏某些内容:
一般是用来使酒馆前台(屏幕)只能看到正文剧情,删除/隐藏思维链;或者删除/隐藏发给ai的上下文中的无关内容,减少上下文长度
- 折叠内容
有固定格式(实际文本为<detail>和</detail>之间的内容),在前台会被处理为小三角,点击才能展开,这个其实严格意义上不需要配合正则,是酒馆自动处理的,正则通常会与这个结构结合实现某些效果
- 美化
通常是捕获固定内容然后用匹配组匹配,再在替换为中加入渲染代码和匹配组,辅以前端助手,实现美化和特殊界面展示
了解正则
简:
匹配:查找符合条件的部分。
替换为:把匹配到的内容替换成你指定的新内容。
捕获组:通过 () 包裹的部分,捕获并保存匹配的内容,可以在替换时使用 $1, $2 等进行引用。
测试模式:点击可有两个输入框,可以测试正则效果。
详:
- 匹配(Match)
匹配是指使用正则表达式去查找字符串中的某个模式(比如字母、数字、特殊符号等)。当正则表达式成功找到符合条件的部分时,就称为“匹配”。
例如,正则表达式 \d{3} 匹配的是三个连续的数字,如果字符串中有 "123" 或 "456",它们就符合匹配条件。
- 替换为(Replace)
替换是指使用正则表达式匹配到某个内容后,将其替换成新内容。在酒馆的正则替换框中,替换为输入框就是你要把匹配到的部分替换成的内容。
例如,假设你用正则 \d{3} 去匹配 123-456-789 这个字符串,你的替换内容可以是 XXX,那最终替换后就会变成 XXX-XXX-XXX。
- 捕获组(Capture Groups)
捕获组是正则表达式中用括号 () 包裹起来的部分。括号内的内容会被捕获并存储,你可以在替换时用这些存储的部分。
捕获组的作用:它允许你将正则表达式中的某部分进行单独提取并在替换中再次使用。
捕获组以 $1、$2、$3 等方式表示,其中 $1 代表第一个括号内匹配的内容,$2 代表第二个括号内匹配的内容,依此类推。
举个例子(界面上提供了测试框):
假设我们有这个字符串:abc-123-def-456 我们希望匹配这个字符串,并提取其中的数字部分(123 和 456),然后把它们替换成另一个格式。
正则表达式:(\d+)-(\d+)
(\d+) 捕获并匹配数字序列。
这里,我们有两个捕获组:
第一个捕获组是 123
第二个捕获组是 456
在替换框中,我们可以写 $1:$2,也就是将匹配到的数字用冒号连接:
替换为: $1:$2
替换后,结果会是:123:456
基础正则介绍
字符匹配
普通字符:最基本的正则表达式匹配就是字符本身。比如,a 匹配字符串中的字母 a。
点号 .:表示任意单个字符(除了换行符)。例如,a.b 可以匹配 acb、a1b 等
- 字符集(方括号 [])
方括号用来定义一个字符的集合,表示匹配集合中任意一个字符。
[abc]:匹配 a、b 或 c 中的任何一个字符。
[a-z]:匹配任何小写字母。
[A-Z]:匹配任何大写字母。
[0-9]:匹配任何数字。
- 字符范围(连字符 -)
在字符集内,连字符 - 表示一个范围。
[a-z]:匹配所有小写字母。
[0-9]:匹配所有数字。
[A-Za-z]:匹配所有字母(不区分大小写)。
- 字符类
\d:匹配一个数字,等价于 [0-9]。
\D:匹配一个非数字字符,等价于 [^0-9]。
\w:匹配一个字母、数字或下划线,等价于 [a-zA-Z0-9_]。
\W:匹配一个非字母、非数字、非下划线的字符,等价于 [^a-zA-Z0-9_]。
\s:匹配任何空白字符,包括空格、制表符、换行符等。
\S:匹配任何非空白字符。
- 量词
*:匹配前面的字符零次或多次。比如,a* 匹配空字符串、a、aa、aaa 等。
+:匹配前面的字符一次或多次。比如,a+ 匹配 a、aa、aaa 等,但不匹配空字符串。
?:匹配前面的字符零次或一次。比如,a? 匹配空字符串或 a。
{n}:匹配前面的字符恰好 n 次。比如,a{3} 匹配 aaa。
{n,}:匹配前面的字符至少 n 次。比如,a{2,} 匹配 aa、aaa 等。
{n,m}:匹配前面的字符至少 n 次,但不超过 m 次。比如,a{2,4} 匹配 aa、aaa 和 aaaa。
- 位置匹配
^:匹配字符串的开头。比如,^a 匹配以 a 开头的字符串。
$:匹配字符串的结尾。比如,a$ 匹配以 a 结尾的字符串。
- 分组与选择
():用于分组,表示把多个字符或表达式作为一个整体来处理。例如,(abc)+ 会匹配 abc、abcabc 等。
|:表示“或”操作,匹配左右两边的表达式中的任意一个。例如,a|b 匹配 a 或 b。
- 转义字符
\:用于转义特殊字符,使其失去特殊含义。例如,\. 匹配点号 .,\* 匹配星号 *
此外,这位大佬也写了宝宝教程,我觉得已经很清楚了,只剩下下面的勾选框没有介绍(坐等大佬更新,其实自己慢慢测试也可以试出来)。具体的正则写法可以直接去网上搜,不存在酒馆需要用特殊写法的情况。
https://discord.com/channels/1134557553011998840/1304468635326222366
酒馆的正则设置选项
左侧的勾选框是关于处理对象的,比如勾选用户输入正则就会对用户输入生效,其它三个同理可得
右上方的勾选框
已禁用:效果和直接开启关闭正则按钮一样
在编辑时运行:
替代正则表达式:
右侧下方的勾选框:这里要说明一下——酒馆把一份内容分为了三份:①原始内容②酒馆界面显示③后台发给ai的提示词显示。仅格式……的意思是只处理②或者③,但是原始内容不变。[补:只针对用户输入和ai输出,世界信息和快捷命令不清楚,简单测了下无效,不清楚具体怎么搞]
最小深度x:从当前楼层向0层数,数到x开始处理,不填默认从最新楼层开始; 最大深度d2:从d1开始处理,直到数到d2或者0层结束处理,不填默认处理到0,d1、y为数字
正式的聊天相关功能介绍
左下角的两个功能图标


第二个魔术棒图标几乎没什么用,和消息顶端菜单栏功能重叠比较大,也有文字解释(图例为打开数据库后的弹出窗口),我认为不用讲解了


作者注释可以用来插入一些内容,和世界书差不多,其实后面看前后台那张图解就可以发现,这些区别统统不会发给ai,只是给人看的,ai只能看到填入的文字而已,所以不存在填世界书更有效或者填作者注释更有效
CFG缩放:(用不了)调整响应创造力
词符概率:(用不了)查看代币生成统计数据
返回父级聊天:返回主对话(在下方聊天文件的组织与存储中有详细介绍)
保存检查点:创建故事检查点
转换为群组:转换为群聊
开始新聊天:开始新的对话
管理聊天文件:导入、导出、重命名等聊天文件操作
删除消息:选择并删除多条消息
重新生成:创建新的响应__(丢弃本次生成的内容,ai重新生成回复)__
模仿:人工智能以用户身份撰写消息__(ai__作为你帮你回复,生成的内容出现在下方你的输入框/打字的地方,如果开了防抢话会效果不好__)__
继续:扩展最后一条消息__(在原消息后继续生成思考和回复,而不是出现一条新消息,因此如果有思维链和隐藏思维链正则,需要手动编辑删除两次回复中的思维链部分,不然你在酒馆界面上只会看到最新的回复,点击继续之前的回复被隐藏了)__
每条消息顶端功能菜单栏
不同的酒馆版本会有一些细微差别,但是差别不大。

关于最右边的铅笔图标,点击可以编辑原始消息,尤其是开了隐藏思维链和玩前端卡的,可以看到渲染前的原始ai生成内容和ai根据思维链指导下的思考过程
关于重新生成回复,有两种方法:


聊天文件的组织与存储


我第一次和小克聊天,聊到了#5,这时,我点击分支图标,于是创建了一个聊天分支,在这个分支中,我和小克继续对话,如右图,有了#6和#7,此时,点击管理聊天文件,可以看到里面出现了两个文件,聊天分支的命名前自动加上branch,这两个聊天文件是相互关联又互不干扰的。
此时在聊天界面点击返回到父级聊天或者在聊天文件中选择都可以进行切换,图上我切换了之后又对话因此有了左图的#6、#7。
分支和检查点都是在前文不变的基础上玩走向不同的剧情的。可以理解为这是一棵剧情树,分支是立即随便找条消息,点检查点,输入名称,在管理聊天文件里面就可以看到以这个名称为文件名的聊天文件,点进去聊天就是从这里开始玩分线长出来一根侧枝,主干暂停;检查点是在这里标记可以长侧枝,以后等想玩分线再到这里找。配合左下角的三横线中返回父级聊天功能可以快速切换回主干,也可以在管理聊天文件里面切换(只要你记得住)。因为检查点不是立刻开展分线,所以要你输入名称作为一个新的聊天文件名,而分支是立刻切换到分线,所以它是自动在原文件名后面加上branch作为侧枝的文件名。
关于AI聊天,酒馆究竟在干什么?
酒馆的主要功能,是将文字(字符串)以一定的格式发送给AI,包括预设、破限、正文、角色设定、世界书等等,图片、文件都是附加功能。所以,ai收到的其实是一个超长文本内容,酒馆后台可以看到一些内容,已经偏向真实发送的内容格式了,但更主要的是给出一个清晰的结构方便用户理解处理,也方便答疑。而前端,也即手机、电脑等界面,是各种封装后的,加入了前端设计,便于使用。
以下是用酒馆和ai互发消息的一个信息流动的简图示意:

手机、平板、电脑等都是硬件/电子设备,不同型号的系统设计不同,因此电脑一般比较稳定,而手机因为系统限制会出现各种奇怪的问题。
在使用酒馆时,后台启动后,需要通过在浏览器输入地址:127.0.0.1:8000,才能进入前台酒馆界面。这是你在本地服务器上运行的一个网页。127.0.0.1是本地地址(也叫回环地址),意思是你访问的是自己电脑上的网页,不需要连接到外部网络。端口号8000是指定的服务端口,也就是说,那个网页服务通过8000端口与你的电脑进行通信。简单来说,你是在访问自己电脑上的一个应用或服务,而不是互联网上的网页。你打开浏览器,输入127.0.0.1:8000就能看到运行在你电脑上的内容。不同的进程会占用不同的端口,所以运行了一个酒馆进程就不能再开另一个,会产生端口冲突,除非你改端口号(clewd也是同理)
而要实现与AI通信,就需要反代,获取到AI的位置才能在茫茫网络中与Ai建立连接,建好了之后就是上图的一个示意了,在这个通道里,你从左至右把消息通过屏幕(前端)输入,在经由后端处理转化为数据,通过网络发送到AI所在的服务器,进过审查给AI,得到ai的回复再发回来,你才能在屏幕上看到回复的消息。
其中,任何一个环节卡了就会报错,包括但不限于截断、数据错误(有丢失不完整)、审查拦截、后台掉线死了等等。
以下是对照了前端的预设区下面一堆条目的酒馆后台的消息结构,每次其实都是连带上下文重新发给AI,相当于在官网使用时开了一个新对话/进程,但是有历史消息。

参照原宝宝教程更能直观理解消息的结构分布:
所有消息最终都会按序整合到message列表中,作为一个个字典存在,字典里包括该消息的角色(系统、AI助手、用户)和具体的消息内容,message列表和其它参数一起作为一个大字典形成发送给AI的全部promot,ai接受到这些后,才会继续预测回复,因此,理论上越靠下的消息(越新)就越会影响AI
如果忽略其中的角色只看字典,整个内容也是有完整结构的,尤其是关于claude3.5sonnet,它对xml标签敏感,所以很多预设都习惯使用标签包裹内容(非强制性要求),一个标签一般作为一个任务,可以提高ai的理解和执行效率,基于此,一个比较抽象的手绘全部提示词就像下面这张图一样:

问题解答
三种常见总结方法:
我目前只能提供三种总结方法(以我自己的使用为例):
- 破限处总结:
在ai生成剧情的同时生成一个摘要,配合正则可以自动删除后台提示词中的正文而保留摘要起到节省token作用(参考正则教程理解。例:lyean预设)
- 快速回复:
利用qr代码将一段楼层(如消息编号10-18)的剧情发送给ai并配合提示词让ai总结并将总结结果写入世界书(例:总结姬)
- 世界书:
写一段总结promot并将插入深度调至d0,不写任何消息按发送键,ai接受到的最新消息就是这个d0深度的promot,会按其要求生成回复。可自行将回复存储起来作为总结放至世界书
(例:八零总结世界书)
- 自行发送:
自行要求它无视角色扮演并输入总结要求然后发送该消息,它会按消息的要求回复。
(无例,maybe:【下次回复不推进剧情,也不需要有任何格式要求。只需要对我的问题进行回答】
我需要你将一下故事进行压缩。要求:XXXX)
总之总结要么当时摘要要么事后总结,ai就是按指令响应的,具体要求只是为了适配酒馆执行和提升ai响应效果。核心都一样。而且,不要指望ai能总结得好到哪去,想一直高质量游玩,最好的方法是提升文笔自己写总结, 鱼与熊掌不可兼得
聊天出现掉格式、回复不对问题怎么办
首先请重新生成,看是偶尔的现象还是普遍问题,ai不是计算器,输入1+1一定会回复2
通用解法:先保证只有全局预设正则和局部角色自带正则,然后重roll,最后刷新重启,世界书也不开只有角色自带的
其次关掉字数控制,ai会为了水字数凑回复
最后检查你的预设、世界书条目开启读取情况
此外:模型类型不同智商有区别、渠道掺水、官网搞事降智等等