hajimi使用教程

1. 安装

在huggingface注册账号。
- 注意：用户名不要使用任何符号
注册完成后，进入spaces，如图所示，点击new spaces。注意：
如图所示，填入创建选项，填写完成后，点击create space，一定要记住owner与space name，在之后的酒馆连接中要使用注意：pace name不要使用任何标点符号
如图所示，选择upload file
如图所示，将1.1下载Dockerfile拖入，上传完成后点击Commit changes to main
- 检查上传的Dockerfile有没有lfs字样，如果有，删掉文件重新上传或者重新下载后上传。

环境变量是操作系统用来存储有关计算机运行环境的信息的变量。环境变量可以用来配置应用程序的运行环境，例如设置应用程序的路径、配置文件的位置、数据库连接信息等。环境变量通常以键值对的形式存储，可以通过编程语言或命令行工具来访问和修改。
（上面的内容不用看）只用知道，环境变量是配置程序运行环境的一种方式，可以用来存储一些敏感信息，例如API密钥、数据库密码等。在程序运行时，可以通过读取环境变量来获取这些信息，而不需要将它们硬编码在程序中，从而提高了程序的安全性和可维护性。
在本项目中，我们使用环境变量来存储huggingface的API密钥，连接密码，以及其他的配置信息，但不用担心，大部分的配置信息都已经默认帮你填好，你只需要配置huggingface的API密钥与密码即可。

如图所示，进入settings界面
如图所示，在settings界面中找到Variables and secrets，点击new secrets注意：为了api信息不被泄露，请一定要使用new secrets
此时你正在进行的活动就叫做添加环境变量，即添加配置信息，在2.1中，我们将添加两个环境变量，分别是 GEMINI_API_KEYS与 PASSWORD，如果您不知道其他环境变量的用途，只需要添加这两个环境变量项目即可正常运行，如果您需要添加其他环境变量，请参考2.2中的环境变量说明，自行配置
如图所示为添加GEMINI_API_KEYS环境变量，可以看到，在name一栏中为该环境变量的名称，此时我们添加的是apikey，确保其环境变量名称即name为GEMINI_API_KEYS，而在value栏中，我们需要填入具体的apikey如图所示，每个apikey之间用英文逗号分割，不需要换行，不需要填入其他信息。全部填入后点击save
接着我们需要再次点击new secrets，添加PASSWORD环境变量，和上一步一样，我们需要在name一栏中填入PASSWORD，在value栏中填入密码，然后点击save
等待项目部署完成，app界面显示如图界面，即完成
如果您不需要配置其他环境变量，那么到此为止，您已经完成了环境变量的配置，可直接进行使用环节，如果需要配置其他环境变量，请参考2.2中的环境变量说明，自行配置

环境变量	说明	默认值	必需
`GEMINI_API_KEYS`	从google ai studio 获取的API密钥，支持多个API密钥，以英文逗号分隔	无	是
`PASSWORD`	用户访问所需的password	123	否

环境变量	说明	默认值	必需
`TZ`	配置时区	Asia/Shanghai	否
`MAX_REQUESTS_PER_MINUTE`	每分钟最大请求数	30	否
`MAX_REQUESTS_PER_DAY_PER_IP`	每天每个 IP 最大请求数	600	否
`FAKE_STREAMING`	是否启用假流式传输	true	否
`API_KEY_DAILY_LIMIT`	单api 24小时最大使用次数	100	否
`MAX_EMPTY_RESPONSES`	空响应重试次数	5	否
`BLOCKED_MODELS`	需要屏蔽的模型名称，多个模型用英文逗号分隔	无	否
`RANDOM_STRING`	是否启用伪装信息	true	否
`RANDOM_STRING_LENGTH`	伪装信息长度	5	否
`CONCURRENT_REQUESTS`	默认的并发请求数	1	否
`INCREASE_CONCURRENT_ON_FAILURE`	当请求失败时增加的并发请求数	0	否
`MAX_CONCURRENT_REQUESTS`	允许的最大并发请求数	3	否
`SEARCH_MODE`	是否启用联网模式	false	否
`SEARCH_PROMPT`	联网模式提示词	（使用搜索工具联网搜索，需要在content中结合搜索内容）	否
`ENABLE_VERTEX`	是否启用vertex	false	否
`GOOGLE_CREDENTIALS_JSON`	vertex ai 凭证	无	否

移动设备提示：如果表格在您的设备上显示不完整，可以尝试横向滚动查看完整内容。

首先我们需要您确认您在1.2中记住的owner与space name，您需要在酒馆中填写的链接的格式为 https://owner-space name.hf.space/v1，您应该同时检查二者中是否存在标点符号（注意这里的owner与space name只是代称，不是让您真的填入owner与space name这些英文单词）
如果您对上述内容仍有疑问，我们假设小明的owner为xiaoming，space name为gemini，那么小明在酒馆中填写的链接应为 https://xiaoming-gemini.hf.space/v1
如果您想要测试以上链接是否正确，可以选择去掉链接末尾的v1，对于小明来说，链接应为 https://xiaoming-gemini.hf.space，打开链接后，您应该正确的看到您所部署的界面
终于，您需要进入到酒馆界面，打开API连接配置（即插头），api选择聊天补全，聊天补全来源选择自定义（兼容 OpenAI），自定义端点（基础 URL）填入您的链接，自定义api秘钥填写您在2.1中配置的password，此时的酒馆应该如图所示
如果您在填写完以上信息后，下方没有模型供您选择，请您点击连接按钮，此时您应该可以看到模型，选择模型即可使用

在单文件版本中，更新只需要在相应的huggingface space的settings中选择Factory rebuild，在rebuild完成后系统会自动更新到最新版

如需使用假流式传输模式，请确保酒馆中的预设配置里的流式传输选项为打开。
众所周知，gemini无法使用流式传输模式输出，但酒馆在非串流模式下等待一段时间后会自动中断连接，导致请求终止，同时酒馆不支持自定义最长等待时间，因此本项目提出假串流模式，在使用非串流模式获取gemini回复的等待期间，持续向酒馆发送空包保持连接，经测试能有效避免酒馆在gemini非串流模式下的自动中断连接情况。
目前项目在0.0.3测试版即后续中已默认开启假流式传输模式，如需关闭，请将环境变量 FAKE_STREAMING设置为false。

429报错，空回复：内容触发了谷歌的审查机制，暂时的解决方案是在破限的最前方手动新增一栏，里面随便填点东西就不429了（或者把破线的开头那段丢给ai重新生成，意思相同，文字跟原来不同），或寻求破限作者/社区的帮助。
500报错，502报错：谷歌服务器拒绝了此次请求。
408报错，酒馆断开连接：参考1.5中假流式传输模式说明，开启假流式传输模式。