哈喽!
请问是否可以提供代理自定义配置支持(http sock5 等),设置系统全局代理有时候不是太方便。
是否可以新增自定义的请求超时时间设置选项,例如在低配机器本地化部署的大模型,如果生成的结果首token大于30s似乎就被判定为请求失败,然而在我这边的机器实际加载大模型和ClaudeCodeHaha发起第一个请求,大模型服务器出现首个token有时候甚至能达到180+秒(冷启动),一般是20s+到60s+区间是常态(已启动并加载好模型)。默认的30秒在我这机器的本地化跑就处于比较尴尬的位置了,有时候成功,有时候失败!
哈喽!
请问是否可以提供代理自定义配置支持(http sock5 等),设置系统全局代理有时候不是太方便。
是否可以新增自定义的请求超时时间设置选项,例如在低配机器本地化部署的大模型,如果生成的结果首token大于30s似乎就被判定为请求失败,然而在我这边的机器实际加载大模型和ClaudeCodeHaha发起第一个请求,大模型服务器出现首个token有时候甚至能达到180+秒(冷启动),一般是20s+到60s+区间是常态(已启动并加载好模型)。默认的30秒在我这机器的本地化跑就处于比较尴尬的位置了,有时候成功,有时候失败!