old wang
搜索文章
首页
= 768 && isOpen) { isOpen = false; setTimeout(() => enableScroll(document.body), 200); }" >
enableScroll(document.body), 200);" x-transition:enter="transition ease duration-300" x-transition:enter-start="opacity-0" x-transition:enter-end="opacity-100" x-transition:leave="transition ease duration-300" x-transition:leave-start="opacity-100" x-transition:leave-end="opacity-0" style=" position: fixed; top: 0; left: 0; right: 0; bottom: 0; background-color: rgba(0, 0, 0, 0.5); z-index: 1001; overscroll-behavior: none; " >
enableScroll(document.body), 200)" >
首页
# 问题排查
(1)
# 环境搭建
(2)
# RAG
(0)
用户反馈问答很慢 排查思路
SSE 问答和普通接口不一样,用户感受最明显的是两个时间:一个是 排队等待时间,另一个是 模型首包时间。如果用户 30 秒才看到第一个字,不一定是模型慢,也可能是前面排队太久、检索慢、Rerank 慢、Prompt 太长、线程池打满,或者 SSE 写出阻塞。 第一,看 Redis 等待队列。
作者:old wang
发布时间:2025-05-16
分类:
知识库项目记录
标签:
#
问题排查
共 1 篇文章
1
页