我们面临一个具体的工程挑战:需要部署一个基于 LangChain 的文档问答(RAG)服务。这个服务的核心工作流包含几个计算密集且耗时较长的步骤:接收用户查询、从向量数据库检索相关文档片段、构建复杂的提示(Prompt)、最后调用大语言模型
2023-11-15