构建支持 Rerank 与流式响应的 LLM RAG 管道:Pinecone、Shadcn UI 与服务端的深度整合实践 构建支持 Rerank 与流式响应的 LLM RAG 管道:Pinecone、Shadcn UI 与服务端的深度整合实践
一个基本的 RAG (Retrieval-Augmented Generation) 管道通常止步于向量相似度搜索。实践中,这种方案返回的上下文质量常常参差不齐,导致大语言模型 (LLM) 的生成结果偏离预期,甚至产生幻觉。单纯依赖 top
2023-11-15
使用 Vercel Functions 与 ClickHouse 构建低延迟的研发效能度量管道 使用 Vercel Functions 与 ClickHouse 构建低延迟的研发效能度量管道
我们团队的 Scrum 回顾会议陷入了一种困境。讨论总是围绕着“感觉这个 Sprint 交付慢了”或者“感觉最近线上问题变多了”这类模糊的主观感受。作为工程师,我们都清楚,没有数据的支撑,任何改进措施都可能是凭空臆想,甚至南辕北辙。我们需要
2023-11-15
利用 Gatsby 构建时 GraphQL 层为生成式 AI 实现 RAG 管道的架构实践 利用 Gatsby 构建时 GraphQL 层为生成式 AI 实现 RAG 管道的架构实践
为技术文档站点集成一个基于生成式AI的问答系统,常规思路是搭建一个独立的RAG(Retrieval-Augmented Generation)服务。这个服务需要连接一个向量数据库,并设置一个数据同步管道,持续将文档内容摄取、分块、向量化后存
2023-11-15
构建一套从源码到部署的全自动化 Rust 与 React 应用发布流水线 构建一套从源码到部署的全自动化 Rust 与 React 应用发布流水线
我团队最近的一个内部项目技术栈选型有些非主流:后端采用 Rust 和 Rocket 框架,前端是基于 TypeScript 的 React 与 Chakra UI。这个组合在开发阶段提供了惊人的类型安全和性能优势,但在部署上却遇到了第一个棘
2023-10-27
使用 Axum 与 Tower 中间件构建支持 OAuth 2.0 鉴权的通用二阶段提交协调器 使用 Axum 与 Tower 中间件构建支持 OAuth 2.0 鉴权的通用二阶段提交协调器
多服务原子操作是个老生常谈的难题。在一个典型的微服务场景中,一个用户下单操作可能需要同时调用订单服务创建订单和钱包服务扣减余额。如果其中一个服务调用成功而另一个失败,系统就会进入数据不一致的状态。在真实项目中,这种不一致性是灾难性的,尤其是
构建基于状态机与两阶段提交的 Jenkins 声明式部署协调器 构建基于状态机与两阶段提交的 Jenkins 声明式部署协调器
对于涉及多个微服务的发布流程,一个常见的痛点在于过程控制的复杂性和原子性缺失。当部署流程进行到一半,某个服务发布失败时,整个系统便会陷入一个危险的中间状态。传统的 Jenkins Pipeline 脚本,本质上是过程式的,充满了 try-c
1 / 5