技术博客.

聚焦 AI 应用落地、Agent 工作流、RAG、Tool Calling、系统集成与工程实践。记录从原型到生产级的每一段技术沉淀。

全部文章AI AgentRAGWorkflowLLM Application工程实践性能优化

2026-02-27AI Agent10 MIN READ

Agent 监控：先看清轨迹，再谈自动定位

这篇文章基于 LangChain 和 LangGraph 当前官方 observability 文档，重写 Agent 监控的核心主线：trace、run、metadata、质量指标、告警和在线评估。重点是把“智能监控”落回可观测性基本功，而不是继续堆一堆 AIOps 概念。

ObservabilityMonitoringLangSmithTracingAgent

2026-01-20AI Agent11 MIN READ

Agent 安全运营：先把告警、证据和人工处置串起来，再谈自动响应

这篇文章从真实 SOC 工作流出发，重写 Agent 在安全运营中的落地方式：告警归并、资产与身份上下文、证据检索、调查剧本、升级审批、受限响应和复盘评估。重点不是让 Agent 直接替代检测规则、EDR 或值班分析师，而是让它承担证据整理、假设生成和流程推进，把高风险封禁、隔离和通报留在审批与人工处置链里。

SOCSecurity OperationsSIEMDetectionAgent

2026-01-27AI Agent10 MIN READ

Agent 客服：先把 FAQ、工单和人工接管串起来，再谈全自动

这篇文章从真实客服链路出发，重写 Agent 客服的落地方式：问题分类、知识检索、订单与工单工具、对话状态、人工接管、质检与评估。重点不是追求百分之百自动回复，而是让 Agent 先稳定处理高频问题，并把复杂问题交接给人工客服。

Customer ServiceRAGAgentHandoffSupport

2026-02-03AI Agent10 MIN READ

Agent 工作流自动化：先把稳定流程写死，再让模型处理例外

这篇文章把 Agent 工作流自动化拆成触发器、状态机、工具边界、结构化决策、人工审批、重试与观测几个层次。重点不是用自然语言“生成流程图”，而是把 Agent 放进真实业务自动化里，处理非结构化输入和例外判断。

WorkflowAutomationAgent系统集成Engineering

2026-01-06AI Agent10 MIN READ

Agent 数据分析：先把指标口径写清楚，再开放自然语言提问

这篇文章把数据分析 Agent 拆成指标注册、问题解析、查询生成、执行校验、结果解释和可视化几个环节。重点不是单纯做 NL2SQL，而是让自然语言分析请求变成可审计、可复现、可追责的分析流程。

Data AnalysisSQLBIAgentAnalytics

2026-03-15AI Agent10 MIN READ

Agent 性能：先减少无效步骤，再优化模型、缓存和并行

这篇文章基于 LangChain 当前 middleware / models 文档和 OpenAI 的 prompt caching 指南，重写 Agent 性能优化的主线：延迟拆解、无效步骤收缩、模型路由、上下文压缩、提示缓存、并行执行与流式输出。重点不是堆“性能技巧”，而是先找出真正拖慢系统的环节。

PerformanceLatencyCachingLangChainAgent

2026-02-13AI Agent10 MIN READ

Agent 成本控制：预算不是事后统计，而是架构约束

这篇文章基于 OpenAI 当前定价页、Prompt Caching 指南和 LangChain 的 models / middleware 文档，重写 Agent 成本控制的主线：模型分层、缓存折扣、上下文压缩、调用上限、批处理与成本可观测性。重点不是“怎么省一点 token”，而是把预算控制设计进系统。

CostBudgetPrompt CachingPricingAgent

2026-01-13AI Agent9 MIN READ

Agent 可靠性：把失败路径设计成系统能力

这篇文章基于 LangGraph 的可靠性设计思路和 LangChain 当前 middleware 文档，重写 Agent 可靠性的核心主线：错误分类、重试、fallback、durable execution、人工介入和副作用边界。重点不是继续堆“重试+降级”清单，而是把失败处理纳入系统主路径设计。

Reliability容错RetryFallbackAgent