技术博客.

聚焦 AI 应用落地、Agent 工作流、RAG、Tool Calling、系统集成与工程实践。记录从原型到生产级的每一段技术沉淀。

全部文章AI AgentRAGWorkflowLLM Application工程实践性能优化
2026-02-27AI Agent10 MIN READ

Agent 监控:先看清轨迹,再谈自动定位

这篇文章基于 LangChain 和 LangGraph 当前官方 observability 文档,重写 Agent 监控的核心主线:trace、run、metadata、质量指标、告警和在线评估。重点是把“智能监控”落回可观测性基本功,而不是继续堆一堆 AIOps 概念。

ObservabilityMonitoringLangSmithTracingAgent
2026-01-20AI Agent11 MIN READ

Agent 安全运营:先把告警、证据和人工处置串起来,再谈自动响应

这篇文章从真实 SOC 工作流出发,重写 Agent 在安全运营中的落地方式:告警归并、资产与身份上下文、证据检索、调查剧本、升级审批、受限响应和复盘评估。重点不是让 Agent 直接替代检测规则、EDR 或值班分析师,而是让它承担证据整理、假设生成和流程推进,把高风险封禁、隔离和通报留在审批与人工处置链里。

SOCSecurity OperationsSIEMDetectionAgent
2026-01-27AI Agent10 MIN READ

Agent 客服:先把 FAQ、工单和人工接管串起来,再谈全自动

这篇文章从真实客服链路出发,重写 Agent 客服的落地方式:问题分类、知识检索、订单与工单工具、对话状态、人工接管、质检与评估。重点不是追求百分之百自动回复,而是让 Agent 先稳定处理高频问题,并把复杂问题交接给人工客服。

Customer ServiceRAGAgentHandoffSupport
2026-02-03AI Agent10 MIN READ

Agent 工作流自动化:先把稳定流程写死,再让模型处理例外

这篇文章把 Agent 工作流自动化拆成触发器、状态机、工具边界、结构化决策、人工审批、重试与观测几个层次。重点不是用自然语言“生成流程图”,而是把 Agent 放进真实业务自动化里,处理非结构化输入和例外判断。

WorkflowAutomationAgent系统集成Engineering
2026-01-06AI Agent10 MIN READ

Agent 数据分析:先把指标口径写清楚,再开放自然语言提问

这篇文章把数据分析 Agent 拆成指标注册、问题解析、查询生成、执行校验、结果解释和可视化几个环节。重点不是单纯做 NL2SQL,而是让自然语言分析请求变成可审计、可复现、可追责的分析流程。

Data AnalysisSQLBIAgentAnalytics
2026-03-15AI Agent10 MIN READ

Agent 性能:先减少无效步骤,再优化模型、缓存和并行

这篇文章基于 LangChain 当前 middleware / models 文档和 OpenAI 的 prompt caching 指南,重写 Agent 性能优化的主线:延迟拆解、无效步骤收缩、模型路由、上下文压缩、提示缓存、并行执行与流式输出。重点不是堆“性能技巧”,而是先找出真正拖慢系统的环节。

PerformanceLatencyCachingLangChainAgent
2026-02-13AI Agent10 MIN READ

Agent 成本控制:预算不是事后统计,而是架构约束

这篇文章基于 OpenAI 当前定价页、Prompt Caching 指南和 LangChain 的 models / middleware 文档,重写 Agent 成本控制的主线:模型分层、缓存折扣、上下文压缩、调用上限、批处理与成本可观测性。重点不是“怎么省一点 token”,而是把预算控制设计进系统。

CostBudgetPrompt CachingPricingAgent
2026-01-13AI Agent9 MIN READ

Agent 可靠性:把失败路径设计成系统能力

这篇文章基于 LangGraph 的可靠性设计思路和 LangChain 当前 middleware 文档,重写 Agent 可靠性的核心主线:错误分类、重试、fallback、durable execution、人工介入和副作用边界。重点不是继续堆“重试+降级”清单,而是把失败处理纳入系统主路径设计。

Reliability容错RetryFallbackAgent