技术博客.

聚焦 AI 应用落地、Agent 工作流、RAG、Tool Calling、系统集成与工程实践。记录从原型到生产级的每一段技术沉淀。

全部文章AI AgentRAGWorkflowLLM Application工程实践性能优化
2026-03-08AI应用开发10 MIN READ

Next.js AI 项目模板:快速启动开发

本文介绍如何使用 Next.js 快速搭建 AI 应用,包括项目结构、API 路由、Streaming 实现等,提供可直接使用的代码模板。

Next.jsReact模板入门
2026-03-07AI应用开发10 MIN READ

AI 后端服务:先把请求契约、队列和幂等链路串起来,再谈一个聊天接口

这篇文章从真实 AI 后端服务设计出发,重写生产级 AI API 的落地方式:请求契约、同步与后台任务分流、队列与重试、状态与产物存储、限流、人工兜底和故障恢复。重点不是继续讲 RESTful 命名风格,而是说明一个可交付的 AI 服务如何把长任务、文件处理、重试和支持流程组织成稳定后端。

BackendAPIQueueReliabilityAI
2026-03-07AI应用开发10 MIN READ

AI 应用部署:先把环境隔离、灰度和观测链串起来,再谈一键上线

这篇文章从真实 AI 应用上线流程出发,重写生产部署的落地方式:环境隔离、配置与密钥管理、灰度与回滚、后台任务与速率限制、观测与成本告警。重点不是继续讲 Dockerfile 和 Express 示例,而是说明一个 AI 应用如何在发布、扩容和故障处理中保持可治理。

DeploymentProductionRuntimeObservabilityAI
2026-03-07AI应用开发10 MIN READ

AI 应用性能优化:先把延迟预算、成本预算和降级链串起来

这篇文章从真实 AI 应用运行时出发,重写性能优化的落地方式:延迟预算、同步与后台任务分流、Prompt Caching 与结果缓存、模型路由、并发控制、成本观察和降级回退。重点不是继续堆性能技巧,而是说明如何把响应速度、吞吐、成本和稳定性放进同一套运行时治理里。

PerformanceCostLatencyPrompt CachingAI
2026-03-06AI Agent10 MIN READ

Agent 视频制作:先把 brief、素材和终审发布串起来,再谈自动剪辑

这篇文章从真实视频生产流程出发,重写 Agent 在视频制作中的落地方式:选题 brief、脚本拆解、素材清单、剪辑草稿、字幕校对、版本反馈、版权检查和发布协同。重点不是让 Agent 直接替代导演、剪辑师或后期总审,而是让它承担资料整理、脚本分段、版本备注和交付推进,把最终画面选择、节奏判断和正式发布留给人。

Video ProductionEditingAgentWorkflowReview
2026-03-06AI应用开发10 MIN READ

AI 安全实践:先把红队、发布门槛和事故回放串起来

这篇文章从 AI 产品团队的日常运营出发,重写 AI 安全实践的落地方式:安全评审、红队样本、发布门槛、密钥与环境治理、日志审计、事故响应和坏例子回流。重点不是继续罗列单点防护措施,而是说明团队如何把安全变成持续运行的工程机制。

SecurityRed TeamingRelease GatesAuditAI
2026-03-06AI应用开发10 MIN READ

AI 应用测试:先把契约、数据集和回归门槛串起来,再谈测输出

这篇文章从真实 AI 应用开发流程出发,重写测试策略的落地方式:确定性部件测试、结构化输出契约、检索与工具链集成测试、离线评估集、线上对照与坏例子回流。重点不是继续用 `toContain()` 检查文本片段,而是说明如何把 AI 应用的质量验证做成可持续的工程系统。

TestingQAEvalsRegressionAI
2026-03-06AI应用开发10 MIN READ

向量数据库详解:选择与应用

本文详细介绍向量数据库的核心概念,对比 Pinecone、Weaviate、Chroma、Milvus 等主流产品,分析各自优缺点和适用场景。

向量数据库PineconeWeaviateChroma