我做什么
我主要关注 AI 产品、智能体系统和更贴近真实使用场景的交互体验。
我主要关注 AI 产品、智能体系统和更贴近真实使用场景的交互体验。
我更在意上下文、工具、边界和反馈,而不只是模型本身有多强。
我希望把自己的方法、兴趣和关于 AI 的判断长期沉淀在这里。
对我来说,模型、工具、记忆、边界和界面必须一起被设计。
多步骤任务拆解、工具路由、状态设计、失败恢复与上下文继承。
从索引、召回到引用展示,确保答案不仅能生成,还能被验证。
离线 eval、线上监测、提示注入防御、权限边界与风险前移。
我不会把 prompt 当解决方案起点。先拆出目标、失败模式、上下文来源和评价标准,模型只是其中一个执行部件。
检索、执行、校验、回退和日志要一起出现。AI 只有和工具链连起来,才不会停留在静态演示。
我更相信可控的人机协作,而不是伪装成全自动。高风险节点应该有明确暂停与确认。
没有观测、评测与反馈,AI 体验无法持续改进。可追踪性不是运维细节,而是产品质量的一部分。
理解问题,定义边界,组织链路,然后持续迭代。
判断场景是内容生成、操作代理、知识问答,还是复杂流程执行,避免一开始就用同一种 AI 形态硬套所有问题。
明确系统能做什么、不能做什么,哪里允许自动推进,哪里必须等待确认,把高风险点先画出来。
把模型、记忆、工具、检索、评测和界面连成一条顺畅链路,让用户感受到的是完整体验,而不是碎片能力。
通过日志、实验、人工反馈和数据回流收敛系统表现,让 AI 不只是首屏惊艳,而是长期可靠。