为什么Analytics Agent 总答错?来自 Anthropic 的数据分析最佳实践
数据分析 Agent 的核心瓶颈,不是 SQL 生成能力,而是业务上下文。不要指望 Agent 在混乱的数据体系里自动找出标准答案。你需要先把数据环境整理成 Agent 能导航、能理解、能验证的结构。 ...
从 Claude Code 动态工作流看 Agent Harness 设计
复杂任务不能只靠一个上下文一路做到底。任务需要拆分,上下文需要隔离,验证需要独立,流程也要能在中断后恢复。不同子任务还可以选择不同模型和预算,避免所有事情都挤在同一个执行路径里。
这些设计放在 Claude Code 里,是 Dynamic Workflows;放到更大的 Agent 系统里,其实就... ...
本地模型为什么能跑起来?从 llama.cpp 量化说起
大模型不再只存在于云端,也开始进入普通电脑。你打开 Ollama、LM Studio,或者直接用 llama.cpp,下载一个量化版本,就有机会在本地跑起一个还不错的大模型。 ...
Antigravity Agent Skills
Antigravity Agent Skills(智能体技能)技能是一种开放标准,用于扩展智能体的能力。一个技能是一个包含 SKILL.md 文件的文件夹,其中包含智能体在处理特定任务时可以遵循的指令。什么是技能?技能是可复用的知识包,用于扩展智能体能够执行的操作。每个技能包含:如何处理特定类型任务 ...
学会这 5 个 Hermes 插件开发技巧,让 Agent 能力扩展 10 倍
Hermes Agent 插件使用教程 项目需求总在变,Agent 功能却”锁死”在框架里,改源码又怕升级时被覆盖?Hermes Agent 的插件系统正是为此而生——它是 模块化扩展核心能力 的关键机制,无需修改框架源码,即可自定义工具、事件钩子、命令与集成能力。插件遵循 ”低侵入、高兼容、可插拔 ...
深度学习进阶(二十九)现代 LLM 的核心架构设计其四:GQA
上一篇我们介绍了 KV Cache:它把每一步重复的 K、V 计算存进缓存,让自回归推理的计算量骤降。 但这个加速不是没有代价的。KV Cache 的大小正比于多项参数,因此又反过来推动了注意力结构本身的改进。 这便是本篇内容:分组查询注意力(Grouped-Query Attention,GQA) ...
5 分钟上手!Hermes Agent 插件开发保姆级教程,扩展能力从此开挂
Hermes Agent 插件使用教程 项目需求总在变,Agent 功能却”锁死”在框架里,改源码又怕升级时被覆盖?Hermes Agent 的插件系统正是为此而生——它是 模块化扩展核心能力 的关键机制,无需修改框架源码,即可自定义工具、事件钩子、命令与集成能力。插件遵循 ”低侵入、高兼容、可插拔 ...
Hermes Agent 核心必学:SubAgent 子代理的 5 个实战技巧,多任务处理效率翻倍
Hermes Agent SubAgent 子代理使用教程 一个大型项目同时遇到代码 bug、文档错误和性能瓶颈,难道要逐一排队处理?如果能把不同任务同时交给多个 "AI 助手" 并行处理就好了。SubAgent(子代理)就是 Hermes Agent 为此提供的核心能力——通过 delegate_ ...
Antigravity 2.0智能体
Antigravity 2.0智能体 Antigravity 现已支持子智能体,不再仅限于单一的专用浏览器子智能体。 子智能体现在可以是模块化的、专门化的,或由主智能体以编程方式生成的空白助手智能体。它们可以是内置角色、通用克隆体(继承与主智能体相同的提示词和环境),或在需要时动态注册(即主智能体根 ...
在 AI 的流畅回答里,守住自己的判断
AI Agent 的价值不在于替人知道未知领域的真相,而在于把未知变成可提问、可比较、可验证、可追责的结构。真正可靠的 Agent 不只需要 intelligence,更需要 epistemology 与 accountability。 ...
专访 Mainline 作者们:聊聊从代码协作到意图协作
在 AI Coding 越来越普遍之后,代码生成会变得更快,也更多。团队成员如果还只靠逐行看代码、看 diff 来理解彼此,成本会越来越高。
Mainline 的做法是让 Agent 在开发过程中自动总结 Intent(意图),并把它和 commit 关联起来。这样团队在 Review 时,可以先看... ...
深度学习进阶(二十八)现代 LLM 的核心架构设计其三:Decoder-Only 下的 KV Cache
上一篇我们介绍了 SwiGLU,通过引入门控机制让 FFN 能够根据输入动态筛选信息,取代了标准 Transformer 沿用多年的单通路结构。 前两篇的内容都关于结构上的优化,本篇则关于一个核心工程优化。 我们知道,即使是现在的多数大模型,其生成回答的逻辑仍然是自回归生成,即逐个字往外蹦。 因此, ...
找了一个Token渠道,全球顶级模型,在vscode的配置及应用。
连接全球顶级AI大模型:GPT、Claude Opus、Claude Sonnet、Gemini、DeepSeek V4 Pro、Qwen3-Max、Kimi、K2.6、Grok、Minimax、GLM、Doubao、Mistral。
为全球开发者与团队而生 ——无限制可直连、无封号风险、余额永不过... ...
Cloud Agent 开发笔记(4):Skill 与 MCP 集成、项目后记
Cloud Agent 开发笔记(4):Skill 与 MCP 集成、项目后记 上一篇讲了 Agent 事件如何推到浏览器、数据如何持久化、多会话和中断如何处理。这一篇讲能力扩展层:Skill 系统和 MCP 集成。 V1 验证的是产品形态:由管理员角色集中创建和维护 Skill、配置 MCP 连接 ...
DeepAgents - 使用Postgres作为Checkpoint
前言 在用 deepagents 做 Chatbot 的时候,有个最基本的需求:Agent 得记住上一轮聊了什么。你不能每轮对话都让用户重新自我介绍一遍。 LangGraph / DeepAgents 内置了一个叫 checkpoint 的机制来处理这个事。开发阶段用 MemorySaver 跑跑 ...
张高兴的 Hailo-10 开发指南:(二)使用 LangChain 搭建本地大模型 RAG 问答应用
目录环境配置安装 HailoRT安装 Hailo-OllamaPython 环境启动 Hailo-Ollama 服务实现 RAG 应用1. 引用相关包2. PDF 文档处理3. 文本切分4. 向量化和存储5. 自定义 HailoChatOllama 类6. RAG 链的组装LoRA 微调1. 微调2 ...
15天学会AI应用开发(五)使用AI摘要来压缩上下文消息
前面两篇文章分别介绍了根据消息数量截断历史对话和根据Token长度截断历史对话,可是这两种方式有两个共同的问题: 1、被删去的早期记录可能包含关键信息,直接截断会导致信息丢失。 2、原始的对话记录可能存在重复、冗余、拖沓的文字内容。 一、为什么要对原始记录做摘要 要知道,重复、冗余、拖沓的文字内容 ...
一篇标题只有5个单词的论文,改变了整个AI世界,并打开了AI大语言模型时代
从GPT-1的诞生到ChatGPT的横空出世,AI从专家的实验室走进了每个人的日常,这背后是数据、算力与算法长达七十年的厚积薄发。 ...
喜报!天谋科技工业时间序列数智化系统全项完成中国信通院基于AI大模型的时序数据管理平台产品测试
近日,在中国信通院组织开展的 2026 上半年批次“可信数据库”测试中,天谋科技(北京)有限公司(以下简称:天谋科技)的工业时间序列数智化系统完成了基于 AI 大模型的时序数据管理平台基础能力测试。经检验,该产品符合《基于 AI 大模型的时序数据管理平台技术要求》标准的全部能力要求。这标志着天谋科技 ...
15天学会AI应用开发(四)根据Token长度截断历史对话
上一篇文章说到按照消息数量来截断历史对话,这种方式有个问题,就是每次对话的内容可长可短,导致固定消息数量的对话内容忽长忽短。 历史对话内容不光要存入数据库,还要作为初始提示词发给下次新会话的大模型。太长的提示词不仅冗余,还会消耗大量Token,让用户钱包快速缩水。太短的提示词容纳的信息量不足,难以 ...


