0

为什么Analytics Agent 总答错?来自 Anthropic 的数据分析最佳实践

数据分析 Agent 的核心瓶颈,不是 SQL 生成能力,而是业务上下文。不要指望 Agent 在混乱的数据体系里自动找出标准答案。你需要先把数据环境整理成 Agent 能导航、能理解、能验证的结构。 ...

小七-七牛开发者 发布于 2026-06-10 15:40 评论(0) 阅读(2)
0

从 Claude Code 动态工作流看 Agent Harness 设计

复杂任务不能只靠一个上下文一路做到底。任务需要拆分,上下文需要隔离,验证需要独立,流程也要能在中断后恢复。不同子任务还可以选择不同模型和预算,避免所有事情都挤在同一个执行路径里。 这些设计放在 Claude Code 里,是 Dynamic Workflows;放到更大的 Agent 系统里,其实就... ...

小七-七牛开发者 发布于 2026-06-10 15:20 评论(0) 阅读(4)
0

本地模型为什么能跑起来?从 llama.cpp 量化说起

大模型不再只存在于云端,也开始进入普通电脑。你打开 Ollama、LM Studio,或者直接用 llama.cpp,下载一个量化版本,就有机会在本地跑起一个还不错的大模型。 ...

小七-七牛开发者 发布于 2026-06-10 14:45 评论(0) 阅读(75)
0

Antigravity Agent Skills

Antigravity Agent Skills(智能体技能)技能是一种开放标准,用于扩展智能体的能力。一个技能是一个包含 SKILL.md 文件的文件夹,其中包含智能体在处理特定任务时可以遵循的指令。什么是技能?技能是可复用的知识包,用于扩展智能体能够执行的操作。每个技能包含:如何处理特定类型任务 ...

PetterLiu 发布于 2026-06-10 14:13 评论(0) 阅读(3)
0

学会这 5 个 Hermes 插件开发技巧,让 Agent 能力扩展 10 倍

Hermes Agent 插件使用教程 项目需求总在变,Agent 功能却”锁死”在框架里,改源码又怕升级时被覆盖?Hermes Agent 的插件系统正是为此而生——它是 模块化扩展核心能力 的关键机制,无需修改框架源码,即可自定义工具、事件钩子、命令与集成能力。插件遵循 ”低侵入、高兼容、可插拔 ...

一灯架构 发布于 2026-06-10 10:28 评论(0) 阅读(9)
0

深度学习进阶(二十九)现代 LLM 的核心架构设计其四:GQA

上一篇我们介绍了 KV Cache:它把每一步重复的 K、V 计算存进缓存,让自回归推理的计算量骤降。 但这个加速不是没有代价的。KV Cache 的大小正比于多项参数,因此又反过来推动了注意力结构本身的改进。 这便是本篇内容:分组查询注意力(Grouped-Query Attention,GQA) ...

哥布林学者 发布于 2026-06-09 11:10 评论(0) 阅读(109)
0

5 分钟上手!Hermes Agent 插件开发保姆级教程,扩展能力从此开挂

Hermes Agent 插件使用教程 项目需求总在变,Agent 功能却”锁死”在框架里,改源码又怕升级时被覆盖?Hermes Agent 的插件系统正是为此而生——它是 模块化扩展核心能力 的关键机制,无需修改框架源码,即可自定义工具、事件钩子、命令与集成能力。插件遵循 ”低侵入、高兼容、可插拔 ...

一灯架构 发布于 2026-06-09 10:28 评论(0) 阅读(30)
0

Hermes Agent 核心必学:SubAgent 子代理的 5 个实战技巧,多任务处理效率翻倍

Hermes Agent SubAgent 子代理使用教程 一个大型项目同时遇到代码 bug、文档错误和性能瓶颈,难道要逐一排队处理?如果能把不同任务同时交给多个 "AI 助手" 并行处理就好了。SubAgent(子代理)就是 Hermes Agent 为此提供的核心能力——通过 delegate_ ...

一灯架构 发布于 2026-06-08 22:24 评论(0) 阅读(34)
0

Antigravity 2.0智能体

Antigravity 2.0智能体 Antigravity 现已支持子智能体,不再仅限于单一的专用浏览器子智能体。 子智能体现在可以是模块化的、专门化的,或由主智能体以编程方式生成的空白助手智能体。它们可以是内置角色、通用克隆体(继承与主智能体相同的提示词和环境),或在需要时动态注册(即主智能体根 ...

PetterLiu 发布于 2026-06-08 21:49 评论(0) 阅读(20)
0

在 AI 的流畅回答里,守住自己的判断

AI Agent 的价值不在于替人知道未知领域的真相,而在于把未知变成可提问、可比较、可验证、可追责的结构。真正可靠的 Agent 不只需要 intelligence,更需要 epistemology 与 accountability。 ...

LexLuc 发布于 2026-06-08 15:59 评论(0) 阅读(12)
0

专访 Mainline 作者们:聊聊从代码协作到意图协作

在 AI Coding 越来越普遍之后,代码生成会变得更快,也更多。团队成员如果还只靠逐行看代码、看 diff 来理解彼此,成本会越来越高。 Mainline 的做法是让 Agent 在开发过程中自动总结 Intent(意图),并把它和 commit 关联起来。这样团队在 Review 时,可以先看... ...

小七-七牛开发者 发布于 2026-06-08 15:43 评论(0) 阅读(118)
3

深度学习进阶(二十八)现代 LLM 的核心架构设计其三:Decoder-Only 下的 KV Cache

上一篇我们介绍了 SwiGLU,通过引入门控机制让 FFN 能够根据输入动态筛选信息,取代了标准 Transformer 沿用多年的单通路结构。 前两篇的内容都关于结构上的优化,本篇则关于一个核心工程优化。 我们知道,即使是现在的多数大模型,其生成回答的逻辑仍然是自回归生成,即逐个字往外蹦。 因此, ...

哥布林学者 发布于 2026-06-08 13:02 评论(0) 阅读(151)
0

找了一个Token渠道,全球顶级模型,在vscode的配置及应用。

连接全球顶级AI大模型:GPT、Claude Opus、Claude Sonnet、Gemini、DeepSeek V4 Pro、Qwen3-Max、Kimi、K2.6、Grok、Minimax、GLM、Doubao、Mistral。 为全球开发者与团队而生 ——无限制可直连、无封号风险、余额永不过... ...

iNeuOS工业互联网系统 发布于 2026-06-08 10:38 评论(0) 阅读(32)
0

Cloud Agent 开发笔记(4):Skill 与 MCP 集成、项目后记

Cloud Agent 开发笔记(4):Skill 与 MCP 集成、项目后记 上一篇讲了 Agent 事件如何推到浏览器、数据如何持久化、多会话和中断如何处理。这一篇讲能力扩展层:Skill 系统和 MCP 集成。 V1 验证的是产品形态:由管理员角色集中创建和维护 Skill、配置 MCP 连接 ...

五岳 发布于 2026-06-08 10:13 评论(0) 阅读(229)
0

DeepAgents - 使用Postgres作为Checkpoint

前言 在用 deepagents 做 Chatbot 的时候,有个最基本的需求:Agent 得记住上一轮聊了什么。你不能每轮对话都让用户重新自我介绍一遍。 LangGraph / DeepAgents 内置了一个叫 checkpoint 的机制来处理这个事。开发阶段用 MemorySaver 跑跑 ...

花酒锄作田 发布于 2026-06-07 15:49 评论(2) 阅读(149)
1

张高兴的 Hailo-10 开发指南:(二)使用 LangChain 搭建本地大模型 RAG 问答应用

目录环境配置安装 HailoRT安装 Hailo-OllamaPython 环境启动 Hailo-Ollama 服务实现 RAG 应用1. 引用相关包2. PDF 文档处理3. 文本切分4. 向量化和存储5. 自定义 HailoChatOllama 类6. RAG 链的组装LoRA 微调1. 微调2 ...

张高兴 发布于 2026-06-07 14:46 评论(0) 阅读(173)
3

15天学会AI应用开发(五)使用AI摘要来压缩上下文消息

​前面两篇文章分别介绍了根据消息数量截断历史对话和根据Token长度截断历史对话,可是这两种方式有两个共同的问题: 1、被删去的早期记录可能包含关键信息,直接截断会导致信息丢失。 2、原始的对话记录可能存在重复、冗余、拖沓的文字内容。 一、为什么要对原始记录做摘要 要知道,重复、冗余、拖沓的文字内容 ...

aqi00 发布于 2026-06-07 11:14 评论(0) 阅读(343)
0

一篇标题只有5个单词的论文,改变了整个AI世界,并打开了AI大语言模型时代

从GPT-1的诞生到ChatGPT的横空出世,AI从专家的实验室走进了每个人的日常,这背后是数据、算力与算法长达七十年的厚积薄发。 ...

岳小哥AI 发布于 2026-06-07 08:00 评论(0) 阅读(274)
0

喜报!天谋科技工业时间序列数智化系统全项完成中国信通院基于AI大模型的时序数据管理平台产品测试

近日,在中国信通院组织开展的 2026 上半年批次“可信数据库”测试中,天谋科技(北京)有限公司(以下简称:天谋科技)的工业时间序列数智化系统完成了基于 AI 大模型的时序数据管理平台基础能力测试。经检验,该产品符合《基于 AI 大模型的时序数据管理平台技术要求》标准的全部能力要求。这标志着天谋科技 ...

ApacheIoTDB 发布于 2026-06-06 17:27 评论(0) 阅读(13)
3

15天学会AI应用开发(四)根据Token长度截断历史对话

​上一篇文章说到按照消息数量来截断历史对话,这种方式有个问题,就是每次对话的内容可长可短,导致固定消息数量的对话内容忽长忽短。 历史对话内容不光要存入数据库,还要作为初始提示词发给下次新会话的大模型。太长的提示词不仅冗余,还会消耗大量Token,让用户钱包快速缩水。太短的提示词容纳的信息量不足,难以 ...

aqi00 发布于 2026-06-06 12:11 评论(0) 阅读(266)