AI - 第3页 - 网站分类

Kimi-K2模型真实项目OOP重构实践

背景笔者写过多个模型OOP重构实践，包括《基于CodeBuddy自定义Agent知识库重构实践》与《Trae智能复杂项目重构实践》，三方与其他主流模型的评测今天我们在Trae来试试Kimi K2模型：实践杂上下文，长度可以满足，一次性对话。我们看重构多个文件还生成一个markdown文档# Thi ...

Context Engineering: 基于 OceanBase 的代码文档检索引擎

OceanBase 社区布道师基于 OceanBase 开发开源了代码文档检索引擎，使用 OceanBase 处理向量存储、元数据管理和相似度检索，理解对应的 GitHub 代码仓库，欢迎大家试用！ ...

AI编程：代码多，效果好？

捏着鼻子用多了就会发现：各家模型都有自己擅长的能力，这与不同平台所掌握的优质数据有关系，比如电商跨境，本地生活，内容制作，行业分析等。 ...

"AutoCodeRover: Autonomous Program Improvement" 论文笔记

介绍 (1) 发表：ISSTA'24 (2) 背景软件工程涉及程序改进的过程，特别是软件维护（例如，程序错误修复）和软件演变（例如，功能添加）自动化程序维修任务对实现自动软件工程愿景的重要性。鉴于自动化程序维修的动机，并且开发人员经常花费大量的时间来修复错误。本工作提出了 AutoCodeRov ...

20个AI爱好者必听的顶级播客

20个AI 爱好者必听的顶级播客(含推荐单集)1. TWIML AI 播客The TWIML AI Podcast 深入探讨机器学习与人工智能，邀请业内顶尖专家进行访谈。内容涵盖 AI、机器学习、深度学习、自然语言处理与数据科学。无论你是行业专家、技术型商业领袖，还是科技爱好者，都会有所收获。主持人 ...

HRM(Hierarchical Reasoning Model)部署训练记录

前两天朋友刷到HRM这个27M模型的文章，想让我试着部署训练一下。此文用于记录部署过程前期准备克隆仓库 sapientinc/HRM 安装CUDA 我的CUDA是已经安装好的12.8版本，安装过程不再赘述安装torch torch版本如下 Version: 2.7.1+cu128 pip in ...

"SWE-bench: Can Language Models Resolve Real-World GitHub Issues" 论文笔记

介绍 (1) 发表：ICLR'24 (2) 背景现有 benchmarks 已经饱和，无法捕获最先进的语言模型和无法做到的前沿，需要具有挑战性的新 benchmark 来更准确的反映语言模型的现实应用工作 (1) 数据集构建该工作从 Github 上流行的 12 个开源 python 库中收集 ...

"When Large Language Models Confront Repository-Level Automatic Program Repair How Well They Done" 论文笔记

介绍 (1) 发表：ICSE'24 (2) 背景 APR 任务的这些模型的当前评估仅关注错误所在的单个功能或文件的有限上下文，从而忽略了存储库级上下文中的有价值信息。现有的数据集要么不是在存储库中构建的，例如 Quixbugs，要么无法准确恢复存储库级错误的方案，例如 Defects4J。本文研究了 ...

Policy Gradient原理和Python实现

今天重温一下RL on-policy算法的始祖：Policy Gradient算法。第一节先讲原理。第二节讲Python代码实现。第三节讲Policy Gradient算法的引申思考。一、Policy Gradient原理要讲Policy Gradient算法，需要先简要介绍一下Markov奖励 ...

解密prompt系列58. MCP - 工具演变 & MCP基础

作为`结构化推理`的坚定支持者，我一度对MCP感到困惑：Agent和工具调用的概念早已普及，为何还需要MCP这样的额外设计呢？本文就来深入探讨MCP，看看它究竟解决了什么问题。我们将分几章解析MCP：本章理清基础概念和逻辑，后面我们直接以一个Agent为例演示全MCP接入的实现方案。 ...

百度Comate的AI编程工具小试

背景百度Comate基于文心大模型（ERNIE-Code），结合百度内部编程大数据及GitHub优质开源数据训练，具备深度语义理解能力。支持100+编程语言（如Go、Java、Python、JavaScript等），兼容主流IDE（VS Code、JetBrains系列）。Zulu智能体提示词依然 ...

【OceanBase Agent】告别繁琐手动分析，OceanBase Agent 助力轻松运维数据库！

内置 70+使用 SQL作为 Tool，可以直接调用；支持自定义增加 SQL 作为 Tool；支持编写 Playbook 以调用多个 Tool 完成复杂的运维任务；支持 MCP 协议以扩展外部 Tool。 ...

学习理论：代理损失函数的泛化界与Rademacher复杂度

在之前的博客中我们提到过，设l为在标签Y上定义的0-1多分类弃权损失的代理损失，则我们可以在此基础上进一步定义弃权代理损失L。在这篇博客中，让我们把注意力转移一个新的方向——代理损失函数的泛化误差界（generalization error gap）。差值R_L(hat{h}) - widehat{... ...

关于生成式AI对软件工程相关职业影响

背景论文《Working with AI: Measuring the Occupational Implications of Generative AI》。这篇由微软研究院团队撰写的论文，通过分析20万条用户与Microsoft Bing Copilot（现Microsoft Copilot） ...

演练：使用VB开发多智能体协作的荣格八维分析器

在大语言模型高速发展的时代，我们面对困难的语义分析任务，通过构建智能体进行处理是一个流行趋势。本文将介绍如何使用 Visual Basic .NET 开发一个多智能体协作系统，用于分析聊天记录中特定人物的荣格八维人格类型。本文使用 CC-BY-NC-SA 4.0 协议。转载或者 AI 模型/智能体 ...

GLM4.5在线版快速开发实践

背景1. GLM4.5 GLM（General Language Model，通用语言模型）是大语言模型（LLM）的一种技术路线，以支持多模态、长文本理解和复杂推理为特点。GLM4.5的代码生成能力基于对海量代码语料（如GitHub开源项目、技术文档、问答社区）的学习，支持主流编程语言（ ...

还在为调试提示词头疼？一个案例教你轻松上手！

如何从提示词小白变成高手？最近豆包发布了全新的模型，迫不及待地进行了测试。我最喜欢使用的功能就是深度思考模式，这个模式能够在处理复杂问题时提供极大的帮助。而且现在它还赠送了很多免费的推理额度，完全足够个人使用，真是非常划算！今天，我们将在提示词的功能优化过程中应用这个新模型，看看整体效果如何，毕 ...

CodeGeeX体验GLM4.5模型与实践

背景各模型概要性能评估Ghost Comments看那些右箭头，就是动态注释，没有真实写入文件代码BUG修复总体一般，没有智能体的特色，只有CodeGeeX问答模式。增加注释速度快，但不生成方法头部的注释解释代码文字解释后，生成了流程图实战代码扩展性修改PK提示词@workspace #codeba ...

Agentic AI, 基于 Dify x OceanBase 的实践

应用实践：戒毒人员对话式心理量表初探 Oceanbase + Dify 实现的 ChatFlow, OceanBase For Dify 的一站式能力支持。 ...

人工智能驱动企业：通过情境感知AI重塑组织4个人生产力

4 个人生产力 Sasha 是一名手术室护士。今天是平常的一天。她正在为一位病人制定术前程序。今天的手术是标准的——疝气手术。然而，即使是常规手术，术前程序也会因病人的既往病史和当前健康状况而异。制定术前计划不仅仅是重复标准模板，它还涉及关键决策。Sasha 必须概述针对每位病人的具体步骤。她必须 ...