AI
刷新
Kimi-K2模型真实项目OOP重构实践

博主头像 背景 笔者写过多个模型OOP重构实践,包括《基于CodeBuddy自定义Agent知识库重构实践》与《Trae智能复杂项目重构实践》,三方与其他主流模型的评测今天我们在Trae来试试Kimi K2模型:实践杂上下文,长度可以满足,一次性对话。我们看重构多个文件还生成一个markdown文档# Thi ...

"AutoCodeRover: Autonomous Program Improvement" 论文笔记

介绍 (1) 发表:ISSTA'24 (2) 背景 软件工程涉及程序改进的过程,特别是软件维护(例如,程序错误修复)和软件演变(例如,功能添加) 自动化程序维修任务对实现自动软件工程愿景的重要性。鉴于自动化程序维修的动机,并且开发人员经常花费大量的时间来修复错误。本工作提出了 AutoCodeRov ...

20个AI爱好者必听的顶级播客

博主头像 20个AI 爱好者必听的顶级播客(含推荐单集)1. TWIML AI 播客The TWIML AI Podcast 深入探讨机器学习与人工智能,邀请业内顶尖专家进行访谈。内容涵盖 AI、机器学习、深度学习、自然语言处理与数据科学。无论你是行业专家、技术型商业领袖,还是科技爱好者,都会有所收获。主持人 ...

HRM(Hierarchical Reasoning Model)部署训练记录

博主头像 前两天朋友刷到HRM这个27M模型的文章,想让我试着部署训练一下。此文用于记录部署过程 前期准备 克隆仓库 sapientinc/HRM 安装CUDA 我的CUDA是已经安装好的12.8版本,安装过程不再赘述 安装torch torch版本如下 Version: 2.7.1+cu128 pip in ...

"When Large Language Models Confront Repository-Level Automatic Program Repair How Well They Done" 论文笔记

介绍 (1) 发表:ICSE'24 (2) 背景 APR 任务的这些模型的当前评估仅关注错误所在的单个功能或文件的有限上下文,从而忽略了存储库级上下文中的有价值信息。现有的数据集要么不是在存储库中构建的,例如 Quixbugs,要么无法准确恢复存储库级错误的方案,例如 Defects4J。本文研究了 ...

Policy Gradient原理和Python实现

博主头像 今天重温一下RL on-policy算法的始祖:Policy Gradient算法。第一节先讲原理。第二节讲Python代码实现。第三节讲Policy Gradient算法的引申思考。 一、Policy Gradient原理 要讲Policy Gradient算法,需要先简要介绍一下Markov奖励 ...

解密prompt系列58. MCP - 工具演变 & MCP基础

博主头像 作为`结构化推理`的坚定支持者,我一度对MCP感到困惑:Agent和工具调用的概念早已普及,为何还需要MCP这样的额外设计呢?本文就来深入探讨MCP,看看它究竟解决了什么问题。我们将分几章解析MCP:本章理清基础概念和逻辑,后面我们直接以一个Agent为例演示全MCP接入的实现方案。 ...

百度Comate的AI编程工具小试

博主头像 背景百度Comate基于文心大模型(ERNIE-Code),结合百度内部编程大数据及GitHub优质开源数据训练,具备深度语义理解能力。 支持100+编程语言(如Go、Java、Python、JavaScript等),兼容主流IDE(VS Code、JetBrains系列)。Zulu智能体提示词依然 ...

学习理论:代理损失函数的泛化界与Rademacher复杂度

博主头像 在之前的博客中我们提到过,设l为在标签Y上定义的0-1多分类弃权损失的代理损失,则我们可以在此基础上进一步定义弃权代理损失L。在这篇博客中,让我们把注意力转移一个新的方向——代理损失函数的泛化误差界(generalization error gap)。差值R_L(hat{h}) - widehat{... ...

演练:使用VB开发多智能体协作的荣格八维分析器

在大语言模型高速发展的时代,我们面对困难的语义分析任务,通过构建智能体进行处理是一个流行趋势。本文将介绍如何使用 Visual Basic .NET 开发一个多智能体协作系统,用于分析聊天记录中特定人物的荣格八维人格类型。 本文使用 CC-BY-NC-SA 4.0 协议。转载或者 AI 模型/智能体 ...

GLM4.5在线版快速开发实践

博主头像 背景1. GLM4.5​​ GLM(General Language Model,通用语言模型)是大语言模型(LLM)的一种技术路线,以支持多模态、长文本理解和复杂推理为特点。GLM4.5的代码生成能力基于对海量代码语料(如GitHub开源项目、技术文档、问答社区)的学习,支持​​主流编程语言​​( ...

还在为调试提示词头疼?一个案例教你轻松上手!

博主头像 如何从提示词小白变成高手? 最近豆包发布了全新的模型,迫不及待地进行了测试。我最喜欢使用的功能就是深度思考模式,这个模式能够在处理复杂问题时提供极大的帮助。而且现在它还赠送了很多免费的推理额度,完全足够个人使用,真是非常划算! 今天,我们将在提示词的功能优化过程中应用这个新模型,看看整体效果如何,毕 ...

CodeGeeX体验GLM4.5模型与实践

博主头像 背景各模型概要性能评估Ghost Comments看那些右箭头,就是动态注释,没有真实写入文件代码BUG修复总体一般,没有智能体的特色,只有CodeGeeX问答模式。增加注释速度快,但不生成方法头部的注释解释代码文字解释后,生成了流程图实战代码扩展性修改PK提示词@workspace #codeba ...

人工智能驱动企业:通过情境感知AI重塑组织4个人生产力

4 个人生产力 Sasha 是一名手术室护士。今天是平常的一天。她正在为一位病人制定术前程序。今天的手术是标准的——疝气手术。然而,即使是常规手术,术前程序也会因病人的既往病史和当前健康状况而异。 制定术前计划不仅仅是重复标准模板,它还涉及关键决策。Sasha 必须概述针对每位病人的具体步骤。她必须 ...

<1234···50>