介绍 (1) 发表 2024-07 ISSTA'24 (2) 背景 对于某些较为复杂的 bug,需要强大的代码理解和推理能力才能解决 方法 (1) 收集阶段 prompt 准备:角色描述+任务描述+思维链启示 思维链收集:prompt 给 LLM 生成思维链,这里的输出是样本的集合,其中样本包括 b ...
在之前发布的内容中,我们曾介绍过时序数据库 IoTDB 实现了 IoTDB MCP Server 功能。借助该功能,用户只需用自然语言描述需求,例如“查询 2025 年 3 月 19 日所有基站的整流模块电流平均值”,大模型便能自动调用相应的查询函数,直接与 IoTDB 交互并获取所需数据。 值得一 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
IP Scanner - 多线程网络扫描工具 项目简介 IP Scanner 是一个基于 Python 开发的网络扫描工具,它能够快速扫描指定网段内的活动 IP 地址。该工具采用多线程技术提高扫描效率,并提供了友好的图形用户界面,支持中英文界面切换。 技术栈 核心技术 Python 3.x: 主要开 ...
上一章畅想里面我们重点提及了大模型的记忆模块,包括模型能否持续更新记忆模块,模型能否把持续对记忆模块进行压缩更新在有限的参数中存储更高密度的知识信息,从而解决有限context和无限知识之间的矛盾。这一章我们分别介绍两种方案,一种是基于模型结构的Google提出的Titan模型结构,另一种是基于外挂... ...
谷歌IDX提供免费高配云服务器(16核CPU,64G内存,300G硬盘),无需绑卡,只需一个能正常使用的谷歌账号。这是一个非常强大的开发环境,特别适合运行大型AI模型和开发工作。 一、Google IDX的优势 强大的硬件配置:16核CPU、64G内存、300G硬盘空间 完全免费:无需信用卡,只需谷 ...
AI 的终点,不是更强大的对话,而是一个真正协作的智能体社会。 这种形态已经在悄然出现。 全球首个支持 Google A2A(Agent-to-Agent)协议 的智能体注册与协作平台同步上线Product Hunt,并取得了良好的社区反馈。 A2Astore.co在Product Hunt上的发布 ...
目录前言简介详细解读Mosaic and MixupMixupMosaicDecoupled Headanchor freeSimOTAin_boxes 和 in_center计算cost矩阵dynamic_k_matching算法网络架构参考资料 前言 提出时间:2021年 作者单位:旷视科技 旷 ...
在SVM中,软间隔是一个重要的概念,它允许模型在一定程度上容忍误分类,从而提高模型的泛化能力。 本文将详细介绍软间隔的定义、与硬间隔的区别、损失函数的作用,最后使用 scikit-learn 进行实际演示。 1. 软间隔 vs 硬间隔 在支持向量机中,软间隔是指允许某些数据点违反分类边界(即误分类) ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
有人说,大模型+知识库就是新一代的员工。 可你有没有想过,如果你把一堆资料往员工桌上一扔,不教、不管,还想让他做出像样的工作,结果会如何? 这是很多人现在“用知识库喂大模型”的真实写照。 这篇文章是我在进行了数千小时的知识库实践后的一些思考:不仅告诉你“是什么”,更帮你弄明白“怎么做”。 AI粉嫩特 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
其实在DeepSeek-R1爆火之前,DeepSeek V2在我们行业就已经妇孺皆知了,它独特的MOE结构值得研究一下。这篇文章是基于 ZOMI酱 的2个视频写的,这2个视频讲的很好,建议大家都学习一下:《MOE终于迎来可视化解读!傻瓜都能看懂MoE核心原理!》和《使用昇腾NPU手撕MoE单机版代码 ...
目录什么是ResNet提出背景梯度爆炸/梯度消失:退化现象:原理解析网络结构参考资料 什么是ResNet 首先我们来看什么是ResNet,其全称为Residual Network(残差网络),是一种深度学习的网络结构,由微软研究院的何凯明等人于2015年提出。ResNet最大的创新在于引入了“残差模 ...
在机器学习领域,支持向量机(SVM)是一种强大的分类算法,而核函数则是其核心组件之一。 核函数的本质是一个「空间映射工具」。 当原始数据在低维空间中线性不可分时(如环形、月牙形数据),核函数能将数据隐式地映射到更高维的特征空间,使得在高维空间中数据变得线性可分,同时避免直接计算高维特征的爆炸性计算量 ...
作者:痴者工良 博客地址:https://www.whuanle.cn/ 示例项目地址:https://github.com/whuanle/mcpdemo 近期 MCP 协议越来越爆火,很多开发者都投身参与 MCP Server/Client 的开发,各个大厂也纷纷推出自己的 MCP 集成平台或开 ...
相关背景技术基础成熟自然语言处理(NLP):AI可通过解析会议记录、邮件等非结构化文本,自动提取需求关键词(如“用户身份验证”“响应时间”),并分类为功能类、体验类或BUG类,准确率超过98%。 机器学习模型:通过分析历史项目数据(如需求变更频率、资源分配规律),AI可预测需求变更风险,优化任务拆解 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
计算大模型参数量主要依赖于模型的架构和各层配置,我们把常用大模型分为三层:输入层、transformer层、输出层。 输入层 参数组成是Embedding的词表总和 transformer层 参数组成包括归一化参数、QKV的参数、输出全连接线性变换参数、FFN投影参数 输出层 归一化参数、全连接线性 ...