本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
其实在DeepSeek-R1爆火之前,DeepSeek V2在我们行业就已经妇孺皆知了,它独特的MOE结构值得研究一下。这篇文章是基于 ZOMI酱 的2个视频写的,这2个视频讲的很好,建议大家都学习一下:《MOE终于迎来可视化解读!傻瓜都能看懂MoE核心原理!》和《使用昇腾NPU手撕MoE单机版代码 ...
目录什么是ResNet提出背景梯度爆炸/梯度消失:退化现象:原理解析网络结构参考资料 什么是ResNet 首先我们来看什么是ResNet,其全称为Residual Network(残差网络),是一种深度学习的网络结构,由微软研究院的何凯明等人于2015年提出。ResNet最大的创新在于引入了“残差模 ...
在机器学习领域,支持向量机(SVM)是一种强大的分类算法,而核函数则是其核心组件之一。 核函数的本质是一个「空间映射工具」。 当原始数据在低维空间中线性不可分时(如环形、月牙形数据),核函数能将数据隐式地映射到更高维的特征空间,使得在高维空间中数据变得线性可分,同时避免直接计算高维特征的爆炸性计算量 ...
相关背景技术基础成熟自然语言处理(NLP):AI可通过解析会议记录、邮件等非结构化文本,自动提取需求关键词(如“用户身份验证”“响应时间”),并分类为功能类、体验类或BUG类,准确率超过98%。 机器学习模型:通过分析历史项目数据(如需求变更频率、资源分配规律),AI可预测需求变更风险,优化任务拆解 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
计算大模型参数量主要依赖于模型的架构和各层配置,我们把常用大模型分为三层:输入层、transformer层、输出层。 输入层 参数组成是Embedding的词表总和 transformer层 参数组成包括归一化参数、QKV的参数、输出全连接线性变换参数、FFN投影参数 输出层 归一化参数、全连接线性 ...
本文是由AI (DeepSeek v3)根据动态模型和XWorker的文档生成的,是AI自己的对元模型的理解。 文章是网页版,全文链接是:https://www.xworker.org/do?sc=_local.web.statichtml.novel.UnderstandMetaModel1 咖啡 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
文章目录 (一)大模型备案的适用主体 (二)大模型训练语料安全 (三)大模型安全 (四)安全措施要求 (五)拦截词/安全词库要求 (六)大模型内容安全评估要求 (七)附录大模型备案材料源文件 (八)广东省公布的获得大模型备案补贴名单 我国于2024年3月1日正式发布首部生成式人工智能安全技术标准《生 ...
目录环境搭建与配置数据集准备WebUI 配置微调参数模型导出与量化导入 Ollama LLaMA Factory 是一个开源的全栈大模型微调框架,简化和加速大型语言模型的训练、微调和部署流程。它支持从预训练到指令微调、强化学习、多模态训练等全流程操作,并提供灵活的配置选项和高效的资源管理能力,适合开 ...
用 AI 实现一个 GBK/GB2312 转 UTF-8 工具:轻松解决文本编码转换难题 在处理历史文件或与不同系统交互时,我们经常会遇到 GBK 或 GB2312 编码的文本文件。虽然现在 UTF-8 是主流,但手动转换这些旧编码文件既繁琐又容易出错。为了解决这个问题,我开发了一个简单的图形界面工 ...
一、场景说明: 通过 1Panel+MaxKB 两个开源工具结合 MCP 服务实现 Chat to Mysql。 二、资源准备 MySQL:数据库以及数据库表(培训认证中心运营数据表) 1Panel:开源 Linux 运维管理平台 MaxKB: 强大易用的开源 AI 小助手 三、操作说明 步骤一:完 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
视频效果:见 公众号"AI创变坊"文章《coze工作流-一分钟生成爆款中式养生视频》 工作流实现拆解 工作流全貌(这个工作流实现确实比较麻烦,搞了一整天) 一、文本处理、批处理结节点 文本处理把用户输入的养生词句 按照句号 分割,批处理循环处理每句话 注意:并行运行数量不要过大,不然会报错 二、循环 ...
错误原因 pip安装依赖时出现报错:ConnectError: [WinError 10054] 远程主机强迫关闭了一个现有的连接。 这通常表示在尝试从 Python 包索引 (PyPI) 下载 python-docx 包时遇到了网络连接问题。 而默认的下载源在国外服务器上,所以连接常常不稳定。 解 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
OneAPI开源项目的地址->One API 最近在学习oneapi,阅读了部分源码,把接口文档分享给大家 OneAPI API 文档 本文档描述了One API 开源项目的 API 接口(部分)。 用户管理 (User Management) 1. 用户注册 (User Registration) ...
随着人工智能技术的快速发展,越来越多的开发者开始使用模型上下文协议(Model Context Protocol,简称MCP)来优化大模型与外部工具的交互。作为首个最大的中文MCP工具市场,MCP星球不仅为开发者提供了丰富的MCP服务,平台已突破7000个MCP服务,还通过创新的方式降低了开发门槛, ...
写在前面 许多大模型具有推理参数,用于控制输出的“随机性”。常见的几个是 Top-K、Top-p,以及温度。比如我们常用的 Dify 平台就支持 Top-p 和 温度 的设置: 鼠标放到问号上面,可以看到各自的解释: Top-p: 含义:Kernel sampling threshold. Used ...