AI
刷新
大模型参数组成计算QwQ-32B为例

计算大模型参数量主要依赖于模型的架构和各层配置,我们把常用大模型分为三层:输入层、transformer层、输出层。 输入层 参数组成是Embedding的词表总和 transformer层 参数组成包括归一化参数、QKV的参数、输出全连接线性变换参数、FFN投影参数 输出层 归一化参数、全连接线性 ...

理解元模型

本文是由AI (DeepSeek v3)根据动态模型和XWorker的文档生成的,是AI自己的对元模型的理解。 文章是网页版,全文链接是:https://www.xworker.org/do?sc=_local.web.statichtml.novel.UnderstandMetaModel1 咖啡 ...

张高兴的大模型开发实战:(五)使用 LLaMA Factory 微调与量化模型并部署至 Ollama

目录环境搭建与配置数据集准备WebUI 配置微调参数模型导出与量化导入 Ollama LLaMA Factory 是一个开源的全栈大模型微调框架,简化和加速大型语言模型的训练、微调和部署流程。它支持从预训练到指令微调、强化学习、多模态训练等全流程操作,并提供灵活的配置选项和高效的资源管理能力,适合开 ...

用 AI 实现一个 GBK/GB2312 转 UTF-8 工具:轻松解决文本编码转换难题(附完整源码)

用 AI 实现一个 GBK/GB2312 转 UTF-8 工具:轻松解决文本编码转换难题 在处理历史文件或与不同系统交互时,我们经常会遇到 GBK 或 GB2312 编码的文本文件。虽然现在 UTF-8 是主流,但手动转换这些旧编码文件既繁琐又容易出错。为了解决这个问题,我开发了一个简单的图形界面工 ...

Chat to MySQL 最佳实践:MCP Server 服务调用

博主头像 一、场景说明: 通过 1Panel+MaxKB 两个开源工具结合 MCP 服务实现 Chat to Mysql。 二、资源准备 MySQL:数据库以及数据库表(培训认证中心运营数据表) 1Panel:开源 Linux 运维管理平台 MaxKB: 强大易用的开源 AI 小助手 三、操作说明 步骤一:完 ...

coze工作流-一分钟生成爆款中式养生视频

博主头像 视频效果:见 公众号"AI创变坊"文章《coze工作流-一分钟生成爆款中式养生视频》 工作流实现拆解 工作流全貌(这个工作流实现确实比较麻烦,搞了一整天) 一、文本处理、批处理结节点 文本处理把用户输入的养生词句 按照句号 分割,批处理循环处理每句话 注意:并行运行数量不要过大,不然会报错 二、循环 ...

分享开源项目oneapi的部分API接口文档

OneAPI开源项目的地址->One API 最近在学习oneapi,阅读了部分源码,把接口文档分享给大家 OneAPI API 文档 本文档描述了One API 开源项目的 API 接口(部分)。 用户管理 (User Management) 1. 用户注册 (User Registration) ...

里程碑:MCP星球作为国内首个中文MCP社区和MCP工具平台,突破7000个MCP服务!

博主头像 随着人工智能技术的快速发展,越来越多的开发者开始使用模型上下文协议(Model Context Protocol,简称MCP)来优化大模型与外部工具的交互。作为首个最大的中文MCP工具市场,MCP星球不仅为开发者提供了丰富的MCP服务,平台已突破7000个MCP服务,还通过创新的方式降低了开发门槛, ...

LLM中的Top-K/Top-p/温度都是怎么发挥作用的?

博主头像 写在前面 许多大模型具有推理参数,用于控制输出的“随机性”。常见的几个是 Top-K、Top-p,以及温度。比如我们常用的 Dify 平台就支持 Top-p 和 温度 的设置: 鼠标放到问号上面,可以看到各自的解释: Top-p: 含义:Kernel sampling threshold. Used ...

coze生成儿童诗文图鉴(语音)升级版

博主头像 之前已经使用coze 搭建过儿童古诗图文鉴赏,最后通过markdown 的方式可以直接输出图集 更新版本儿童古诗图文语音鉴赏,效果: 视频效果见 公众号文章 coze工作流-古诗词图鉴升级图像风格和语音讲解 这次的更新主要是做了如下几处升级 第一:图像提示词从水墨画改为更适合儿童看的风格, 提示词示 ...

dify MCP工具调用

一、概述 前面几篇文章,介绍了Cherry Studio客户端调用MCP,接下来介绍dify如何调用MCP 二、dify插件 需要安装2个插件,分别是:Agent 策略(支持 MCP 工具),MCP SSE Agent 策略(支持 MCP 工具) Agent 策略集合(支持 MCP SSE 发现和调 ...

通过一个DEMO理解MCP(模型上下文协议)的生命周期

博主头像 在LLM应用的快速发展中,一个核心挑战始终存在:如何让模型获取最新、最准确的外部知识并有效利用工具? 背景其实很简单:大模型(LLM)再强,也总有不知道的东西,怎么办?让它“查资料”“调工具”成了近两年最热的技术方向。从最早的 RAG(Retrieval-Augmented Generation), ...

Java&Activiti7实战:轻松构建你的第一个工作流.md

博主头像 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...

Coze实现古诗文图集

博主头像 Coze实现古诗文图集 目标:通过Coze自动化生成古诗配图,并将多张图片排版到画板中,最终直接在对话框展示完整图集(而非链接)。 思路: 用户输入诗句 → 2. 补全古诗 → 3.拆分诗文 → 4. 生成每句诗的配图 → 5. 画板排版 → 6. 诗文和图片展示→ 7. 飞书机器人使用。 效果: ...

一键抓取抖音、头条热点,轻松管理于飞书

博主头像 Coze一键抓取抖音视频内容,写入飞书,轻松搭建流程 Coze智能体介绍(Coze官网) Coze 是字节跳动推出的一款低代码智能体开发平台,旨在帮助用户便捷地创建和管理多种类型的智能体。通过直观的可视化工作流设计,用户可以轻松实现复杂任务的自动化处理。平台提供了丰富的插件以扩展功能,并支持自定义插 ...

<1···192021···50>