AI
刷新
基于ChatGLM沉思模型实现商品搜索

博主头像 背景ChatGLM-沉思版是由智谱AI于2025年4月推出的新一代智能体,其核心背景可从技术原理、应用场景、发展历程及未来趋势四方面展开:技术原理:融合深度思考与操作执行的革新架构模型基础: 基于GLM(General Language Model)的Transformer架构,采用自回归生成模式, ...

大模型一键封装成OpenAI协议解决方案(一)

博主头像 引言:本质上是统一为openai协议 参考文章: OneAPI-接口管理和分发神器:所有大模型一键封装成OpenAI协议 - AI码上来的文章 - 知乎 https://zhuanlan.zhihu.com/p/707769192 目前有两种选择,一是开源可商用的OneAPI,另一种则是国内的接口聚 ...

不平衡样本数据的救星:数据再分配策略

博主头像 在机器学习领域,数据是模型训练的基础,而数据的分布情况往往会对模型的性能产生重要影响。 不平衡样本数据是我们在实际项目中经常会遇到的问题,它可能导致模型对多数类过度拟合,而对少数类的预测能力不足。 本文将详细介绍不平衡样本数据的常见场景、处理方法以及在实践中需要注意的问题,帮助你在模型训练前有效地进 ...

AI可解释性 II | Saliency Maps-based 归因方法(Attribution)论文导读(2025.4.9更新)

博主头像 本文作为AI可解释性系列的第二部分,旨在以汉语整理并阅读归因方法(Attribution)相关的论文,并持续更新。 归因方法主要研究如何解释深度神经网络的决策过程,通过识别输入特征对模型输出的贡献程度,对模型的决策过程输出为人类可以理解的图像或者量化指标,帮助我们理解模型的决策依据。 ...

抄了AI语音克隆的家!本地部署、6G显存搞定、一键启动包免费放送

博主头像 今天给大家带来几款AI语音克隆技术的硬核分享,包括本地部署教程,还有超方便的一键启动整合包。无论你是技术小白还是资深玩家,这篇干货都能让你轻松上手,克隆出属于自己的专属语音! 1. Index-TTS:语音克隆界的“省心王者” 在AI语音克隆圈子里,Index-TTS绝对是“懒人福音”。它强不强?我 ...

阿里华为等大厂架构师如何解决空指针问题

博主头像 0 前言 null,表示无引用指向或没有指针,若操作该变量会引发空指针异常,即NullPointerException,NPE。 当线上发生该异常,说明代码健壮性不足,如何才能避免NPE?NPE虽烦,但易定位,关键在null到底意味啥: client给server一个null,是其本意就想给个空值, ...

渠道商的AI掘金革命——零门槛代理千亿级市场,打造未来增长极

博主头像 渠道商的AI掘金革命——零门槛代理千亿级市场,打造未来增长极渠道商的生死抉择——代理AI,还是被时代抛弃?当传统软件代理利润缩水至5%、客户频繁追问“能否做AI功能”时,渠道商正站在历史拐点:①继续代理ERP、CRM等“过气产品”?——利润持续走低,客户流失加速。②转型AI赛道?——技术门槛高、投入 ...

RAG 技术深度解析:JBoltAI 如何构建企业级智能知识库

博主头像 在企业数字化转型中,知识资产的高效利用成为核心竞争力。JBoltAI 通过RAG(检索增强生成)技术,构建了 “知识检索 - 语义理解 - 智能生成” 的闭环体系,帮助企业将海量非结构化数据转化为可行动的智能决策。本文以官网典型案例 —— 智能客服知识库系统为例,详解 RAG 技术的实现逻辑与行业价 ...

JBoltAI的Prompt编排技术:重塑企业智能交互新生态

博主头像 一、Prompt编排技术原理 1. 结构化Prompt设计JBoltAI通过领域驱动设计(DDD)将业务需求拆解为原子化指令单元,构建三层结构: 业务意图层:定义核心目标(如营销转化、风险拦截) 场景规则层:注入行业知识(如金融合规条款、医疗术语库 交互执行层:集成多模态输出模板(文本/表格/流程图 ...

线性模型与多分类问题:简单高效的力量

博主头像 在机器学习的世界里,分类问题无处不在,而多分类问题更是其中的常见挑战。 无论是识别手写数字、分类新闻主题,还是预测客户购买的产品类别,多分类问题都扮演着重要角色。 线性模型,以其简洁高效的特点,成为了应对多分类问题的有力工具之一。 本文将探讨线性模型解决多分类问题的原理、策略以及优缺点,并通过代码示 ...

使用MCP C# SDK开发MCP Server + Client

博主头像 近日被MCP刷屏了,刚好看到张队发了一篇文章提到MCP的官方C# SDK发布了预览版,于是手痒痒尝了一下鲜,写了一个DEMO分享给大家。MCP,全称是“模型上下文协议”(Model Context Protocol),是Anthropic开源的一个标准协议,AI模型通过这个标准协议就能直接获取数据或... ...

开发一个mcp-server实现sqlite智能体

博主头像 mcp介绍 MCP(Model Context Protocol)是由 Anthropic(Claude的那个公司) 推出的开放标准协议,它为开发者提供了一个强大的工具,能够在数据源和 AI 驱动工具之间建立安全的双向连接。 举个好理解的例子:如果把 AI 比作电脑主机,那么 MCP 就相当于 US ...

线性判别分析(LDA):降维与分类的完美结合

博主头像 在机器学习领域,线性判别分析(Linear Discriminant Analysis,简称LDA)是一种经典的算法,它在降维和分类任务中都表现出色。 LDA通过寻找特征空间中能够最大化类间方差和最小化类内方差的方向,实现数据的降维和分类。 本文主要介绍LDA的基本原理,展示其如何解决分类问题,以及 ...

一套低成本、高质量的替代AI数字人/唇形同步方案

博主头像 随着自媒体和电商的蓬勃发展,AI技术正成为内容创作和营销的新宠。最近,我身边一位做自媒体的朋友为了推广店铺,接触到了一家新媒体公司。这家公司推出了一款小程序,宣称只需上传一段真人朗读数字(如“12345...”)的视频,就能根据文案生成AI克隆声音并实现唇形同步的视频。听起来是不是很酷?当你还在一天 ...

Open R1 项目进展第二期

博主头像 我们启动 Open R1 项目 已经两周了,这个项目是为了把 DeepSeek R1 缺失的部分补齐,特别是训练流程和合成数据。 这篇文章里,我们很高兴跟大家分享一个大成果: OpenR1-Math-220k,这是我们打造的第一个大规模数学推理数据集! 除此之外,我们还聊聊社区里一些让人兴奋的进展, ...

DeepSeek 会话补全 API

博主头像 DeepSeek 会话补全 API 是一个超强大的 AI 对话接口 ,可以让你:- 打造自己的 智能聊天机器人 - 让 AI 帮你 写文章、改代码、编故事 - 甚至模拟 各种角色(比如猫娘、霸道总裁、科幻作家…) ...

昇腾 msmodelslim w8a8量化代码解析

​ 最近有很多朋友都在部署deepseek模型,而且都用到了模型量化这个功能,目的是减少显存占用、提升推理速度。 上图是w8a8量化算法流程,主要包含4步: ①,使用昇腾 msmodelslim 仓库提供的量化接口对原始模型权重进行量化,生成int8格式的权重文件,以及后续在推理的时候要用到的激活值 ...

<1···151617···50>