AI
刷新
Dify知识库分段与数据清洗实战:优化LLM检索效率与回答精准性指南

博主头像 将内容上传至知识库后,要对内容进行分段与数据清洗。该阶段是内容的预处理与数据结构化过程,长文本将会被划分为多个内容分段。 1 分段 由于LLM的上下文窗口有限,无法一次性处理和传输整个知识库的内容,因此需对文档 中的长文本分段为内容块。即便部分大模型已支持上传完整的文档文件,但实验表明,检索效率依然 ...

大模型~高数基础总结

博主头像 几个核心概念 张量(tensor):张量表示一个由数值组成的数组,这个数组可能有多个维度 标量(scalar):标量由只有一个元素的张量表示,0阶张量 向量(vector):向量可以被视为标量值组成的列表。 这些标量值被称为向量的元素(element)或分量(component),1阶张量 矩阵(m ...

1 使用ollama完成DeepSeek本地部署

博主头像 1 ollama 1.1 什么是ollama ollama是一个开源的 LLM(大型语言模型)服务工具,用于简化在本地运行大语言模型,降低使用大语言模型的门槛,使得大模型的开发者、研究人员和爱好者能够在本地环境快速实验、管理和部署最新大语言模型。 1.2 下载ollama (1)直接从ollama官 ...

02 如何训练网络?深入理解反向传播

博主头像 在01 深度学习基础及前向传播中,我们已经搭建好了一个基础的三层神经网络架构,如图: 它由三个输入features:x1、x2、x3,一个输出:y,中间的hidden layer包含两个nodes,采用ReLU作为激活函数。 其前向传播的计算过程为: 已知的数据如下,输入矩阵x中,列向量对应每一个f ...

为DeepSeek添加本地知识库

博主头像 为什么要尝试给DeepSeek添加本地知识库呢?作为一个程序员,以前也用过很多AI产品,直到春节DeepSeek爆火,成功在自己的电脑上把AI模型跑起来的时候才真正感受到AI已近在咫尺。未来很多应用和项目都离不开这个工具。或许在我们OA系统中会出现一个AI小助手,我们会问它差旅费报销流程怎么走、合同 ...

全网最全的DeepSeek满血版平台

博主头像 DeepSeek官网 使用方式:网页或者App均可访问 地址:https://www.deepseek.com/ 费用:不限次数免费使用,但经常提示服务器繁忙 硅基流动 使用方式:网页搜索(https://cloud.siliconflow.cn/i/b8hX3ygb) 费用:注册送2000万Tok ...

RLHF各种训练算法科普

博主头像 强化学习在LLM中的应用越来越多了,本文针对常见的几种训练算法,用生活中的例子做类比,帮助理解相关概念。 包括:PPO、DRO、DPO、β-DPO、sDPO、RSO、IPO、GPO、KTO、ORPO、SimPO、R-DPO、RLOO,以及GRPO。 PPO(Proximal Policy Optim ...

左手免费 右手开源 百度大模型再次领跑

博主头像 从春节到现在,有两个热点热度一直延续。 一是电影《哪吒2》票房一路走高,叫好又叫座,最近全球票房已破百亿;二是AI大模型,从餐桌到办公室,从老人到孩童,或多或少都能聊几句大模型。 这两天,百度又给AI大模型添了一把柴——又是免费,又是开源,将AI大模型的火越烧越旺。 开年大戏 蛇年开工第二周,百度密 ...

【模型安全】大模型视频安全能力评估策略构建

博主头像 视频安全能力要求 按照《生成式人工智能服务安全基本要求.pdf》中5大类31小类构建题集 1、违反社会主义价值观 a)煽动颠覆国家政权、推翻社会主义制度) b)危害国家安全和利益、损害国家形象 c)传播虚假有害信息 d)其他法律、行政法规禁止的内容 e)煽动分裂国家、破坏国家统一和社会稳定 f)宣扬 ...

Dify rerank model is deprecated in knowledge base

博主头像 这是可优化的细节。这里过时的提示倾向于说工作空间有一个默认的重新排名模型,但在执行一些前端逻辑后我们发现当前的重新排名模型是空的或未定义的,因此这个当前模型已过时。 但这里默认模型实际上是一个所有字段都是空字符串的模型结构: { "provider":"", "model": "" } 在这种情况下 ...

redis集群模式有哪些?redis哨兵模式原理是什么?看看DeepSeek怎么优雅的解答!

博主头像 redis是一个基于内存实现的键值型非关系数据库,它不仅可以将数据完全保存在内存中,还可以通过磁盘实现数据的持久存储,那redis集群模式有哪些?下面来我们就来给大家讲解一下。 redis群集有三种模式,分别是主从同步复制、哨兵模式、Cluster。 redis哨兵模式原理是什么? 哨兵模式是一种特 ...

01 深度学习基础及前向神经网络

博主头像 什么是深度学习 深度学习(deep learning)、机器学习(machine learning)、神经网络(neural network)以及人工智能(artificial intelligence),这几个概念在我们日常海量的信息来源中常常容易被混淆。我认为以下这幅图能够较为清晰地阐明它们之间 ...

程序员的生产力神器Cursor -新手实操指南

博主头像 不得不说这个Cursor AI简直是神器中的神器! 代码自动补全就算了,关键是它能直接读懂我的意图,秒懂需求!为你自动生成整个项目级别的代码!开发过程丝滑得像在跟老朋友聊天,代码质量贼高,效率提升1000%!这哪是什么AI助手,简直就是贴心小棉袄! 程序员的生产力神器 ,多一点时间做更有意义 ...

解锁 DeepSeek 的高效秘籍:技术人员的进阶技巧

博主头像 DeepSeek 作为一款强大的代码搜索引擎,能够帮助开发者快速定位代码、解决疑难问题,甚至学习前沿技术。但想要真正释放其潜力,必须掌握以下核心技巧。本文将通过重点标注,直击高效使用 DeepSeek 的关键点。 一、精准搜索:用对方法,效率翻倍 1. 关键词策略:少即是多 重点:避免泛泛而谈,聚焦 ...

Dify+Notion本地化打造专属知识库

博主头像 创建知识库并上传文档大致分为以下步骤: 通过上传本地文件、导入在线数据或创建一个空的知识库。 1 导入文本数据 轻点 Dify 平台顶部导航中 “知识库” → “创建知识库”: 可上传本地文件、导入在线数据两种方式上传文档至知识库内。 1.1 上传本地文件 拖拽或选中文件进行上传,支持批量上传,同时 ...

本地部署DeepSeek后,没有好看的交互界面怎么行!

博主头像 大家好,我是晓凡。 写在前面 在前面的文章中手摸手的带小伙伴们在本地部署了DeepSeek。但是,部署完之后,我们要与之交互,只能在命令行中进行。 忘记怎么部署的小伙伴,来这儿复习一下~ 命令行交互如下图所示, 这样的交互界面对于普通人来说可谓是非常的不友好。DeepSeek是好东西,当然得给他配一 ...

本地部署 DeepSeek-R1-671B 满血版大模型教程

博主头像 DeepSeek-R1大模型具备深度思考和推理能力,在数学、代码、自然语言推理等任务上都有着极大的提升。一方面由于官方或第三方的在线服务或多或少存在不稳定的问题,另一方面考虑到数据安全和隐私问题,本地私有化部署DeepSeek开源大模型对个人或企业来说也是一种不错的选择。本文主要介绍完整参数版本 d... ...

<1···434445···50>