Puzzles 8: Long softmax puzzles8是计算batch的softmax,题目如下: Softmax of a batch of logits. Uses one program block axis. Block size B0 represents the batch o ...
SmolVLM2轻量级视频多模态模型,应用效果测评 目 录 1. 前言... 2 2. 应用部署... 2 3. 应用效果... 4 1.1 风景图像理解... 4 1.2 事故现场理解... 5 1.3 仿真图像理解... 6 1.4 数量统计描述... 7 1.5 图像文字理解... 8 1.6 ...
你是否有这样的经历:”知识库文档越来越多,知识库问答却越来越不靠谱,RAG检索到的都是一堆不相关的内容。“ 在这个信息爆炸的时代,我们不缺资料,缺的是找到"对的资料"的能力。 元数据和标签看似普通,却能很大提升RAG能力。 这篇文章聊一聊它们如何辅助RAG系统真正理解用户意图,精准找到需要的信息。 ...
欢迎参加 Gradio & MCP 智能体主题黑客松! 准备好了吗?一场以智能体(Agent)和模型上下文协议(Model Context Protocol,简称 MCP)为核心的全球在线黑客松即将来袭! 本次活动由 Hugging Face 举办,我们将共同探索基于 Anthropic MC ...
介绍 GeekAI 基于AI大语言模型的AI 助手全套开源解决方案,自带运营管理后台,开箱即用。集成了 OpenAI, Claude, 通义千问,Kimi,DeepSeek等多个平台的大语言模型。 基于极客学长大佬的开源项目geekai 二次开发而来。首先感谢大佬的开源,致敬。大佬的项目地址:htt ...
度量学习是一种神奇的机器学习技术,它的核心目标就是教会机器如何更好地衡量不同数据点之间的 “距离” 。 在我们日常生活中,距离这个概念很直观,比如两点之间的直线距离。 但在机器学习的世界里,数据通常是高维的,比如一张图片可以被表示为一个包含像素值的高维向量。 那么,如何衡量这些高维数据之间的相似性或 ...
背景 笔者最近在工作中需要用到一些高性能计算的优化,于是准备着手系统性进行学习。有大佬建议先从triton学起,并且推荐了triton puzzles和triton的tutorial作为入门资料。以下是我练习triton puzzles时对一些解法的分析,记录一下作为心得。 练习题库git http ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
微软开源的BitNet模型(特别是BitNet b1.58 2B4T)是一种革命性的低精度大语言模型(LLM),1.58位三值权重:权重仅取-1、0、+1三种值,每个参数平均占用约1.58位存储,结合8位整数激活值(W1.58A8配置),大幅压缩模型体积,通过创新的量化技术和架构设计,在性能、能效和... ...
5 月 23 日,Claude 官方宣布推出下一代 Claude 模型:Claude Sonnet 4 和 Claude Opus 4,直接 在全世界的 AI 圈掀起了新的风暴! 据官方称,Claude Opus 4 是 世界上最好的编程模型,在复杂、长期运行的任务和智能体工作流程中具有持续性能,能 ...
在机器学习和数据分析中,数据的维度常常是一个让人头疼的问题。 想象一下,你面前有一张包含成千上万列特征的表格,每一列都可能是一个重要的信息源,但同时也会让计算变得异常复杂。 这时候,降维技术就派上用场了!它可以帮助我们把高维数据“瘦身”成低维数据,同时尽可能保留有用的信息。 今天,介绍几种常见的降维 ...
前言 随着大型语言模型 (LLM) 的飞速发展,将其集成到各类应用中以提升智能化水平已成为一种趋势。Saga Reader 作为一款现代化的 RSS 阅读器,在 LLM 集成方面做出了前瞻性的设计,不仅支持通过 Ollama 实现本地化 LLM 功能,还具备了接入多种在线 LLM 服务(如智谱 GL ...
背景 生成式排序作为生成式模型在推荐系统中的重要应用方向,旨在通过生成式模型对用户行为序列进行建模,从而实现对用户兴趣的动态捕捉和对未来行为的准确预测。与传统基于特征工程的推荐方法相比,生成式排序模型能够更自然地处理序列数据,捕捉用户行为的长期依赖关系,并且可以自适应地更新用户兴趣表示,以适应用户兴 ...
在数据分析和机器学习领域,聚类是一种非常重要的无监督学习方法,它可以帮助我们发现数据中的内在结构,将相似的数据点分组到一起。 本文将介绍几种常见的聚类算法,包括原型聚类(如 k-均值、学习向量量化、高斯混合聚类)、密度聚类(DBSCAN)和层次聚类(AGNES)。 通过浅显易懂的方式介绍它们的原理, ...
第零章 积分 变上限积分:设积分形式为\(\boxed{I(x)=\int_{v(x)}^{u(x)}f(t,x)\text{d}t}\),则对\(I(x)\)求导得: \[\boxed{\frac{\text{d}I}{\text{d}x} = f(v(x), x) \cdot v'(x) - f ...
去年底开始基于ESP32开发DIY的各种AI语音智能助手层出不穷,AI智能玩偶也比较火热。目前市面上也都有比较成熟的开发板集成了各种模块麦克风、OLED、功放、摄像头等几乎是开箱即用,普通开发者买了折腾一通总能搞点什么出来,当然对于批量推出市场的使用这种开发板成本比较高,通常比较少人这么用。 目前市 ...
背景Claude Sonnet 4是对Claude Sonnet 3.7的重大升级,在更精确地响应你的指令的同时,提供卓越的编码和推理能力。除了这些模型,我们还宣布了以下内容:扩展思考与工具使用(测试版):两款模型都可以在扩展思考过程中使用工具(如网络搜索),使Claude能够在推理和工具使用之间交 ...
1️⃣ Nvidia与瑞典企业共建AI工厂 时间: 2025-05-24 摘要: Nvidia与瑞典瓦伦堡家族支持的企业集团合作,在瑞典建立AI基础设施,旨在推动欧洲的AI发展。该项目预计将增强瑞典在AI领域的竞争力,促进技术创新和经济增长。 解读: 此举显示了Nvidia在全球范 ...
起初的原因是,想要跑一个用到了mamba_ssm的项目,故尝试在wsl中配置mamba_ssm库。提示需要`pip install mamba-ssm`后报错频繁,遇到了许多问题。查阅了很多blog和issue,安装了很多次环境,仿佛已经对注意事项倒背如流,但是就是无法解决最后的**selectiv... ...