探秘Transformer系列之(28)--- DeepSeek MLA
从零开始解析Transformer,目标是:(1) 解析Transformer如何运作,以及为何如此运作,让新同学可以入门;(2) 力争融入一些比较新的或者有特色的论文或者理念,让老鸟也可以有所收获。 ...
一个神奇的JS代码,让浏览器在新的空白标签页运行我们 HTML 代码(createObjectURL 的妙用)
目录前言问题一个偶然预览 HTML 代码 前言 目前,网上很多在线运行 HTML 的页面,大都是这样的逻辑: 上面一个代码框 <textera> ,下面一个 <iframe>,然后通过 js,将我们的代码框中的 HTML 给输入到 <iframe> 里面,这便是一个简单的在线运行 html 的逻辑。 ...
聊聊一体机与AI知识库
提供AI咨询+AI项目陪跑服务,有需要回复1 之前写了一篇关于一体机的文章: DeepSeek一体机是个什么鬼 一体机产生的原因是春节期间DeepSeek的火爆带动了一些公司的AI需求,但很多公司如医疗、法律、公司内部又确实有数据保密的诉求。 于是乎私有化部署被迅速摆到台面上来,在这个背景下,Dee ...
Solon AI MCP Server 入门:Helloworld (支持 java8 到 java24。国产解决方案)
目前网上能看到的 MCP Server 基本上都是基于 Python 或者 nodejs ,虽然也有 Java 版本的 MCP SDK,但是鲜有基于 Java 开发的。 作为Java 开发中的国产顶级框架 Solon 已经基于 MCP SDK 在进行 Solon AI MCP 框架开发了,本文将使用 ...
多模态模型 Grounding DINO 初识
Grounding DINO 是一种先进的零样本目标检测模型,由 IDEA Research 开发。它通过将基于 Transformer 的检测器 DINO 与Grounded Pre-Training相结合,实现了通过人类输入(如类别名称或指代表达)对任意物体进行检测。 ...
张高兴的大模型开发实战:(五)使用 LLaMA Factory 微调与量化模型并部署至 Ollama
目录环境搭建与配置数据集准备WebUI 配置微调参数模型导出与量化导入 Ollama LLaMA Factory 是一个开源的全栈大模型微调框架,简化和加速大型语言模型的训练、微调和部署流程。它支持从预训练到指令微调、强化学习、多模态训练等全流程操作,并提供灵活的配置选项和高效的资源管理能力,适合开 ...
WinDebug查看C#程序运行内存中的数据库连接字符串
真巧,昨天刷到了大佬“一线码农”的视频,大概就是讲的有人找他破解一个混淆加密的数据库连接字符串,然后大佬也提供了方案就是用WinDebug查看内存中的数据。这其实本质上就是一个用WinDebug查看对象字符串字段具体内容的需求,为啥要取这个标题?当然是骗人点进来啦 目录准备工作(环境)编写demo代 ...
超实用!用FunctionCall实现快递AI助手
昨天晚上直播,我们用 RAG(Retrieval-Augmented Generation,检索增强生成)实现了数据库 AI 助手,今天我们准备换一个技术使用 function call 来实现快递 AI 助手。 执行效果 快递 AI 助手的业务逻辑很清晰,就是我通过 LLM 大语言模型的对话来查询 ...
重生之我是操作系统(十)----I/O管理
简介 操作系统的I/O管理(input/output mannagment)是协调,控制计算机与外部设备(如磁盘,键盘,网络接口)等之间数据交换的核心功能。实现可靠高效且统一(隐藏设备差异,如磁盘、串口、网卡的硬件特性)的设备访问 前几章讲述的CPU管理,内存管理,文件管理。都是在计算机主机内部进行 ...
Spring Boot 根据配置决定服务(集群、单机)是否使用某些主件(MySQL、Redis、MongoDB、Nacos)
目录数据库型application-dev.yml 修改前application-dev.yml 修改后其它组件解决方案方案1:使用条件注解 + 配置开关方案2:使用 Profile 区分方案3:编程式条件加载(更灵活)方案4:使用 @ConfigurationProperties 更优雅地管理配置 ...
K8S 部署 Deepseek 要 3 天?别逗了!Ollama+GPU Operator 1 小时搞定
最近一年我都在依赖大模型辅助工作,比如 DeepSeek、豆包、Qwen等等。线上大模型确实方便,敲几个字就能生成文案、写代码、做表格,极大提高了效率。但对于企业来说:公司内部数据敏感、使用外部大模型会有数据泄露的风险。 尤其是最近给 Rainbond 开源社区的用户答疑时,发现大家对大模型私有化部 ...
解锁.NET 9性能优化黑科技:从内存管理到Web性能的最全指南
引言:性能优化的重要性与 .NET 9 的性能提升 ❝ 性能优化不仅关乎代码执行效率,还直接影响用户满意度和系统可扩展性。例如,一个响应缓慢的 Web 应用可能导致用户流失,而一个内存占用过高的服务可能增加云端部署的成本。 性能优化是确保应用程序在高负载和资源受限环境下高效运行的关键。无论是构建 W ...
Spark on K8s 在vivo大数据平台的混部实战
本文将从在离线混部中的离线任务的角度,讲述离线任务是如何进行容器化、平台上的离线任务如何平滑地提交到混部集群、离线任务在混部集群中如何调度的完整实现以及过程中的问题解决。 ...
即时通信SSE和WebSocket对比
Server-Sent Events (SSE) 和 WebSocket 都是用于实现服务器与客户端实时通信的技术,但它们在设计目标、协议特性和适用场景上有显著区别。以下是两者的详细对比: 一、核心区别总结 对比维度 SSE (Server-Sent Events) WebSocket 通信方向 单 ...
关于全球化大规模混合云 Kubernetes Prometheus 监控体系标准化及 GitOps 自动化改进方案
背景 现状 某司概况: PaaS/SaaS 公司,业务面向全球,包括 东南亚/南亚/中东/欧洲/非洲/美洲/东亚... 生产 k8s 集群数十套,生产非生产 >100 套(多种集群类型,各种公有云/专有云/私有云/数据中心...) 疫情以来,持续推进成本优化。 某司监控概况,由于历史原因和出于成本考 ...
快速理解 MCP 与 A2A 协议的关系,它们如何协作构建复杂AI系统
近期关于MCP协议的讨论非常热门,主要因为通过MCP协议通过标准化接口为 AI 应用与外部数据源建立统一交互通道,这使得大模型可以与外部数据源或工具进行交互,从而实现各种专业场景下的智能应用。关于如何实现MCP的架构,在上一篇《如何用Spring AI构建MCP Client-Server架构》中已 ...
Web前端入门第 36 问:多图细说 CSS grid 网格布局(一)父元素容器相关属性
grid 网格布局与 flex 弹性盒子布局一样,都需要控制 容器 跟 子元素 的样式才能做出想要的效果,部分场景只控制 容器 样式也行。 grid 样式属性 一大堆 属性 来袭~~ 与网格相关的 CSS 属性有一大堆,毕竟要同时控制行和列(行、列也被称为 网格轨道 grid track)。 容器( ...
MCP数据脱敏应用开发
一、概述 数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。 定义 指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、 ...
Sentinel源码—3.ProcessorSlot的执行过程
大纲 1.NodeSelectorSlot构建资源调用树 2.LogSlot和StatisticSlot采集资源的数据 3.Sentinel监听器模式的规则对象与规则管理 4.AuthoritySlot控制黑白名单权限 5.SystemSlot根据系统保护规则进行流控 1.NodeSelectorS ...
.NET周刊【3月第5期 2025-03-30】
国内文章 互联网不景气了那就玩玩嵌入式吧,用纯.NET开发并制作一个智能桌面机器人(四):结合BotSharp智能体框架开发语音交互 https://www.cnblogs.com/GreenShade/p/18771608 本文介绍了使用Azure语音服务和BotSharp框架进行语音交互的实践, ...