正文 从AE说起 AE是一个特征提取模型,通过编解码的形式重构输入,完成低维特征表示工作 推导 存在一个输入\(x\),构造AE编码器\(p_\theta(x)\),得到离散低维特征\(z\); 通过AE解码器\(q_\phi(z)\),重构回\(\hat{x}\); 通过正则项\(\Vert x- ...
MCP 最近在 AI 领域 引发了 广泛关注,特别是在 海外各大社区 中,大家热烈讨论,热度 相当高。 我打开了 Google Trends,这是一个专门用于查看全球热点趋势的网站。 输入关键词后,可以查看其热度变化。 我搜索了 “MCP”,它的趋势如图所示,变化非常明显。 各位可以参考一下。 每天 ...
在DeepSeek-R1的开源狂欢之后,感觉不少朋友都陷入了**技术舒适区**,但其实当前的大模型技术只是跨进了应用阶段,可以探索的领域还有不少,所以这一章咱不聊论文了,偶尔不脚踏实地,单纯仰望天空,聊聊还有什么有趣值得探索的领域,哈哈有可能单纯是最近科幻小说看太多的产物~ ...
在上一篇中,我们介绍了如何通过SK访问ollama中部署的大模型,今天我们尝试直接调用deepseek官网api,来实现AI对话功能。 DeepSeek官方API 如果要使用deepseek 官方API,首先我们要注册API访问的账号,然后创建apikey。 DeepSeek Platform地址: ...
学习与反思 主要是记录自己遇到的问题以及踩的坑 同时欢迎各位大佬,给我提出意见,我一定会好好吸取。_ 准确率只有0.1左右?(or 很低) 有可能是因为权重没有初始化(不一定是必要的) 或者学习率设置的问题,可能设置的太大了,试着调小一些 如何区分验证集和测试集? 训练集 (训练阶段) 用于构建我们 ...
不积跬步无以至千里,不积小流无以成江海!--《荀子 劝学》 我是对本地大模型有执念的!因为它安全性好,数据完全被自己掌控。在前面的内容里面分享了如何使用OllamaSharp访问ollama接口,今天分享如何使用Semantic Kernel来访问ollama接口。 关于Semantic Kerne ...
图片批量重命名工具 - 自动化整理您的图片库 GitHub项目地址: https://github.com/dependon/renameImage 项目介绍 这是一个基于Python开发的图形界面工具,用于批量重命名文件夹中的图片文件。它能够递归处理选定文件夹及其所有子文件夹中的图片,按照"文件夹 ...
1 修饰属性或变量 无论属性是基本类型、引用类型,都使变量里存放的“值”不可变。 常和static关键字协作,作为常量: 基本类型,变量放的是实实在在的值,如1,“abc” 引用类型,变量放的是个地址,所以final修饰引用类型变量指里面的地址不能变,即它只能指向初始时指向的那个对象,不关心指向的对 ...
MindIE是昇腾自研推理框架,本实验手册可指导小白用户快速掌握MindIE在LLM(large language model)场景的基本功能,包括:大模型推理功能测试、大模型性能测试、大模型精度测试、服务化推理部署、benchmark测试等。 1 实验准备 1.1 软硬件环境 本实验使用的设备是8 ...
武汉人工智能研究院(以下简称「武智院」,https://taichu-web.ia.ac.cn)是由武汉东湖新技术开发区重点建设的新型研发机构,聚焦跨模态智能国际前沿研究方向,作为中国科学院自动化研究所的核心创新平台,致力于推动人工智能技术的规模化应用与产业落地。 跨模态智能技术研发的挑战 跨模态智 ...
提出问题,使用Manus帮我生成一个官方网站 提问: 我有一个github项目,是https://github.com/dependon/simple-image-filter ,请根据这个项目的内容生成一个官方网站 得到的结果(当前为手动部署的网站) 他使用的技术栈是常规的nodejs, demo ...
本次演示部署环境:Windows 10专业版,转载请说明出处 下载安装Docker Docker官网:https://www.docker.com/ 自定义Docker安装路径 Docker默认安装在C盘,大小大概2.9G,做这行最忌讳的就是安装软件全装C盘,所以我调整了下安装路径。 新建安装目录: ...
0 要点总结 Meta发布 Llama 4 系列的首批模型,帮用户打造更个性化多模态体验 Llama 4 Scout 是有 170 亿激活参数、16 个专家模块的模型,同类中全球最强多模态模型,性能超越以往所有 Llama 系列模型,能在一张 NVIDIA H100 GPU 上运行。该模型支持业界领 ...
目录环境搭建与配置定义智能体加载模型提取关键词生成回答连接智能体定义图的状态定义节点方法根据指令路由生成回答文件处理提取关键词网络搜索定义图的结构运行图运行指南在控制台中测试程序使用 Streamlit 构建前端页面 随着大语言模型(LLM)技术的快速发展,人们期望利用 LLM 解决各种复杂问题,在 ...
AI Agent 无疑是今年最火爆的概念,从科技巨头的战略布局到创业公司的创新产品,AI 智能体正在重塑我们与机器交互的方式。无论是自动化任务、个性化服务,还是复杂问题的协同解决,AI Agent 都展现出了前所未有的潜力。 而在众多备受瞩目的框架中,微软 Autogen 凭借其灵活的多智能体协作能 ...
一、背景 许多小伙伴在安装 Dify 或是 RagFlow 这些工具的时候,往往会遇到一个难题,那就是 Docker 的安装。 首先,我们的PC安装的绝大部分是 Windows,但众所周知的原因,Windows 对 Docker 的支持并不是特别好,这方面的历史原因有很多,实际上 Docker 是 ...
“AI时代最大的红利,是让每个人都有机会成为那个"想到就能做到"的创造者。” AI粉嫩特攻队,2025年4月5日。 故事源于一个我想看的国外视频。本想点开视频准备大饱眼福,结果发现全程英文演讲加英文字幕...而我那三脚猫的英语听力跟不上视频的节奏。 放弃还是继续,这是一个问题。好在痛点一般会让我热情 ...
从零开始解析Transformer,目标是:(1) 解析Transformer如何运作,以及为何如此运作,让新同学可以入门;(2) 力争融入一些比较新的或者有特色的论文或者理念,让老鸟也可以有所收获。 ...
背景ChatGLM-沉思版是由智谱AI于2025年4月推出的新一代智能体,其核心背景可从技术原理、应用场景、发展历程及未来趋势四方面展开:技术原理:融合深度思考与操作执行的革新架构模型基础: 基于GLM(General Language Model)的Transformer架构,采用自回归生成模式, ...
引言:本质上是统一为openai协议 参考文章: OneAPI-接口管理和分发神器:所有大模型一键封装成OpenAI协议 - AI码上来的文章 - 知乎 https://zhuanlan.zhihu.com/p/707769192 目前有两种选择,一是开源可商用的OneAPI,另一种则是国内的接口聚 ...