AI
刷新
大模型的监督微调

博主头像 1.Chat Template '1. 指令微调在预训练(LoRA微调)之后' # 预训练使大模型成为“领域专家” # 指令微调令大模型学会表达 每一个大模型的指令微调都不一样; 所以一定要根据官方发布的格式做指令微调 '2. Chat_Template的源代码' # Chat_Template.p ...

大模型预训练

博主头像 1.分组 '1. 两种训练方法' 从零开始预训练:BV1xhYtewEum 4分30秒 二次特定预训练:BV1xhYtewEum 2.创建LLM '1. 创建模型核心流程' (1)加载模型->(2)将模型放入显卡->(3)输入文本并分词-> (4)将分词放入显卡->(5)设置label->(6)模型 ...

Linux系统Dify本地化部署

博主头像 Dify是一个非常火的AI智能体开发平台,且支持windows、linux、mac系统的本地私有化部署。成为越来越多企业开发AI智能体的首选。前面我写过一篇《windows系统上Dify本地化部署》,那么本篇文章就详细讲解如何在linux系统上实现Dify本地化部署。 一、 安装Docker lin ...

快速使用开发者空间AI Agent打造你的私人营养师

博主头像 本文分享自华为云社区《快速使用华为开发者空间AI Agent打造你的私人营养师》,作者:社区云活动助手 本篇讲带你快速使用Agent部署,教你把“今天吃什么”现成MCP模板一键装进Agent,5分钟完成安装-配置-发布三连,现场就能在浏览器里跟AI营养师聊菜单。 华为开发者空间的Agent到底是什么 ...

Trae国际版Grok4大模型初试

博主头像 背景 Grok 4是xAI公司自2023年推出首代大模型以来的第四次重要迭代,被官方宣称是“最新、最强大的旗舰模型”,马斯克更是称其为“世界上最智能AI”。该模型在GBQA(博士级问题集)、AMC 25(美国数学邀请赛)、Live Coding Benchmark(编程能力测试)、HMMT(哈佛-M ...

Claude Code下Kimi-k2模型初试

博主头像 背景 Kimi-k2模型官方介绍,于2025年7月11日发布的 MoE架构 基础模型,总参数达1万亿(激活参数320亿),主要强化代码生成与通用Agent任务处理能力。 ‌ ‌代码能力‌:在 SWE Bench Verified 、 Tau2 等测试中表现优于 DeepSeek V3 、 Qwen3 ...

清华大学软件学院院长王建民教授:AI 时代,如何从采数到用数?

博主头像 7 月 5 日,2025 时序数据库技术创新大会在北京成功举办,收获强烈反响。本次大会以「下一站:DB + AI」为主题,汇集了超 30 位大咖嘉宾,学术界权威专家、企业代表、开发者围绕时序数据库 Apache IoTDB 的自研技术成果与应用落地实例,探讨工业物联网领域如何借助 AI 技术与数据库 ...

HF Papers 直播| AI for Science 专场

博主头像 AIGC热点大赛# 由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等 联合发起的【AI Insight Talk】系列直播活动第三场即将开始! AI 科学家时代正加速到来,但科研智能体真的做好准备了吗?真实科研场景中,多模态智能体能否在推理、规划 ...

免费无限使用!我开发了一个证件照生成网站!

博主头像 前言 大家好,我是 Java陈序员。 之前给大家介绍了一款开源项目 —— AI 证件照制作工具。 一键生成!轻量级 AI 证件照制作工具! HivisionIDPhotos 利用一套完善的 AI 模型工作流程,针对多种用户拍照场景的识别,进行背景抠图与证件照生成。 借助 HivisionIDPhot ...

亚马逊Kiro编程小试第一轮

博主头像 亚马逊Kiro编程小试第一轮背景 亚马逊Kiro是2025年7月推出的AI编程工具,其核心定位是通过“规范驱动开发”革新软件工程流程,实现从需求定义到代码部署的全流程智能化协作。Kiro可以免费使用Claude4版本Version: 0.1.0 (user setup) VSCode Version ...

5分钟带你搞懂从0打造一个ChatGPT

博主头像 前言 欧阳上一次写文章还是4个月前,之所以断更有两个原因:换工作和业余时间ALL IN AI了。不管你是否承认,AI时代已经来了,依然埋头研究前端的那一亩三分地和源码在未来可能就是蒸汽时代被淘汰的纺织女工。 今年大家多多少少都有接触到AI相关的项目了,从前端的角度来看以前是调用后端的接口,现在改成了 ...

一些Cursor实践经验

博主头像 一些Cursor实践经验来自社区供参考,同理Trae等IDE也是适用的。其他Tips 还有一款面向 Cursor 用户的轻量级桌面工具:Prompt Picker 基于 Tauri v2 + React 打造,启动飞快、内存占用极低,让你随时「一键输入」自己最常用的 Prompt。 核心功能:悬浮置 ...

预测概率的先验校准

博主头像 为什么需要校准?在很多场景中,我们不仅关心模型输出的预测类别,还关心模型输出的预测概率,然而模型输出的预测概率未必等于真实的概率。概率校准就是重新计算预测概率,以让它尽量接近真实的概率。 ...

AI编程之CodeBuddy的小试

博主头像 背景 腾讯云 CodeBuddy 是由腾讯云开发的一款 AI 驱动的智能编程助手,基于 腾讯混元大模型 与 DeepSeek 混合模型 构建,专为开发者设计,旨在提升编码效率、优化代码质量。笔者其他相关文章《AI工具CodeBuddy解读开源项目源代码与框架》,《CodeBuddy的RAG知识库尝试 ...

<1···567···50>