AI
刷新
决策树剪枝:平衡模型复杂性与泛化能力

博主头像 在机器学习的世界里,决策树是一种简单而强大的算法,但它的 “任性生长” 却常常让数据科学家陷入 “过拟合的困境”。 想象一下,一棵决策树如果无限生长,它可能会完美地拟合训练集中的每一个数据点,但当面对新的数据时,却可能表现得像一个“陌生人”——预测完全失效。 这种现象背后的原因在于模型过于复杂,对训 ...

一个简洁易用的 DeepSeek 第三方开源客户端!

博主头像 大家好,我是 Java陈序员。 之前介绍一款开箱即用、支持多个大语言模型服务的桌面客户端。 开箱即用!一款支持多个大语言模型服务的桌面客户端! 今天,给大家安利一个简洁易用的 DeepSeek 第三方开源客户端! 关注微信公众号:【Java陈序员】,获取开源项目分享、AI副业分享、超200本经典计算 ...

让 LLM 来评判 | 技巧与提示

博主头像 这是 让 LLM 来评判 系列文章的第六篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 LLM 评估模型已知偏差及缓解措施: 缺乏内部一致性:同一 prompt 输入评估模型执行多次得到的结果可能不一样 (如果 ...

决策树:机器学习中的“智慧树”

博主头像 在机器学习的广阔森林中,决策树(Decision Tree)是一棵独特而强大的“智慧树”。 它是一种监督学习算法,既可以用于分类任务,也能用于回归任务,通过树形结构模拟人类决策过程。 这篇文章会带你了解决策树,从基础概念开始,一步步讲解如何构建决策树、常用的算法以及它的实际应用。 1. 概述 决策树 ...

【深度学习】从VAE到GAN漫谈

博主头像 正文 从AE说起 AE是一个特征提取模型,通过编解码的形式重构输入,完成低维特征表示工作 推导 存在一个输入\(x\),构造AE编码器\(p_\theta(x)\),得到离散低维特征\(z\); 通过AE解码器\(q_\phi(z)\),重构回\(\hat{x}\); 通过正则项\(\Vert x- ...

解密prompt系列52. 闲聊大模型还有什么值得探索的领域

博主头像 在DeepSeek-R1的开源狂欢之后,感觉不少朋友都陷入了**技术舒适区**,但其实当前的大模型技术只是跨进了应用阶段,可以探索的领域还有不少,所以这一章咱不聊论文了,偶尔不脚踏实地,单纯仰望天空,聊聊还有什么有趣值得探索的领域,哈哈有可能单纯是最近科幻小说看太多的产物~ ...

Semantic Kernel调用DeepSeek实现聊天功能

博主头像 在上一篇中,我们介绍了如何通过SK访问ollama中部署的大模型,今天我们尝试直接调用deepseek官网api,来实现AI对话功能。 DeepSeek官方API 如果要使用deepseek 官方API,首先我们要注册API访问的账号,然后创建apikey。 DeepSeek Platform地址: ...

深度学习--个人总结

博主头像 学习与反思 主要是记录自己遇到的问题以及踩的坑 同时欢迎各位大佬,给我提出意见,我一定会好好吸取。_ 准确率只有0.1左右?(or 很低) 有可能是因为权重没有初始化(不一定是必要的) 或者学习率设置的问题,可能设置的太大了,试着调小一些 如何区分验证集和测试集? 训练集 (训练阶段) 用于构建我们 ...

semantic kernel调用ollama接口

博主头像 不积跬步无以至千里,不积小流无以成江海!--《荀子 劝学》 我是对本地大模型有执念的!因为它安全性好,数据完全被自己掌控。在前面的内容里面分享了如何使用OllamaSharp访问ollama接口,今天分享如何使用Semantic Kernel来访问ollama接口。 关于Semantic Kerne ...

深入理解 Java Final:从基础到线程安全与性能优化

博主头像 1 修饰属性或变量 无论属性是基本类型、引用类型,都使变量里存放的“值”不可变。 常和static关键字协作,作为常量: 基本类型,变量放的是实实在在的值,如1,“abc” 引用类型,变量放的是个地址,所以final修饰引用类型变量指里面的地址不能变,即它只能指向初始时指向的那个对象,不关心指向的对 ...

从DeepSeek看算法备案&大模型备案

博主头像 一、deepseek的备案情况 (一)算法备案情况 在算法备案系统网站上,北京深度求索人工智能基础技术研究有限公司和杭州深度求索人工智能基础技术研究有限公司分别进行了两个算法备案。从公司名称来看,正如创始人梁文锋所说,这两家公司专注于人工智能前沿技术的基础研究。 具体信息如下: 北京公司备案的“De ...

大模型安全防护体系研究

博主头像 摘要# 随着人工智能技术的快速发展,大模型在各行各业被广泛应用的同时也带来了诸多安全挑战。首先,从内容安全、模型版权、模型推理和数据隐私4个方面分析了大模型当前存在的安全问题;其次,从数据安全与隐私保护、模型安全流转与部署、内容安全合规和业务运营合规4个方面分析了大模型的安全防护需求;最后,设计了一 ...

MindIE LLM场景快速上手实验

MindIE是昇腾自研推理框架,本实验手册可指导小白用户快速掌握MindIE在LLM(large language model)场景的基本功能,包括:大模型推理功能测试、大模型性能测试、大模型精度测试、服务化推理部署、benchmark测试等。 1 实验准备 1.1 软硬件环境 本实验使用的设备是8 ...

武汉人工智能研究院 x Gitee:跨模态智能研发的革新之路

博主头像 武汉人工智能研究院(以下简称「武智院」,https://taichu-web.ia.ac.cn)是由武汉东湖新技术开发区重点建设的新型研发机构,聚焦跨模态智能国际前沿研究方向,作为中国科学院自动化研究所的核心创新平台,致力于推动人工智能技术的规模化应用与产业落地。 跨模态智能技术研发的挑战 跨模态智 ...

<1···789···50>