本文精选了2024年RAG领域代表性的72篇重要论文和系统,按月梳理并配以注解、来源和摘要,旨在帮助读者快速把握RAG技术发展全貌。 ...
环境搭建 系统环境 需要Nvidia显卡,至少8G显存,且专用显存与共享显存之和大于20G 建议将非安装版的环境文件都放到非系统盘,方便重装或移植 以Windows11为例,非安装环境文件都放在 E 盘下 设置自定义Path文件夹 创建 E:\mypath 文件夹,将其添加进用户环境变量Path中, ...
之前,我们已经完成了工作流的基本流程和整体框架设计,接下来的任务就是进入实际操作和实现阶段。如果有同学对工作流的整体结构还不够熟悉,可以先参考一下这篇文章,帮助你更好地理解和掌握工作流的各个部分: 本篇文章是我关于Spring AI搭建Agent系列的第三篇实战教程,虽然Spring AI目前仍处于 ...
大家好,我是开源多维表格项目 Teable 的创始人陈加贝。 作为飞书多维表格的最早期负责人,我参与并见证了这个产品从 0 到 1 的全过程。这段经历也让我深入理解了企业在数据协作方面的真实需求。 以 Airtable 和 Notion 为代表的电子表格数据库,展现了一个令人兴奋的方向:让不懂代码的 ...
目录Python 环境配置转换量化编译参考 在上一篇博客中,探讨了如何使用 Python 和 hailo_model_zoo 中预编译的模型来实现目标检测。本篇博客将深入介绍如何将用户自定义训练的模型转换并优化为能够在 Hailo NPU 上高效运行的 .hef 模型。 Python 环境配置 为了 ...
"你知道吗,我现在写代码的速度提高了至少 50%!" 上周团队分享会上,我的同事小王兴奋地说道。作为一名有着 3 年经验的前端开发者,他最近开始尝试使用 AI 辅助编程,效果出乎意料的好。这让我也产生了浓厚的兴趣 - 到底该如何把 AI 工具融入到日常开发中呢? 经过一个月的实践和摸索,我总结出了一 ...
目录Python 环境配置实现 USB 摄像头的目标检测参考 在上一篇博客中,探讨了使用 rpicam-apps 通过 JSON 文件配置并运行目标检测示例程序。虽然这种方法可以实现有效的检测,但它限制了开发者直接在代码中利用检测结果的能力。因此,在本篇博客中,将深入探讨如何借助 HailoRT P ...
最近学习了一下whisper的微调,主要是参考了github上的夜雨飘零大神项目。但是在操作中遇到了微调中文的时候出现了乱码的情况。以下是我这边对于微调过程中中文出现乱码情况的解决方案。 出现情况如下图所示: 系统环境 NAME="CentOS Linux" VERSION="7 (Core)" I ...
你是一位开发者,你需要调用各类 AI 模型,每次调用模型,都要在不同的平台间反复横跳,你大概会遇到以下问题: 获取 API Key 流程繁琐:需访问多个厂商的官网,查阅各自的使用文档,并按照规定的步骤进行注册和申请。 多平台支付:在调用来自不同厂商的模型时,需要在这些厂商的计费平台上进行支付。 缺乏 ...
Datawhale2025冬令营 Datawhale 2025 AI冬令营链接:https://www.datawhale.cn/activity/110/21/76?rankingPage=1 赠送大家一个表情出处: Emoji cheat sheet for GitHub, Basecamp ...
前言 提到注意力机制,你一定会想起Transformer的经典架构图: (图源:https://www.datacamp.com/tutorial/how-transformers-work,这篇文章讲得不错) 初看起来可能一头雾水:向量映射是啥?编码器和解码器是干啥的?前馈机制是啥?为啥要归一化? ...
众所周知,LLM的函数function-calling能力很强悍,解决了大模型与实际业务系统的交互问题。其本质就是函数调用。 从openai官网摘图: 简而言之: LLM起到决策的作用,告知业务系统应该调用什么函数,以及入参是什么。 业务系统负责实现对应的函数(比如本地实现,或者调用其他系统提供的服 ...
在前面的讨论中,我们通过AI助手快速浏览并分析了LlamaIndex的核心源码及其可视化部分。在上次的工作中,我们已基本完成了使用Java版本实现的可视化部分,尽管在工作流(workflow)的分析上只是进行了初步探讨。今天,我们将深入探讨一个关键问题:能否将LlamaIndex在Python中的业 ...
我们使用scikit-learn进行机器学习的模型训练时,用到的数据和算法参数会根据具体的情况相应调整变化, 但是,整个模型训练的流程其实大同小异,一般都是加载数据,数据预处理,特征选择,模型训练等几个环节。 如果训练的结果不尽如人意,从数据预处理开始,再次重新训练。 今天介绍的Pipeline(中 ...
接续上次的讨论,我们上次主要分析了LlamaIndex工作流的核心流程,当前还剩下一行代码需要关注,那就是关于工作流的可视化。今天我们的目标是深入理解这一可视化部分的主要流程,并且对其大体的实现方式进行简要的了解和探讨。 为了帮助大家更好地掌握这一内容,我们先回顾一下上次讨论的代码内容,具体如下: ...
LangEngine作为阿里集团内部发起的纯Java版本的AI应用开发框架,现正式对外开源。开源链接:https://github.com/AIDC-AI/ali-langengine。我们将介绍在构建高可用网关过程中,LangEngine应用框架的一些架构设计理念和经验总结。 ...
场景我们之前已经基于之前大模型同一会话进行过需求评审,在研发设计完成数据模型后,导出数据库设计DDL文件,上传到AI平台进行下一步评审。实践groupbuy.txt文件是我们数据库设计SQL脚本文件提示词1您是软件工程专家,我刚刚上传 数据库设计DDL 文件 {groupbuy.txt},请结合以上 ...
Bolt.new 用一句话快速构建全栈应用:本地部署与应用实战(Ollama/Qwen2.5 等)" description = "本文详细介绍如何本地 Ollama 和国内大模型资源,在本地环境中快速部署和使用 Bolt.new,结合 Ollama 和 Qwen2.5-Coder,轻松实现从代码编... ...
目的 检验数据一致性 示例 机器学习中涉及新数据集发布的论文通常会描述数据集的构建过程,一份数据集往往由多位标注员共同完成,不同标注员对数据的理解很容易存在偏差,这极大程度上会影响数据集的一致性,从而限制算法的性能。因此在构建数据集的标注过程中,大多数构建数据集的工作都会对标注员之间的标注一致性进行 ...
作者:熊猫Jay,上市公司技术负责人,破局AI 提示词、AI编程教练、通往AGI之路内容共创者 最近发现身边越来越多人尝试用 Cursor 写代码、开发小产品了。 如果想要实现商业化或引流,我们的小工具和小产品必须发布到互联网上,这样才能被更多人看到并使用。 可一到要部署上线,很多非技术的朋友们都抓 ...