AI
刷新
【译】DeepSeek的模型分析

博主头像 原作:阿尔贝托·罗梅罗 与 o1 相比,R1 的表现如何? DeepSeek 在六个相关基准(如 GPQA Diamond 和 SWE-bench Verified)以及其他替代测试(如 Codeforces 和 AIME)上对 R1 和 o1 进行了一对一比较。列表中遗漏了 ARC-AGI 和 F ...

从Cline到Roo Code:AI编程插件的进化之路

博主头像 一、Cline:AI编程的通用解决方案 (项目地址:https://github.com/cline/cline) Cline作为一款开源的VS Code AI编程插件,通过集成前沿的机器学习模型,为开发者提供了智能化的编码体验。其核心功能包括: 智能代码补全 基于上下文感知的代码预测功能,支持主流 ...

Dify × AWS:0代码搭建「AI翻译中台」

博主头像 0 前言 基于Dify现有能力,已能对不少业务场景提供帮助,但对一些特定诉求,还要借助其扩展机制,本文利用翻译场景举例详细说明。 1 翻译场景复杂性分析 翻译是从简单到复杂各级都存在的场景,比较简单的翻译可能一句简单 Prompt,但对复杂、效果要求较高翻译场景,可能需要一些复杂 LLM 编排,如吴 ...

LangChain基础篇 (01)

博主头像 LangChain 是什么 Langchain 是一个开源框架,它允许开发人员将大型语言模型与外部的计算和数据源结合起来,是一个通过组合模块和能力抽象来扩展 LLM 的助手 为什么需要 LangChain 增强语言模型的功能: LangChain 提供了可以将语言模型与各种数据源(如数据库、WebA ...

本地部署DeepSeek

博主头像 没想到新年最热闹的地方之一会是互联网,刷爆朋友圈的除了新年祝福还有DeepSeek。揣着一颗好奇心试了试,竟有一种发现新大路的感觉。估计是围观的人太多,在线的版本有时候会出现连不上的情况,好奇心驱使之下想尝试本地部署。 方案 本地化方案非常简单:Ollama + DeepSeek-R1 + Ench ...

自定义Ollama安装路径

本地电脑部署DeepSeek教程:https://www.cnblogs.com/LaiYun/p/18695293 由于Ollama的exe安装软件双击安装的时候默认是在C盘,以及后续的模型数据下载也在C盘,导致会占用C盘空间,所以这里单独写了一个自定义安装Ollama安装目录的教程。 Ollam ...

人生不止于职业发展

博主头像 0 你的问题,我知道! 工作意义是啥?职业发展在人生啥角色? 1 工作意义 农村人努力学习考上大学,得好工作,为逃离同村同龄人十几岁就工厂打工命运,过不凡人生,实现改命的唯一途径。毕业就进入自带光环的大厂,有份让所有亲戚羡慕的公司和薪水。我认为工作价值是让自己自立,改变命运。 但现实挑战才开始。 工 ...

研发的护城河到底是什么?

博主头像 0 你的问题,我知道! 和大厂朋友聊天,他感叹原来努力干活,做靠谱研发,积累职场经验,干下来,职业发展一般问题不大。而如今大厂“年轻化”,靠谱再不能为自己续航,企业似乎也不愿意持续为经验买单。 在这不确定时代,职业发展中有无硬通货? 更长远职业发展角度: 要抓住机会 要抵御风险,构建自己的职业发展护 ...

突破限制,本地部署deepseek模型,手把手教你打造专属猫娘形象。

博主头像 简述 前段时间推出的DeepSeek R1推理模型,与传统的大型语言模型有些不同,它能模拟逐步思考的过程,将复杂问题分解为更小的逻辑步骤,再得出解决方案,在数学推理、编程辅助和决策制定等需要深度理解的任务上表现更出色。这里也提供了两种方法来本地运行官方开源的模型。 文章文件 喜欢的朋友可以关注一下公 ...

近期最值得关注的AI技术报告与Agent综述!

博主头像 写在前面 如题,近期优秀的大模型层出不穷。作为技术人,需要阅读高质量的AI技术报告或论文,并且掌握未来应用趋势。本文将推荐一些高质量的AI技术报告,以及Agent智能体综述。 大模型技术报告 DeepSeek-V3 Technical Report 作者:DeepSeek 时间:2024.12.27 ...

突破自我,研发必须掌握的软技能!

博主头像 0 你的问题,我知道! 光有硬技能远不够,很多研发硬技能不错,但发展有明显天花板。 影响研发职业发展走多远的核心能力有啥?技术只是打底和起步,长期职业发展看综合能力,各种软技能组合。研发常忽视或理解片面的能力: 1 沟通表达 1.1 啥是沟通表达? 不是口头“能说”,而是能把事简洁、结构化、逻辑清晰 ...

记录在本地电脑部署自己的DeepSeek 大模型AI

大家新年好呀,年初二给各位拜年啦,祝各位新年身体健康,工作顺利,万事如意,开心快乐每一天! 前言: 这几天看到很多DeepSeek的热点新闻(火的不行呀),去了解下这个AI,然后自己试了下本地部署,发现挺简单的,所以记录一下,这里示例的是最简单的方式,没有使用到Docker容器,也不需要魔法上网,计 ...

研发的立足之本到底是啥?

博主头像 0 你的问题,我知道! 本文深入T型图“竖线”的立足之本:专业技术 + 技术赋能业务能力。研发在学习投入精力最多,也误区最多。 某粉丝感发展遇到瓶颈,项目都会做,但觉无提升,想跳槽。于是,梳理过往经历。 他觉得业务小,阻其技术发展。但细问,这系统用户量百万级,一点不小,只是淡季、旺季明显。旺季时常卡 ...

DeepSeek简介

博主头像 一、DeepSeek是什么? DeepSeek是由中国顶尖AI团队深度求索(DeepSeek Inc.)自主研发的通用大语言模型体系,其研发始于2023年,致力于突破认知智能的边界。作为国内首个全面对标GPT-4技术架构的AI大模型,DeepSeek系列涵盖从7B到超千亿参数的完整模型矩阵,在数学推 ...

openai-1.60.2调用deepseek-reasoner并获取思考内容的方法

博主头像 本文写作时间:2025-01-29 过年假期,deepseek爆发式地火了。在尝试了网页端的“深度思考”模式后,我尝试在api端调用“深度思考”模型,然而,官方给出的代码并不行。多次尝试后,我获得了成功,希望对读者有所帮助。 环境 openai-1.60.2 deepseek官方代码 路径:http ...

Cursor使用谷歌Gemini API

博主头像 Cursor本身是收费产品,在Cursor试用期过后,调用Cursor模型速率会下降,需要排队等待,现在谷歌Gemini API是暂时不收费的,上下文也足够长,本文配置Cursor使用Gemini API并进行编程体验。 配置使用Gemini API 在Cursor的设置,模型,找到Google A ...

DeepSeek R1 解题推理实践PMP试题

博主头像 题目截图推理解析解题原理强化学习为核心: DeepSeek R1颠覆了传统路线,采用了大规模的强化学习(RL)来激发推理能力。这种学习模式使模型能够在没有或仅有少量监督微调的情况下,通过奖励信号来探索并形成自己的思维链。 DeepSeek R1-Zero更是完全依赖强化学习来习得复杂推理技能,从未进 ...

<1···313233···50>