DeepSeek V3 两周使用总结

2024 年 12 月 26 日,杭州深度求索人工智能基础技术研究有限公司发布 DeepSeek-V3 大模型。官方宣称:(1)基于自研的 MoE 模型和 671B 参数,在 14.8T token 上进行了预训练;(2)多项评测成绩超越了 Qwen2.5 - 72B 和 Llama - 3.1 - ...

回顾我的软件开发经历(1)

二十多年前,刚从大学毕业,对软件开发认识非常有限,掌握的技能也不多。 第一份工作 第一份工作是搭建一个BBS论坛,模仿当时流行的三夫户外论坛。 那时,对知识如饥似渴。由于买不起书,我常常去书店找到相关的ASP书籍,用钢笔将代码抄写在笔记本上,第二天再输入到电脑中。结合手头的书籍,认真学习ASP,虽然 ...