DeepSeek的AI大模型实测：超低成本下的意外惊喜与挑战

2024-12-31 16:32:01 3121 大屏时代

在AI领域，训练一个大模型的成本一直是行业中的一项重大挑战。OpenAI CEO山姆·奥特曼曾透露，GPT-4的训练成本高达1亿美元，而更高端的GPT-5预计需要超过10亿美元的投入。然而，在这片激烈竞争的市场中，DeepSeek（深度求索）脱颖而出，凭借其超低的训练成本和出色的性能，成为了AI行业的新星，被誉为“AI行业的拼多多”。

640 (1).jpg

根据DeepSeek官方的数据显示，其最新推出的DeepSeek-V3大模型训练成本仅为557.6万美元（约合人民币4070万元），是GPT-4训练成本的20分之一。令人震惊的是，DeepSeek-V3大模型的参数达到6710亿，其中激活参数为370亿，且提供的服务价格也是业内最低之一。输入的缓存命中价格为0.1元/百万tokens，输出价格为2元/百万tokens，远低于其他大模型的价格区间。这样的低成本和低价格，不禁让人疑惑：DeepSeek的技术到底有多强，是否能打破目前大模型的市场格局？

为了评估DeepSeek-V3的实际能力，我们进行了多轮严苛的实测。测试内容涵盖常规问答、内容总结、数学题解答、以及金融问题答疑等多个领域，并与国内外主流大语言模型如豆包、Kimi等进行了对比。以下是我们对DeepSeek-V3的详细实测报告。

一、常规问答：简洁明了，准确高效

在常规问答环节，我们测试了DeepSeek-V3对科技新闻的收集和整理能力。DeepSeek能够迅速从不同来源筛选出相关资讯，并呈现简洁的摘要，分割线清晰且易于阅读。同时，DeepSeek还为每条新闻提供了直接链接，方便用户进一步查看原文。此外，DeepSeek的语言识别能力在联网与非联网状态下表现出色，能够根据问题内容自动选择合适的语言进行回复。例如，询问西方古典音乐时，DeepSeek会使用英文，而涉及中国音乐时，则转为中文。

与之相比，豆包的新闻总结文字过多，内容冗长，而Kimi则显得过于精简，未能提供足够的背景信息。DeepSeek凭借其准确简洁的方式，在常规问答方面表现不逊色于国内一线AI大模型。

二、内容总结：简洁但缺乏重点

在内容总结测试中，我们让DeepSeek对小红书发布的《潮流数码白皮书》进行总结。与大多数AI大模型类似，DeepSeek的总结虽然简洁明了，但存在丢失重点的问题，特别是在一些具体事例的归纳上表现不佳。这一问题在所有大模型中都普遍存在，DeepSeek的表现与Kimi、文心一言较为接近，略逊色于豆包。

尽管如此，DeepSeek的总结依然具备较强的归纳能力和结构化思维，能够有效提炼出文章的核心观点。

三、数学题解答：快速准确，解题过程透明

在数学题解答方面，DeepSeek-V3展现了超强的逻辑推理能力。我们提出了一些经典的数学问题，包括简单的算术题和经典的“三门问题”，DeepSeek均能迅速给出正确答案并清晰地展示解题过程。特别是在解决复杂的数学题时，DeepSeek不仅能够给出正确答案，还会提供详细的思考步骤，帮助用户理解其解题思路。

在一项较为复杂的集合题中，DeepSeek成功解决了一个此前仅有部分高级模型能解答的问题，而豆包和文心3.5等模型则未能给出正确答案。DeepSeek在数学推理方面的表现无疑超出了大部分人的预期。

四、金融问题答疑：精准理解与实用建议

在金融问题答疑测试中，DeepSeek展示了其在专业领域的深度理解。对于涉及利率与债券价格关系的问题，DeepSeek不仅给出了准确的答案，还提出了应对市场波动的投资策略，如分散投资、缩短债券久期等实用建议。尽管DeepSeek的表现与其他大型语言模型如豆包、Kimi等相差不大，但它在细节上的精准理解和建议，表明其在金融领域具有相当的竞争力。

经过多轮测试，我们对DeepSeek-V3有了更为全面的了解。尽管它在内容总结等方面存在不足，但在常规问答、数学推理和金融答疑等方面表现优秀，尤其是在解题速度和准确性上，远超同类大模型。DeepSeek的技术不仅体现在其高效的推理能力，还在于其通过低成本训练模型的方式，为行业带来了一种新的可能性。

然而，DeepSeek的最大短板在于功能的单一性。与豆包、文心一言、ChatGPT等多功能大模型相比，DeepSeek的应用场景较为局限，目前仅支持文字生成和逻辑推理，缺乏对图像生成、PPT制作等多模态内容的支持。对于追求全面功能的用户来说，DeepSeek仍然无法满足所有需求。

尽管如此，DeepSeek的低成本优势依然值得行业关注。它通过创新的MoE架构、FP8混合精度训练框架等技术，成功地将训练成本压至最低，并在文字生成与逻辑推理上达到了主流AI大模型的水平。DeepSeek的成功为AI行业的开源与成本控制提供了新的思路，未来可能会成为AI公司如何在激烈的竞争中生存与发展的重要范例。

总体而言，DeepSeek-V3是一款值得关注的AI大模型，特别适合那些需要高效文字生成和推理能力的用户。在未来，随着技术的不断进步和功能的不断扩展，DeepSeek有可能成为AI领域的新兴力量，挑战现有巨头的市场地位。

相关文章

Temu上线“预售”功能：让库存管理更聪明，卖家更灵活

海通证券看好AI带动教育与人力资源服务行业革新，投资机遇浮现

孩子用AI“赶作业”：神助攻还是教育杀手？

AI经济学：揭秘智能时代如何颠覆财富与产业格局

【AI 热点】四大超实用心得生成器推荐，轻松提升内容创作效率！

清北应届生撑起DeepSeek天：年轻团队背后的中国版OpenAI

上一篇： 2025年AI数据基础设施将如何颠覆世界？

下一篇： 2025年，如何做大LED显示屏市场产值？

本文地址：https://www.dapingtime.com/article/481.html