12人参与 • 2025-02-12 • 工具软件
2025年春节过的好快,转眼间,大家又回到了各自工作岗位了,要说这个春节,什么最火,肯定绕不开deepseek。
几乎一夜之间,所有人都在关注deepseek,甚至我在老家,完全没用过ai的七大姑八大姨,都在问我,deepseek是什么,怎么用。
今天就来聊一聊deepseek,话不多说,开始。
简单来说,deepseek
它是一款ai大模型,类似于chatgpt
、豆包
、kimi
这样的ai工具。网页版、app端都能使用,但真正让它火爆出圈的,是它的“深度思考”模式(r1)。
它不仅能给出答案,而且还能像学霸解题一样,有推导、分析、检查过程。相比普通ai模型只是机械地复述信息,它更像一个真正会思考的智能助手。
deepseek(深度求索),是一家在2023年7月17日成立的公司深度求索所开发的大模型名称。公司坐落于杭州,是幻方量化旗下的子公司,全称是杭州深度求索人工智能基础技术研究有限公司。
deepseek
开发团队是由一群年轻且富有才华的高校毕业生组成,团队创始人梁文锋,是量化投资领域的资深专家,拥有丰富的量化投资经验和ai技术背景。其它主要成员大多数来自清华大学、北京大学和浙江大学等国内顶尖高校。
deepseek火爆出圈的最大原因是,它以极低的成本,做出了能比肩海外巨头的ai大模型。
deepseek 成立时间虽才一年多,但已经在中美app store登上免费应用榜首,且应用成果和行业影响显著:
deepseek-r1
不仅成本低,更是在技术上有了大幅提升。这款新模型延续了其高性价比的优势,仅用十分之一的成本就达到了gpt-o1级别的表现,api定价仅是国内外其他头部ai厂商几十分之一。deepseek r1出现如同一匹黑马,以惊人的姿态闯入ai圈。它不仅让英伟达市值一夜蒸发超1万亿美金,更是让各路ai大佬瞬间破防。而且,更重要的是,deepseek还是一个开源模型。你没看错,deepseek-v3
、deepseek-r1
模型全部开源,这种开源策略不仅促进了技术生态的发展,还会降低了企业的使用成本,促进ai大模型的普及率。与此同时,开源还意味着:
在硅谷,类似deepseek
这样的ai创新并不少有,只是这次是一家中国公司做出了这个动作,相比传统的"美国创新、中国应用" 的模式显得格外的让人兴奋。
简单小结一下,openai的gpt-4o模型虽强大,但光训练成本可能就已经达到上亿美元。而deepseek仅用了几百万美金,做出了性能接近的模型。再加上它对中文理解极佳,回答更自然,不像其他ai过于“模板化”,这也是它受欢迎的原因之一。
我也让deepseek
列个gpt-4o
和o1
的对比表格,大家应该也能一目了然。
而r1,可以直接类比o1,两者在跑分上,几乎相同。
所以,很多业内人士甚至喊出了“deepseek接班openai”的口号。
deepseek 相关模型已经开源,以下是不同模型的开源地址:
1、deepseek coder
,它是代码大模型,仓库地址为:
https://github.com/deepseek-ai/deepseek-coder
在这个仓库中,你可以找到模型的详细介绍、使用文档、代码示例,还能下载对应的模型权重来开展开发工作。
2、deepseek llm
, 它是通用大语言模型,仓库地址为:
https://github.com/deepseek-ai/deepseek-llm
这里有关于该模型的架构、训练方法等方面的介绍,同时也提供了模型使用的指引。
3、deepseek-r1
,仓库地址:
https://github.com/deepseek-ai/deepseek-r1
论文链接:https://github.com/deepseek-ai/deepseek-r1/blob/main/deepseek_r1.pdf
deepseek 具有多种强大功能,主要体现在以下几个方面:
1、高效信息处理与学习
2、专业领域辅助
3、创意与内容生产
4、日常效率工具
对于大多数人来说,最为常用的有几类ai使用场景:
当然,借助ai生产我们所需要的内容时,往往通过多个ai工具组合效果会更佳,比如用deepseek写文案,再用ai配图工具(如midjourney、即梦)制作配图。用deepseek自动写代码,再用chatgpt优化代码逻辑等。
这部分照顾一下新手,老司机可跳过。目前 deepseek 有 2 个地方可使用,一个是网页端,一个就是 app。
1、网页端没什么好说的,访问官网链接:https://chat.deepseek.com
或访问https://ai.com
直接就可以登录,可以使用手机号或者微信登录。
2、移动端,可以直接在各大应用商店搜索"deepseek"
,或者在网页端直接扫码下载:
操作基本也和网页端差不多,同样的简单纯粹。
温馨提示:请关闭你的一切代理,另外注册的话要用国内手机号,别问为什么,前人经验。
在上述对话框中不做操作用的就是默认的 deepseek-v3
模型,点击「深度思考」才会切换到 deepseek-r1
模型。
3、那 deepseek-v3
和deepseek-r1
这两使用起来啥区别呢?
v3 和平时大家使用的chatgpt
、豆包
、kimi
类似,能快速处理任务,属于指令型模型,而r1 则是一种推理模型,ai 自己会深度思考来解决复杂的任务。
这也是deepseek r1
最有价值以及能在众多ai模型中脱颖而出的原因之一,因为它不只是给出答案,而是能像学霸解题一样,有推导、分析、检查,有完整的思考过程。且这个思考过程是不带任何个人主观,非常客观的思考推理过程,这个思考过程能更好的引导我们向正确的方向去思考。
4、相信你也看到了旁边还有个「联网搜索」按钮,点了他,deepseek 就能帮你搜索互联网上资料,类似百度搜索这种。
因为 deepseek 默认情况下使用的是几个月前的训练数据,所以如果我们想要参考最新的消息,就得开启联网搜索,以便联网获取实时信息。
1、指令型ai
指令型ai模型是一种基于预设规则和指令的ai模型,它按照给定的指令执行特定的任务。特点是高度结构化、任务明确、依赖预设规则。并按照指令输出相应的结果。
代表 ai 工具:chatgpt
、文心一言
、通义千问
、豆包
、kimi
等。需要说明的是几乎目前像 gpt 等主流大模型都属于指令型大模型。
指令型ai在对话时,需要给出清晰、具体的指令,且提供结构化的数据或信息,便于模型处理。使用指令型ai工具时,无论是生成文本、图片还是视频,如果你想得到相对准确的答案,核心是你的指令提示词一定要准确。
指令型ai提问技巧,也可以说是ai的提问万能公式,通常需遵循四步:
指令型模型需要你事无巨细的交代流程,他才能明白怎么做,也就诞生了很多prompt 模板,甚至产生了很多的提示词工程师。
毫无夸张地说,ai 提示词在推理型模型没出前,是学习 ai 必须掌握的技能。
2、推理型ai
推理模型是一种基于数据分析和逻辑推理的ai模型,它能够从数据中提取知识,进行自主学习、推理和决策。它侧重于从已知信息中挖掘潜在的规律和关系。
代表ai工具:deepseek
。
使用 deepseek 这类推理模型的ai工具,非常简单,它抛弃之前繁琐的提问模板,直接描述清楚你的问题即可。
例如:
可以看到 deepseek 加了很多内心戏,画面感更强,也能体现很多思考推理的细节。
3、小结一下:
指令型大模型和推理型大模型,这就像两个员工:
一个是需要你事无巨细地安排工作任务、每个步骤都不能落下。(指令型ai)
一个很机灵,只要你说明要求、目的,他就能自己思考怎么做。(推理型ai)
很多人初次体验deepseek,发现它有时候答非所问,或者说话太高大上,不够接地气。其实,这只是你的用法不对。这就像看着一群人拿着东风导弹去炸鱼,还嫌水花不够大一样一样的。
1、deepseek提问技巧
当使用推理型模型deepseek r1
,你只需要直接提需求,但如果你在此基础上稍加优化,就更加完美了,让回答更加接近你的提问。
如果真的需要有一个万能prompt模板,送你一个万能的提问公式:背景+需求(你的目标)+约束条件(可选)
,背景信息给的越多越能让deepseek r1
理解你的需求帮助你更好的完成任务。
比如: 我是编程小白(交代背景),怎样快速的提高我的java编程能力(提出需求),不考虑英语水平(约束条件)
更加通俗一点,推理型ai提示词公式,可拆分为四个关键要素:
我想要做什么?
做这个干嘛用?
要做到什么效果(具体要求)?
但我担心什么?(具体顾虑,可选)
比如: 我要做一个小红书的创业笔记,要给想做副业的人用,希望能让他们快速的理解小红书应该如何赚钱,但我担心这些创业小白并不能理解商业的很多专业名词和概念。
总之,在使用deepseek
时,不需要你写"专业提示词",直接用自然语言清晰地表达出真实场景和具体需求就行了。
2、让 deepseek 说人话
在使用deepseek,还有一个好用的技巧,就是让它“说人话” 。如果ai的回答太过于专业,或者晦涩难懂,因为所有的ai回答,在你没有经过专业知识学习之前,它的回答通常都会有一些抽象和官方,有时候还是不方便普遍人理解,这个时候,你直接跟deepseek补充回复:“说人话
”,你会发现它的表达瞬间变得直白易懂。
例如,你向deepseek输入:"什么是tcp三次握手"
上述回答的答案,如果是非技术专业的人员,几乎看不懂,不过没关系,你只需要继续补充:“说人话”
是不是,它的回答瞬间变得通俗易懂了,基本上是个人都能看的懂了。
3、对标模仿"牛人"
在向deepseek
提问时,你还可以让deepseek
模仿名人风格,因为它对中文的掌握能力极强,能模仿名人的写作风格。如果你想写一篇特别有味道的文章,不妨让它模仿某位名人的笔触。
这也是我很喜欢用的一个小技巧,比如我们在写文章或者做视频的时候都喜欢找对标对吧。
比如你想模仿对标账号的文风,你完全可以这样提问:帮我模仿xxx的语气,帮我分析下2025年经济环境
。
相信最近使用 deepseek 都遇到过「服务器繁忙,请稍后再试」的提示(特别是晚上),使用的人太多加上遭到一堆人攻击导致的。
这个时候,你可以到:https://status.deepseek.com
这个地址查看 deepseek 的服务状态。
一般来说,当服务状态为红色时,表明服务压力大,就会较频繁出现异常提示了。
当然你也可以订阅异常状态,有异常就会发送到你的邮箱了。
上面只能查看deepseek服务状态,但无法从根本上解决,下一篇我们会分享,如何从根本上解决deepseek使用过程卡顿的问题,屏幕前的你可以留言,还想了解学习deepseek哪方面的内容呢?
deepseek
快速在全球爆火,它到底是资本炒作,还是国产ai崛起的里程碑?目前没人能给出准确答案。但至少,它让我们看到国产ai的潜力,也让更多人开始关注、学习、使用ai。或许,再过几年,ai助手会像智能手机一样普及。而deepseek
,可能正是推动这场变革的重要力量之一,因为它正在重新定义ai的未来。
您想发表意见!!点此发布评论
版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。
发表评论