DeepSeek 大模型应用
DeepSeek 大模型应用。大家好,今天我们开始学习 DeepSeek 大模型。
DeepSeek 介绍
DeepSeek 是杭州深度求索人工智能基础技术研究有限公司,开发的一个 AI 产品平台,这家公司陆续发布了多款大语言模型。对外提供了大模型服务与接口调用平台。
DeepSeek 模型列表
DeepSeek 陆续发布过如下大模型,目前最新的核心大模型是 DeepSeek V3 系列模型与 DeepSeek R1 模型。
- DeepSeek R1
- DeepSeek V3
- DeepSeek Coder V2
- DeepSeek VL
- DeepSeek V2
- DeepSeek Coder
- DeepSeek Math
- DeepSeek LLM
DeepSeek Chat V3 模型
DeepSeek V3 为自研混合专家模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练。 DeepSeek V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1 405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。
DeepSeek R1 模型
deepseek-reasoner 是 DeepSeek 推出的推理模型。在输出最终回答之前,模型会先输出一段思维链内容,以提升最终答案的准确性。DeepSeek R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
核心模型价格
模型 | 上下文长度 | 最大思维链长度 | 最大输出长度 | 百万 tokens 输入价格(缓存命中) | 百万 tokens 输入价格(缓存未命中) | 百万 tokens 输出价格 |
---|---|---|---|---|---|---|
chat | 64K | - | 8K | 0.5 元 | 2 元 | 8 元 |
reasoner | 64K | 32K | 8K | 1 元 | 4 元 | 16 元 |
{.!text-sm}
这是两个主要模型的参数和使用价格。核心参数是上下文 64k,最大输出 8k。虽然官方提供的服务是收费的,但是我们可以通过部署 deepseek 的开源模型实现免费使用。在集成到 dify 的时候,你需要按照这些参数填写相关的配置。
DeepSeek 使用方式
DeepSeek 的使用方式主要包含如下几个方式。
- 通过 DeepSeek 官网 deepseek.com
- 第三方服务,基于 DeepSeek 开源模型搭建起来的服务
- 官方的 API 调用,可以绕过一些界面问题
- 学社搭建的 dify ollama 服务
- 本地部署开源版本的大模型
{.audio}
openai 命令行调用方式
pip install -U openai
openai \
-b https://api.deepseek.com/v1/ \
-k $DEEPSEEK_TOKEN \
api chat.completions.create \
-m deepseek-chat \
-g user 我想学习短视频剪辑
openai -b https://api.deepseek.com/v1/ -k $DEEPSEEK_TOKEN api chat.completions.create -m deepseek-chat -g user 我想学习短视频剪辑
openai -b http://127.0.0.1:11434/v1/ -k $DEEPSEEK_TOKEN api chat.completions.create -m deepseek-r1 -g user 我想学习短视频剪辑
除了使用网页界面外,官方也支持通过多种其他的方式调用,比如命令行的方式、api 调用方式等。因为 DeepSeek 兼容 openai 的 api,所以我们可以使用 openai 的命令行工具进行调用。openai 的 python 包本身也是基于 http 接口进行的调用封装。
curl 命令调用方式
curl https://api.deepseek.com/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer <DeepSeek API Key>" \
-d '{
"model": "deepseek-chat",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello!"}
],
"stream": false
}'
当然也可以直接调用官方的 http 接口。使用任意语言或者 http 请求发送工具进行调用。
python 编程调用
# Please install OpenAI SDK first: `pip3 install openai`
from openai import OpenAI
client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")
response = client.chat.completions.create(
model="deepseek-chat",
messages=[
{"role": "system", "content": "You are a helpful assistant"},
{"role": "user", "content": "Hello"},
],
stream=False
)
print(response.choices[0].message.content)
这是 openai python 库调用的例子,当然也可以使用任何第三方的封装库,因为 openai 的 api 已经是行业事实上的标准,而 DeepSeek 又兼容了 openai 的 api,所以所有的大模型开发框架都支持 DeepSeek。比如 lang chain langgraph autogen 等。
DeepSeek 大模型提示词工程与应用
{.only .audio}
基本提示词库
DeepSeek 的提示词跟其他的大模型没有本质区别。所以我们可以参考如下几个资料,点击 PPT 中的链接即可访问。具体的教程可以参考咱们专门的提示词工程课程。R1 模型额外增加了思维链的提示,可以让你更容易的使用普通的提示词生成更好的回复。
- DeepSeek 提示词库
- OpenAI 的提示词技巧
- 通用提示词工程
- 第三方提示词生成工具或者提示词生成技巧
提示词工程
提示词工程参考本页 PPT 指向的文档,在独立的课程里有详细的讲解,就不再详细解说了。
提示词生成
SYSTEM
你是一位大模型提示词生成专家,请根据用户的需求编写一个智能助手的提示词,来指导大模型进行内容生成,要求:
1. 以 Markdown 格式输出
2. 贴合用户需求,描述智能助手的定位、能力、知识储备
3. 提示词应清晰、精确、易于理解,在保持质量的同时,尽可能简洁
4. 只输出提示词,不要输出多余解释
USER
请帮我生成一个“Linux 助手”的提示词
# Linux 助手提示词
## 定位
- **Linux 助手**:一个专注于提供 Linux 操作系统相关知识和支持的智能助手。
## 能力
- **系统管理**:能够提供 Linux 系统安装、配置、维护和优化的指导。
- **命令行操作**:熟练掌握并解释各种 Linux 命令行工具和脚本。
- **故障排除**:帮助用户诊断和解决常见的 Linux 系统问题。
- **软件管理**:指导用户进行软件包的安装、更新和卸载。
- **安全性**:提供 Linux 系统安全设置和最佳实践的建议。
这是一个 DeepSeek 提供的提示词生成的方法。可以用来参考如何自动生成提示词。
DeepSeek 本地部署
ollama 本地部署
#推荐部署
ollama run deepseek-r1
# 不推荐部署,太大
ollama run deepseek-v2.5
ollama run deepseek-v3
本地部署推荐使用经过蒸馏的小模型, deepseek r1 模型,参数尺寸上可以选择 14b 以下的小模型。更大的模型 v2.5 v3 需要更大的显存才能运行,请根据你当前的设备进行选择。
ollama 运行 DeepSeek 示例
这是 Ollama 运行 DeepSeek r1 模型的示例。我们通过ollama pull
拉取最新的模型,通过ollama run
启动 DeepSeek。启动大模型开始提问后,r1 模型会首先输出一段思维链,然后再输出最终结果。
dify 集成 DeepSeek
我们在 dify 的课程里给大家讲了如何安装 dify 。在这里我们在已经安装好的 dify 环境里集成了 DeepSeek。
dify DeepSeek 聊天助手构建
我们通过 dify 创建一个聊天助手,在这个聊天助手里,设置聊天助手里的大模型为 DeepSeek 模型,可以按需设置温度等参数。可以根据需要设置提示词与变量。
dify 聊天助手效果
保存整个配置后,就可以通过前端界面看到最后配置成功的聊天助手界面了。这里我简单做了一个人工智能面试官的聊天助手应用。
智能体框架集成
DeepSeek 官方推荐了一些支持 DeepSeek 的第三方 Agent 框架项目,不过这些项目大都 star 数非常少。建议还是使用标准的框架比如 lang chain autogen 之类的项目。因为这些项目支持 openai,自然也就支持 DeepSeek。
代码辅助编写 continue
除了用来生成创意、文章之外,我们也可以用 DeepSeek 来辅助编程。我们可以使用一个开源项目 continue,配置自己的 IDE 接入 DeepSeek 项目即可。
Q&A
DeepSeek 是一个非常优秀的大模型,我们可以使用 ollama 进行部署, 并把 DeepSeek 配置到我们的 dify AI 平台里, 从而构建出来基于 DeepSeek 的人工智能应用。 在后续的 agent 开发章节里,我们也会带大家使用 deekseek 开发强大的智能体。