Python

[合集]本地大模型编程实战

此系列文章讲述了：如何在普通电脑上自己写代码完成常见的基于大语言模型能力的任务。 ...

[合集]从零搭建langchain+本地大模型+本地矢量数据库的RAG系统

此系列文章详细的阐述了如何从第一行代码开始搭建一个可以运行完全在本地服务器的RAG(Retrieval Augmented Generation)系统，包含了详细的步骤说明和代码，它是保姆级教程。它主要包含以下功能：使用本地大语言模型做语言翻译使用本地大语言模型做专业领域的知识问答从系统架构来看，本系统包含了前端、API网关、后台服务三大部分： ...

本地大模型编程实战(32)用websocket显示大模型的流式输出

在与 LLM(大语言模型) 对话时，如果每次都等 LLM 处理完毕再返回给客户端，会显得比较卡顿，不友好。如何能够像主流的AI平台那样：可以一点一点吐出字符呢？本文将模仿后端流式输出文字，前端一块一块的显示文字。主要的实现路径是： LLM 采用 qwen3 ，使用 stream 方式输出后端使用 langchain 框架使用 fastapi 实现后端接口前后端之间使用 websocket 长连接通信前端使用一个简单的 html5 网页做演示下面是最终实现的效果： ...

本地大模型编程实战(31)用Map-Reduce从大文本中提取摘要

在执行从文本中提取摘要的任务时，难免遇到大文本的情况：文本的长度超出了 LLM(大语言模型) 的token限制。 LangGraph 提供了 map-reduce 工作流，它先把大文本拆成小文档分别提取摘要，然后再提炼/压缩提取的摘要，直到最后提取的摘要的token长度满足既定要求。本次演练使用 qwen2.5:7b 开源大模型。 ...

本地大模型编程实战(30)从文本提取摘要

本文将演练如何使用 LLM(大语言模型) 提取文本摘要。本次演练使用 qwen2.5:7b 开源大模型。 ...