AI | 有趣的AI

本地大模型编程实战(02)语义检索(1)

我们在百度、必应、谷歌等搜索引擎中使用的检索都是基于字符串的：用户输入字符串后，搜索引擎先对搜索内容进行分词，然后在已经进行了倒排索引的巨大数据库中找出最符合用户要求的结果。语义检索与其主要的区别是：它根据文本的真正含义进行搜索，其基本思路是将待检索的内容都转变成矢量（这个过程也叫做嵌入），转化矢量的基本原则是：语义相近的内容距离更近、相似性更高。当用户输入检索内容时，也是先把检索内容变成矢量，然后去矢量数据库中找到最相似的文档。这样检索出来的结果并不依据字面的意思，而是依据语义的相似度。本文描述了如何使用 langchain 和大语言模型以及矢量数据库完成pdf内容的语义检索。在对内容进行矢量化时使用了 nomic-embed-text，这个模型个头小，英文嵌入效果不错。后面还将涉及到以下内容：文档和文档加载器文本分割器嵌入向量存储和检索器 ...

本地大模型编程实战(01)实现翻译功能

大语言模型的主要功能是预测：输入一些字符串，它预测输出另一些字符串，这个特点使它擅长翻译。本文描述了如何使用大语言模型(LLM)实现基本的翻译功能，此翻译功能的特点是：无需指定源语言，只需要指定目标语言就可以进行翻译了。 ...

基于FastAPI和JWT实现OAuth2用户认证

本文阐述了如何基于FastAPI框架实现 OAuth2用户认证，其中使用哈希算法对密码进行了加密，使用 JWT 持有令牌。附带完整的代码，避免大家再次踩坑。 ...

使用FastAPI实现简单的OAuth2的Password和Bearer验证

本文讲述了基于FastAPI框架，实现实现简单的OAuth2的Password和Bearer验证。附带完整的代码，避免大家再次踩坑。 ...

使用FastAPI实现微服务API网关

本文阐述了基于FastAPI实现一个API网关的详细步骤，这样未来可以不断的在服务端像搭积木一样添加各种服务。我们即将实现下面的简单的微服务架构，目前它只实现了请求转发功能： ...