岚崒

公告

欢迎光临！

Learn More

标签

岚崒

公告

欢迎光临！

Learn More

标签

AI Blogging claude code claude' comfyui langchain langchainV1 llamacpp markdown MCP mermaid openclaw python skills

岚崒

公告

欢迎光临！

Learn More

标签

AI Blogging claude code claude' comfyui langchain langchainV1 llamacpp markdown MCP mermaid openclaw python skills

站点统计

文章

10

分类

4

标签

14

总字数

20,761

运行天数

0 天

最后活动

0 天前

1201 字

3 分钟

langchainV1教程

2026-02-14

教程

langchainV1

/

python

这是一份 LangChain 教程，重点聚焦于 v1.0 版本的核心特性——Agent 构建与中间件机制，同时涵盖了基础的链式调用和 RAG 应用开发。

LangChain 完全指南：从入门到生产级应用#

简介#

LangChain 是一个用于构建和部署基于大语言模型（LLM）应用的强大框架。它的核心理念是可组合性——通过将各种组件（模型、提示模板、检索器、工具等）像“积木”一样组合起来，构建复杂的 AI 工作流。

v1.0 重要更新（2025年10月发布）：LangChain v1.0 将重心完全放在了 Agent（智能体） 构建上，引入了更简洁的 create_agent 接口和灵活的中间件机制，同时对包结构进行了简化，旧版功能迁移至 @langchain/classic 。

1. 环境搭建与基础配置#

1.1 安装#

1
# 安装 LangChain v1.0 核心包
2
pip install langchain langchain-core langchain-openai
3

4
# 安装其他常用包
5
pip install langchain-community langchain-chroma faiss-cpu tiktoken

1.2 模型接入配置#

LangChain 支持通过统一的接口调用多种大模型。

OpenAI 接入#

1
import os
2
from langchain_openai import ChatOpenAI
3

4
# 设置 API Key（推荐使用环境变量）
5
os.environ["OPENAI_API_KEY"] = "your-api-key"
6

7
# 初始化模型
8
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.7)
9
response = llm.invoke("你好，请介绍一下自己")
10
print(response.content)

Ollama 本地模型接入#

1
from langchain_ollama import ChatOllama
2

3
# 确保已通过 ollama pull qwen3:4b 下载模型
4
llm = ChatOllama(model="qwen3:4b", base_url="http://localhost:11434")
5
response = llm.invoke("用一句话解释什么是大语言模型")
6
print(response.content)

阿里云百炼平台#

1
from langchain_openai import ChatOpenAI
2

3
llm = ChatOpenAI(
4
    model="qwen3-max",
5
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
6
    api_key="your-dashscope-api-key"
7
)

2. 核心概念与组件#

LangChain 的核心组件构成了应用开发的基础：

组件	描述	示例
Models	与大语言模型交互的统一接口	`ChatOpenAI`, `ChatOllama`
Prompts	管理和动态生成提示词	`PromptTemplate`, `ChatPromptTemplate`
Chains	将多个组件串联成工作流	`LLMChain`, LCEL 组合
Memory	在对话中保存和加载上下文	`ConversationBufferMemory`
Retrievers	从数据源检索相关信息	`VectorStoreRetriever`
Tools	赋予模型调用外部能力	搜索、计算器、API 调用
Agents	自主决策并选择执行工具	`create_agent`

2.1 提示模板示例#

1
from langchain_core.prompts import ChatPromptTemplate, PromptTemplate
2

3
# 基础提示模板
4
prompt = PromptTemplate.from_template("用一句话解释什么是{topic}？")
5
formatted = prompt.format(topic="量子计算")
6
print(formatted)
7

8
# 聊天提示模板（支持多角色）
9
chat_prompt = ChatPromptTemplate.from_messages([
10
    ("system", "你是一个{role}专家，回答要简洁专业。"),
11
    ("human", "{question}")
12
])
13

14
messages = chat_prompt.format_messages(
15
    role="Python编程",
16
    question="如何快速入门LangChain？"
17
)

2.2 简单的链（Chain）#

1
from langchain_core.output_parsers import StrOutputParser
2

3
# 使用 LCEL 创建简单链
4
chain = chat_prompt | llm | StrOutputParser()
5

6
result = chain.invoke({
7
    "role": "AI技术",
8
    "question": "LangChain v1.0 有哪些主要变化？"
9
})
10
print(result)

3. LangChain v1.0 新特性：Agent与中间件#

v1.0 最大的变化是引入了 create_agent 和中间件机制，让 Agent 构建变得前所未有的简单和可定制。

3.1 基础 Agent#

1
from langchain.agents import create_agent
2
from langchain_openai import ChatOpenAI
3
from langchain.tools import tool
4

5
# 定义工具
6
@tool
7
def get_weather(city: str) -> str:
8
    """获取指定城市的天气（模拟）"""
9
    weather_data = {
10
        "北京": "晴朗，25°C",
11
        "上海": "多云，22°C",
12
        "广州": "阵雨，28°C"
13
    }
14
    return weather_data.get(city, f"{city}：天气数据暂无")
15

16
@tool
17
def calculate(expression: str) -> float:
18
    """执行数学计算"""
19
    return eval(expression)
20

21
# 创建 Agent
22
model = ChatOpenAI(model="gpt-4o-mini")
23
agent = create_agent(
24
    model=model,
25
    tools=[get_weather, calculate],
26
    system_prompt="你是一个有用的助手，可以使用工具回答问题。"
27
)
28

29
# 调用 Agent
30
result = agent.invoke({
31
    "messages": [{"role": "user", "content": "北京天气怎么样？25+15等于多少？"}]
32
})
33
print(result["content"])

3.2 中间件：上下文工程的核心#

中间件让你能够在 Agent 执行的生命周期中插入自定义逻辑，实现输入预处理、敏感信息过滤、工具权限控制等功能。

生命周期钩子#

钩子	运行时机	典型用途
`before_agent`	调用 Agent 之前	加载记忆、验证输入
`before_model`	每次 LLM 调用之前	更新提示、修剪消息
`wrap_model_call`	包裹 LLM 调用	拦截和修改请求/响应
`wrap_tool_call`	包裹工具调用	权限控制、参数验证
`after_model`	LLM 响应之后	输出验证、安全检查
`after_agent`	Agent 完成之后	保存结果、清理

预构建中间件#

1
from langchain.agents import create_agent
2
from langchain.agents.middleware import (
3
    PIIMiddleware,
4
    SummarizationMiddleware,
5
    HumanInTheLoopMiddleware
6
)
7

8
agent = create_agent(
9
    model="claude-sonnet-4-5-20250929",
10
    tools=[read_email, send_email],
11
    middleware=[
12
        # 自动脱敏个人敏感信息
13
        PIIMiddleware("email", strategy="redact"),
14

15
        # 长对话自动摘要
16
        SummarizationMiddleware(
17
            model="claude-sonnet-4-5-20250929",
18
            max_tokens_before_summary=500
19
        ),
20

21
        # 敏感操作人工审核
22
        HumanInTheLoopMiddleware(
23
            interrupt_on={
24
                "send_email": {
25
                    "allowed_decisions": ["approve", "edit", "reject"]
26
                }
27
            }
28
        ),
29
    ]
30
)

自定义中间件#

1
from langchain.agents.middleware import AgentMiddleware
2
from langchain_openai import ChatOpenAI
3
from typing import Callable
4
from dataclasses import dataclass
5

6
@dataclass
7
class Context:
8
    user_expertise: str = "beginner"
9

10
class ExpertiseBasedToolMiddleware(AgentMiddleware):
11
    def wrap_model_call(
12
        self,
13
        request,
14
        handler: Callable
15
    ):
16
        user_level = request.runtime.context.user_expertise
17

18
        if user_level == "expert":
19
            request.model = ChatOpenAI(model="gpt-4o")
20
            request.tools = [advanced_search, data_analysis]
21
        else:
22
            request.model = ChatOpenAI(model="gpt-4o-mini")
23
            request.tools = [simple_search, basic_calculator]
24

25
        return handler(request)
26

27
# 使用自定义中间件
28
agent = create_agent(
29
    model="gpt-4o-mini",
30
    tools=[simple_search, advanced_search],
31
    middleware=[ExpertiseBasedToolMiddleware()],
32
    context_schema=Context
33
)

3.3 结构化输出#

v1.0 改进了结构化输出生成，可以在主循环中直接生成 Pydantic 模型，无需额外 LLM 调用。

1
from pydantic import BaseModel, Field
2
from langchain.agents import create_agent
3
from langchain_openai import ChatOpenAI
4

5
class WeatherReport(BaseModel):
6
    city: str = Field(description="城市名称")
7
    temperature: float = Field(description="温度（摄氏度）")
8
    condition: str = Field(description="天气状况")
9
    humidity: int = Field(description="湿度百分比")
10

11
agent = create_agent(
12
    model=ChatOpenAI(model="gpt-4o-mini"),
13
    tools=[get_weather],
14
    response_format=WeatherReport,
15
)
16

17
result = agent.invoke({
18
    "messages": [{"role": "user", "content": "北京的天气如何？"}]
19
})
20

21
print(result.structured_response)
22
# WeatherReport(city='北京', temperature=25.0, condition='晴朗', humidity=45)

4. RAG 应用实战：智能文档问答系统#

RAG（检索增强生成）是目前最流行的 LLM 应用模式之一，让模型能够基于私有知识库回答问题。

4.1 系统架构#

1
用户问题 → 查询向量化 → 向量检索 → 上下文增强 → LLM 生成 → 答案
2
                                      ↑
3
                                向量数据库（存储文档块）

4.2 完整实现代码#

1
import os
2
from langchain.document_loaders import PyPDFLoader, TextLoader
3
from langchain.text_splitter import RecursiveCharacterTextSplitter
4
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
5
from langchain.vectorstores import Chroma
6
from langchain.chains import RetrievalQA
7
from langchain_core.prompts import ChatPromptTemplate
8

9
# 1. 加载文档
10
def load_documents(file_paths):
11
    documents = []
12
    for path in file_paths:
13
        if path.endswith('.pdf'):
14
            loader = PyPDFLoader(path)
15
        else:
16
            loader = TextLoader(path, encoding='utf-8')
17
        documents.extend(loader.load())
18
    return documents
19

20
# 2. 分割文本
21
text_splitter = RecursiveCharacterTextSplitter(
22
    chunk_size=1000,
23
    chunk_overlap=200,
24
    separators=["\n\n", "\n", "。", "！", "？", "；", "，", " ", ""]
25
)
26

27
docs = load_documents(["./data/technical_manual.pdf", "./data/faq.txt"])
28
split_docs = text_splitter.split_documents(docs)
29
print(f"文档已分割为 {len(split_docs)} 个文本块")
30

31
# 3. 创建向量存储
32
embeddings = OpenAIEmbeddings()
33
vectorstore = Chroma.from_documents(
34
    documents=split_docs,
35
    embedding=embeddings,
36
    persist_directory="./chroma_db"  # 持久化存储
37
)
38

39
# 4. 创建检索器
40
retriever = vectorstore.as_retriever(
41
    search_type="similarity",  # 相似度检索
42
    search_kwargs={"k": 4}      # 返回 top-4
43
)
44

45
# 5. 构建 RAG 链
46
prompt_template = ChatPromptTemplate.from_messages([
47
    ("system", """你是一个专业的技术助手。基于以下上下文信息回答问题。
48
如果无法从上下文中找到答案，请如实告知用户，不要编造信息。
49

50
上下文信息：
51
{context}"""),
52
    ("human", "{question}")
53
])
54

55
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)
56

57
qa_chain = RetrievalQA.from_chain_type(
58
    llm=llm,
59
    chain_type="stuff",
60
    retriever=retriever,
61
    chain_type_kwargs={"prompt": prompt_template},
62
    return_source_documents=True  # 返回来源文档
63
)
64

65
# 6. 问答测试
66
def ask_question(question):
67
    result = qa_chain.invoke({"query": question})
68
    print(f"问题: {question}")
69
    print(f"答案: {result['result']}")
70
    print(f"来源: {[doc.metadata.get('source', '未知') for doc in result['source_documents']]}")
71
    print("-" * 50)
72
    return result
73

74
ask_question("系统的默认管理员密码是什么？")
75
ask_question("如何配置日志输出级别？")
76
ask_question("系统支持哪些数据库？")

4.3 检索优化策略#

1
# 混合检索（BM25 + 向量检索）
2
from langchain.retrievers import EnsembleRetriever
3
from langchain.retrievers import BM25Retriever
4

5
bm25_retriever = BM25Retriever.from_documents(split_docs)
6
bm25_retriever.k = 4
7

8
ensemble_retriever = EnsembleRetriever(
9
    retrievers=[bm25_retriever, vectorstore.as_retriever()],
10
    weights=[0.4, 0.6]  # BM25 权重 0.4，向量检索权重 0.6
11
)
12

13
# 查询重写
14
from langchain.retrievers import MultiQueryRetriever
15

16
multi_query_retriever = MultiQueryRetriever.from_llm(
17
    retriever=vectorstore.as_retriever(),
18
    llm=llm
19
)
20

21
# 上下文压缩
22
from langchain.retrievers import ContextualCompressionRetriever
23
from langchain.retrievers.document_compressors import LLMChainExtractor
24

25
compressor = LLMChainExtractor.from_llm(llm)
26
compression_retriever = ContextualCompressionRetriever(
27
    base_compressor=compressor,
28
    base_retriever=vectorstore.as_retriever()
29
)

5. LCEL：LangChain 表达式语言#

LCEL 是 LangChain 的核心语法，让你能够用 | 管道符优雅地组合组件。

5.1 基础组合#

1
from langchain_core.prompts import ChatPromptTemplate
2
from langchain_core.output_parsers import StrOutputParser
3
from langchain_openai import ChatOpenAI
4

5
prompt = ChatPromptTemplate.from_template("用一句话解释{topic}")
6
model = ChatOpenAI(model="gpt-4o-mini")
7
output_parser = StrOutputParser()
8

9
# 管道组合：prompt → model → parser
10
chain = prompt | model | output_parser
11

12
result = chain.invoke({"topic": "LangChain 表达式语言"})
13
print(result)

5.2 并行执行#

1
from langchain_core.runnables import RunnableParallel, RunnablePassthrough
2

3
# 并行执行多个任务
4
parallel_chain = RunnableParallel(
5
    summary=prompt_template | model | output_parser,
6
    keywords=keyword_prompt | model | output_parser,
7
    sentiment=sentiment_prompt | model | output_parser
8
)
9

10
results = parallel_chain.invoke({"text": long_article})

5.3 分支与条件#

1
from langchain_core.runnables import RunnableBranch
2

3
branch = RunnableBranch(
4
    (lambda x: "天气" in x["question"], weather_chain),
5
    (lambda x: "计算" in x["question"], calculator_chain),
6
    default_chain
7
)
8

9
result = branch.invoke({"question": "北京天气怎么样？"})

6. 生产环境最佳实践#

6.1 可观测性：LangSmith#

1
# 设置环境变量启用 LangSmith
2
export LANGCHAIN_TRACING_V2=true
3
export LANGCHAIN_API_KEY=your_langsmith_key
4
export LANGCHAIN_PROJECT=my-production-app

1
# 自动追踪所有调用
2
from langsmith import traceable
3

4
@traceable(run_type="tool")
5
def fetch_customer_data(customer_id: str):
6
    # 业务逻辑
7
    pass

6.2 持久化与检查点#

1
from langgraph.checkpoint.sqlite import SqliteSaver
2

3
# 使用 SQLite 保存对话状态
4
checkpointer = SqliteSaver.from_conn_string("sqlite:///./conversations.db")
5

6
agent = create_agent(
7
    model=model,
8
    tools=tools,
9
    checkpointer=checkpointer  # 自动持久化
10
)
11

12
# 使用 thread_id 恢复对话
13
result = agent.invoke(
14
    {"messages": [{"role": "user", "content": "你好"}]},
15
    config={"configurable": {"thread_id": "user-123"}}
16
)
17

18
# 后续可以通过相同的 thread_id 继续对话

6.3 错误处理与重试#

1
from langchain_core.runnables import RunnableRetry
2

3
# 自动重试（最多 3 次，指数退避）
4
retry_chain = chain.with_retry(
5
    stop_after_attempt=3,
6
    wait_exponential_jitter=True
7
)
8

9
# 自定义错误处理
10
try:
11
    result = agent.invoke(input_data)
12
except Exception as e:
13
    print(f"Agent 调用失败: {e}")
14
    fallback_result = fallback_chain.invoke(input_data)

6.4 生产部署 Checklist#

使用 create_agent 而非手动循环
为敏感操作添加 HumanInTheLoopMiddleware
使用 PII 中间件过滤个人敏感信息
开启 LangSmith 监控 token 消耗和延迟
为关键流程添加结构化输出（Pydantic）
使用 LangGraph 检查点实现持久化
容器化部署（Docker + Kubernetes）

7. 总结与扩展资源#

关键要点#

v1.0 的 Agent 优先：create_agent 是构建 AI 应用的标准方式
中间件是核心：通过组合中间件实现生产级功能（安全、记忆、审批）
RAG 是基础：向量检索 + LLM 是知识问答的标配
LCEL 是语法：用管道符 | 优雅组合组件
可观测性必备：LangSmith 让你不再“盲人摸象”

扩展资源#

资源	说明
LangChain 官方文档	最权威的参考资料
LangSmith	LLM 应用调试和监控平台
LangGraph	状态化 Agent 编排框架
Awesome LangChain	社区精选项目和工具

本教程基于 LangChain v1.0 编写。如果你正在维护旧项目，可通过 pip install @langchain/classic 获取迁移后的遗留功能。

如果这篇文章对你有帮助，欢迎分享给更多人！

langchainV1教程

https://30790842.xyz/posts/langchainv1教程/

作者

岚崒

发布于

2026-02-14

许可协议

CC BY-NC-SA 4.0

ClaudeCode高性价比使用方法

comfyui本地实战方案

岚崒の博客

LangChain 完全指南：从入门到生产级应用#

简介#

目录#

1. 环境搭建与基础配置#

1.1 安装#

1.2 模型接入配置#

OpenAI 接入#

Ollama 本地模型接入#

阿里云百炼平台#

2. 核心概念与组件#

2.1 提示模板示例#

2.2 简单的链（Chain）#

3. LangChain v1.0 新特性：Agent与中间件#

3.1 基础 Agent#

3.2 中间件：上下文工程的核心#

生命周期钩子#

预构建中间件#

自定义中间件#

3.3 结构化输出#

4. RAG 应用实战：智能文档问答系统#

4.1 系统架构#

4.2 完整实现代码#

4.3 检索优化策略#

5. LCEL：LangChain 表达式语言#

5.1 基础组合#

5.2 并行执行#

5.3 分支与条件#

6. 生产环境最佳实践#

6.1 可观测性：LangSmith#

6.2 持久化与检查点#

6.3 错误处理与重试#

6.4 生产部署 Checklist#

7. 总结与扩展资源#

关键要点#

扩展资源#

目录