diff --git a/操作系统/00_课程导航.md b/操作系统/00_课程导航.md
index f065a3d..3acda8a 100644
--- a/操作系统/00_课程导航.md
+++ b/操作系统/00_课程导航.md
@@ -31,6 +31,10 @@ mindmap
       并发服务器(多进程/多线程/预线程化)
     系统底层
       程序代码优化
+    操作系统实践
+      Web服务器初步实现
+      多进程多线程服务器
+      线程池与业务分割模型
 ```
 
 ---
@@ -139,6 +143,16 @@ FAT·Ext2·RAID"]
 
 ---
 
+## 🖥️ 操作系统实践
+
+| 实践 | 主题 | 核心内容 | 涉及章节 |
+|------|------|----------|----------|
+| [[实践01_Web服务器初步实现]] | Web服务器初步实现 | 单进程迭代式服务器、HTTP请求处理、RIO函数库、性能测试与优化 | 第09讲、第10讲、第18讲 |
+| [[实践02_多进程多线程服务器]] | 多进程多线程服务器 | fork并发、pthread并发、select/epoll多路复用、性能对比 | 第06讲、第07讲、第10讲 |
+| [[实践03_线程池与业务分割]] | 线程池与业务分割模型 | 线程池实现、预线程化、sbuf生产者消费者、业务分割模型 | 第07讲、第10讲 |
+
+---
+
 ## 📎 附录
 
 - [[附录A_Wrapper库参考]] — 课程提供的C语言包装库（wrapper.h/libwrapper.a）
diff --git a/操作系统/操作系统实践/实践01_Web服务器初步实现.md b/操作系统/操作系统实践/实践01_Web服务器初步实现.md
new file mode 100644
index 0000000..f1eedd0
--- /dev/null
+++ b/操作系统/操作系统实践/实践01_Web服务器初步实现.md
@@ -0,0 +1,578 @@
+# 实验一：Web服务器的初步实现
+
+> [!info] 实验信息
+> - **课程**: 操作系统实践
+> - **实验编号**: 实验一
+> - **实验类型**: 综合性实验
+> - **关联理论**: [[09_网络编程基础]]、[[10_并发服务器]]、[[18_程序代码优化]]
+
+---
+
+## 一、实验目的
+
+1. 掌握 Linux 系统下网络编程开发环境的搭建
+2. 实现简单的单进程 Web 服务器
+3. 进行性能测试，掌握网络编程的基本技术
+4. 初步掌握 Web 服务器的编程实现和测试技术
+
+---
+
+## 二、实验环境
+
+| 项目 | 说明 |
+|------|------|
+| 操作系统 | Ubuntu / CentOS (Linux) |
+| 编译器 | GCC |
+| 测试工具 | http_load、ab、wrk |
+| 监控工具 | vmstat、iostat、gprof |
+| 服务器端口 | 8088 |
+
+---
+
+## 三、源代码文件清单
+
+```
+.
+├── common.h          # 公共头文件、函数声明、常量定义（由wrapper.h简化而来）
+├── common.c          # RIO函数库和打开网络连接函数源代码
+├── webclient.c       # web客户端源代码
+├── webserver.c       # web服务器源代码（即weblet.c）
+├── togglec.c         # toggle客户端源代码
+├── togglesi.c        # 迭代式toggle服务器源代码
+├── cgi-bin/
+│   └── add.c         # CGI程序
+├── Makefile          # 构建脚本
+├── index.html        # 测试主页
+├── test.html         # 测试页面
+└── urls              # http_load测试用URL列表
+```
+
+> [!tip] 文件说明
+> - `common.h` / `common.c` 封装了网络编程常用的包装函数（Socket、Bind、Listen、Accept 等），是对 `wrapper.h` 的简化版本
+> - `togglec.c` / `togglesi.c` 用于演示迭代式客户-服务器模型
+> - `weblet.c` 是核心的单进程 Web 服务器实现
+
+---
+
+## 四、服务器架构
+
+### 4.1 整体架构图
+
+```mermaid
+
+graph TD
+    subgraph 客户端
+        Browser["浏览器 / Web客户端"]
+    end
+
+    subgraph Web服务器 - weblet
+        Main["main() 主循环"]
+        Accept["accept() 接受连接"]
+        PT["process_trans() 处理HTTP事务"]
+        Close["close() 关闭连接"]
+    end
+
+    subgraph 请求处理流程
+        RR["读取请求行"]
+        Judge["判断静态/动态请求"]
+        Parse["解析URI"]
+        Send["发送响应"]
+        Err["错误处理"]
+    end
+
+    subgraph 响应模块
+        FS["feed_static() 静态内容"]
+        FD["feed_dynamic() 动态内容"]
+        ER["error_request() 错误响应"]
+    end
+
+    Browser -->|"HTTP请求"| Main
+    Main --> Accept
+    Accept --> PT
+    PT --> RR
+    RR --> Judge
+    Judge -->|"静态请求"| Parse
+    Judge -->|"动态请求"| Parse
+    Parse --> Send
+    Send --> FS
+    Send --> FD
+    Send --> ER
+    FS -->|"HTTP响应"| Browser
+    FD -->|"HTTP响应"| Browser
+    ER -->|"错误页面"| Browser
+    PT --> Close
+    Close -->|"等待下一个连接"| Accept
+
+
+
+```
+
+### 4.2 HTTP请求处理流程
+```mermaid
+
+flowchart TD
+    Start(["开始: accept() 获取连接"]) --> ReadReq["1.读取请求行
+    read_requesthdrs()"]
+    ReadReq --> ParseReq["2.解析请求方法、URI、版本"]
+    ParseReq --> IsStatic{"3.is_static()
+    判断请求类型"}
+
+    IsStatic -->|"静态请求"| ParseStatic["4a.parse_static_uri()
+    解析静态文件URI"]
+    IsStatic -->|"动态请求"| ParseDynamic["4b.parse_dynamic_uri()
+    解析CGI程序URI"]
+
+    ParseStatic --> OpenFile["5a.打开请求的文件"]
+    ParseDynamic --> ExecCGI["5b.执行CGI程序"]
+
+    OpenFile --> FileExist{"文件是否存在?"}
+    FileExist -->|"是"| FeedStatic["6a.feed_static()
+    发送静态文件响应"]
+    FileExist -->|"否"| ErrorReq["6c.error_request()
+    返回404错误"]
+
+    ExecCGI --> FeedDynamic["6b.feed_dynamic()
+    发送CGI执行结果"]
+
+    FeedStatic --> Done(["结束: close()"])
+    FeedDynamic --> Done
+    ErrorReq --> Done
+
+
+
+```
+
+---
+
+## 五、核心源码分析
+
+### 5.1 主函数结构 (`weblet.c`)
+
+```c
+/*
+ * weblet.c - 一个简单的单进程迭代式Web服务器
+ * 服务端口: 8088
+ */
+int main(int argc, char **argv) {
+    int listen_sock, conn_sock;
+    int hit;
+
+    /* 创建监听套接字 */
+    listen_sock = open_listen_sock(port);
+
+    /* 主循环：迭代式处理每个请求 */
+    for (hit = 1; ; hit++) {
+        /* 接受客户端连接 */
+        conn_sock = accept(listen_sock,
+                           (struct sockaddr *)&client_addr,
+                           &client_len);
+
+        /* 处理一个HTTP事务 */
+        process_trans(conn_sock, hit);
+
+        /* 关闭连接，等待下一个请求 */
+        close(conn_sock);
+    }
+}
+```
+
+> [!warning] 迭代式服务器的局限
+> 该服务器是**单进程迭代式**的，一次只能处理一个客户端请求。当某个请求处理耗时较长时，后续请求会被阻塞等待。改进方案参见 [[10_并发服务器]] 中的多进程和多线程服务器。
+
+### 5.2 HTTP事务处理函数 (`process_trans`)
+
+```c
+/*
+ * process_trans - 处理一个HTTP事务
+ * @fd:  连接套接字描述符
+ * @hit: 请求计数
+ */
+void process_trans(int fd, int hit) {
+    int is_static;          /* 是否为静态请求 */
+    struct stat sbuf;       /* 文件状态 */
+    char buf[MAXLINE];      /* 读缓冲区 */
+    char method[MAXLINE];   /* 请求方法: GET */
+    char uri[MAXLINE];      /* 请求URI */
+    char version[MAXLINE];  /* HTTP版本 */
+    char filename[MAXLINE]; /* 文件路径 */
+    char cgiargs[MAXLINE];  /* CGI参数 */
+
+    /* 1. 读取并解析请求行 */
+    read_requesthdrs(buf);
+
+    /* 2. 解析请求行: GET /index.html HTTP/1.1 */
+    sscanf(buf, "%s %s %s", method, uri, version);
+
+    /* 3. 判断是否为静态请求 */
+    is_static = is_static(uri);
+
+    /* 4. 解析URI，提取文件名和CGI参数 */
+    if (is_static) {
+        parse_static_uri(uri, filename, cgiargs);
+    } else {
+        parse_dynamic_uri(uri, filename, cgiargs);
+    }
+
+    /* 5. 检查文件是否存在 */
+    if (stat(filename, &sbuf) < 0) {
+        error_request(fd, filename, "404", "Not Found");
+        return;
+    }
+
+    /* 6. 发送响应 */
+    if (is_static) {
+        feed_static(fd, filename, sbuf.st_size);
+    } else {
+        feed_dynamic(fd, filename, cgiargs);
+    }
+}
+```
+
+### 5.3 RIO函数库 (`common.c`)
+
+```c
+/*
+ * RIO (Robust I/O) 健壮的I/O函数库
+ * 解决了Unix I/O的不足:
+ *  - 短读(short read)问题
+ *  - 被信号中断(interrupted read)问题
+ */
+
+/* 无缓冲的RIO读取 */
+ssize_t rio_readn(int fd, void *usrbuf, size_t n);
+ssize_t rio_writen(int fd, void *usrbuf, size_t n);
+
+/* 带缓冲的RIO读取 */
+void rio_readinitb(rio_t *rp, int fd);
+ssize_t rio_readlineb(rio_t *rp, void *usrbuf, size_t maxlen);
+ssize_t rio_readnb(rio_t *rp, void *usrbuf, size_t n);
+
+/* 网络连接函数 */
+int open_listen_sock(int port);   /* 创建监听套接字 */
+int open_client_sock(char *host, int port);  /* 创建客户端连接 */
+```
+
+---
+
+## 六、MIME类型支持
+
+服务器根据文件扩展名返回对应的 `Content-Type`：
+
+| 扩展名 | MIME类型 |
+|--------|----------|
+| `.gif` | `image/gif` |
+| `.jpg` / `.jpeg` | `image/jpeg` |
+| `.png` | `image/png` |
+| `.ico` | `image/x-icon` |
+| `.zip` | `application/zip` |
+| `.gz` / `.tar` | `application/x-tar` |
+| `.htm` / `.html` | `text/html` |
+
+---
+
+## 七、实验任务
+
+### 任务1：运行验证迭代式服务器（togglec / togglesi）
+
+> [!example] 操作步骤
+
+```bash
+# 终端1: 启动迭代式toggle服务器
+$ ./togglesi
+
+# 终端2: 运行toggle客户端
+$ ./togglec localhost
+```
+
+此任务演示了[[09_网络编程基础]]中的基本客户-服务器通信模型。`togglesi` 是一个迭代式服务器，一次只服务一个客户端。
+
+### 任务2：编写跨计算机文件传输程序
+
+实现 `ftps.c`（服务器）和 `ftpc.c`（客户端），支持以下命令：
+- `put <文件名>` —— 客户端上传文件到服务器
+- `get <文件名>` —— 客户端从服务器下载文件
+
+> [!abstract] 设计要点
+> 1. 使用 Socket API 建立 TCP 连接
+> 2. 先传输文件名和文件大小（协议头），再传输文件内容
+> 3. 使用 RIO 函数处理短读问题
+> 4. 服务器端需处理文件不存在的情况
+
+### 任务3：运行验证 Web 服务器
+
+```bash
+# 编译
+$ make
+
+# 启动Web服务器 (端口8088)
+$ ./weblet 8088
+
+# 在浏览器中访问
+# http://localhost:8088/index.html
+# http://localhost:8088/test.html
+
+# 使用curl测试
+$ curl -v http://localhost:8088/index.html
+```
+
+### 任务4：使用 http_load 进行性能测试
+
+```bash
+# 准备URL列表文件 (urls)
+$ cat urls
+http://localhost:8088/index.html
+http://localhost:8088/test.html
+
+# 并行度5，总请求数50
+$ http_load -parallel 5 -fetches 50 urls
+
+# 并行度10，总请求数50
+$ http_load -parallel 10 -fetches 50 urls
+
+# 并行度5，持续20秒
+$ http_load -parallel 5 -seconds 20 urls
+
+# 并行度10，持续20秒
+$ http_load -parallel 10 -seconds 20 urls
+```
+
+> [!note] http_load 输出指标
+> - **fetches/sec**: 每秒完成的请求数（吞吐量）
+> - **bytes/sec**: 每秒传输的字节数
+> - **msecs/connect**: 平均连接建立时间
+> - **msecs/first-response**: 首字节响应时间
+
+### 任务5：使用 vmstat、iostat、gprof 收集性能数据
+
+```bash
+# ---- vmstat: 监控系统资源 ----
+# 每2秒采样一次，共10次
+$ vmstat 2 10
+
+# 重点关注:
+#   r    - 运行队列长度
+#   us   - 用户态CPU占比
+#   sy   - 内核态CPU占比
+#   wa   - I/O等待占比
+#   free - 空闲内存
+
+# ---- iostat: 监控磁盘I/O ----
+# 以KB为单位，每2秒采样一次，共10次
+$ iostat -k 2 10
+
+# 重点关注:
+#   tps   - 每秒传输次数
+#   kB_read/s  - 每秒读取量
+#   kB_wrtn/s  - 每秒写入量
+
+# ---- gprof: 函数级性能分析 ----
+# 编译时加 -pg 选项
+$ gcc -pg -o weblet weblet.c common.c
+
+# 运行服务器并处理若干请求后终止
+$ ./weblet 8088
+
+# 生成性能分析报告
+$ gprof ./weblet gmon.out > perf.txt
+$ cat perf.txt
+```
+
+### 任务6：优化 Web 服务器
+
+> [!tip] 优化方向 — 参见 [[18_程序代码优化]]
+
+**抑制调试输出**：将 `printf` 等调试输出替换为条件编译或日志级别控制。
+
+```c
+/* 优化前: 每个请求都输出调试信息 */
+void process_trans(int fd, int hit) {
+    printf("Request %d: processing...\n", hit);
+    // ...
+}
+
+/* 优化后: 仅在DEBUG模式下输出 */
+#ifdef DEBUG
+#define DBG_LOG(fmt, ...) printf(fmt, ##__VA_ARGS__)
+#else
+#define DBG_LOG(fmt, ...) /* nothing */
+#endif
+
+void process_trans(int fd, int hit) {
+    DBG_LOG("Request %d: processing...\n", hit);
+    // ...
+}
+```
+
+```bash
+# 编译优化版本 (关闭调试输出)
+$ gcc -O2 -o weblet_opt weblet.c common.c
+
+# 重新进行性能测试，对比优化前后结果
+$ http_load -parallel 10 -fetches 50 urls
+```
+
+### 任务7：优化服务器部署（跨节点测试）
+
+```bash
+# 服务器端 (节点A: 192.168.1.100)
+$ ./weblet 8088
+
+# 客户端 (节点B: 192.168.1.200)
+# 修改urls文件中的地址
+$ cat urls
+http://192.168.1.100:8088/index.html
+http://192.168.1.100:8088/test.html
+
+# 跨节点压测
+$ http_load -parallel 10 -seconds 20 urls
+
+# 使用ab进行压测
+$ ab -n 1000 -c 100 http://192.168.1.100:8088/
+
+# 使用wrk进行压测
+$ wrk -t4 -c100 -d10s http://192.168.1.100:8088/
+```
+
+---
+
+## 八、性能测试命令汇总
+
+```bash
+# ===== http_load =====
+http_load -parallel 5  -fetches 50 urls          # 并行5，50次请求
+http_load -parallel 10 -fetches 50 urls          # 并行10，50次请求
+http_load -parallel 5  -seconds 20 urls          # 并行5，持续20秒
+http_load -parallel 10 -seconds 20 urls          # 并行10，持续20秒
+
+# ===== vmstat =====
+vmstat 2 10                                       # 每2秒采样，共10次
+
+# ===== iostat =====
+iostat -k 2 10                                    # KB为单位，每2秒采样
+
+# ===== gprof =====
+gprof ./weblet gmon.out > perf.txt               # 生成函数调用分析
+
+# ===== ab (Apache Bench) =====
+ab -n 1000 -c 100 http://127.0.0.1:8080/         # 1000请求，并发100
+
+# ===== wrk =====
+wrk -t4 -c100 -d10s http://127.0.0.1:8088/       # 4线程，并发100，持续10秒
+```
+
+---
+
+## 九、Makefile 示例
+
+```makefile
+CC = gcc
+CFLAGS = -Wall -O2
+DEBUG_CFLAGS = -Wall -g -pg -DDEBUG
+
+all: weblet togglec togglesi webclient
+
+weblet: weblet.c common.c common.h
+	$(CC) $(CFLAGS) -o weblet weblet.c common.c
+
+togglec: togglec.c common.c common.h
+	$(CC) $(CFLAGS) -o togglec togglec.c common.c
+
+togglesi: togglesi.c common.c common.h
+	$(CC) $(CFLAGS) -o togglesi togglesi.c common.c
+
+webclient: webclient.c common.c common.h
+	$(CC) $(CFLAGS) -o webclient webclient.c common.c
+
+debug: weblet.c common.c common.h
+	$(CC) $(DEBUG_CFLAGS) -o weblet_debug weblet.c common.c
+
+clean:
+	rm -f weblet togglec togglesi webclient weblet_debug gmon.out perf.txt
+```
+
+---
+
+## 十、实验结果与分析
+
+### 10.1 性能对比记录表
+
+| 测试条件 | 并行度 | fetches/sec | bytes/sec | 备注 |
+|----------|--------|-------------|-----------|------|
+| 原始版本 | 5 | - | - | |
+| 原始版本 | 10 | - | - | |
+| 优化版本(关闭调试) | 5 | - | - | |
+| 优化版本(关闭调试) | 10 | - | - | |
+| 跨节点测试 | 10 | - | - | |
+
+### 10.2 gprof 分析要点
+
+> [!abstract] 关键发现
+> 1. 识别 CPU 时间占比最高的函数
+> 2. 分析系统调用（`read`、`write`、`accept`）的耗时
+> 3. 对比优化前后函数调用次数和耗时变化
+
+### 10.3 分析与思考
+
+1. **迭代式服务器的瓶颈**：单进程模型下，请求串行处理，并发性能受限。改进方案可参考 [[10_并发服务器]] 中的多进程 fork 模型、多线程 pthread 模型。
+
+2. **调试输出对性能的影响**：频繁的 `printf` 会触发系统调用和缓冲区刷新，在高并发场景下成为性能瓶颈。
+
+3. **网络传输 vs 本地测试**：跨节点测试引入了网络延迟，更接近真实场景，但本地测试更能反映服务器本身的处理能力。
+
+---
+
+## 十一、知识点总结
+
+```mermaid
+
+mindmap
+  root((Web服务器实现))
+    网络编程基础
+      Socket API
+        socket/bind/listen/accept
+        connect/read/write
+      RIO函数库
+        健壮的I/O操作
+        带缓冲读取
+    服务器架构
+      迭代式服务器
+        单进程串行处理
+        简单但并发性差
+      并发式服务器
+        多进程fork模型
+        多线程pthread模型
+    HTTP协议
+      请求行解析
+        GET / URI / HTTP/1.1
+      MIME类型
+        Content-Type头部
+      静态/动态内容
+        文件服务 vs CGI
+    性能测试
+      压测工具
+        http_load
+        ab / wrk
+      系统监控
+        vmstat / iostat
+      代码分析
+        gprof 函数级分析
+
+
+
+```
+
+---
+
+## 十二、课后思考
+
+1. 如何将迭代式 Web 服务器改造为[[10_并发服务器|并发服务器]]？比较 `fork`、`pthread`、`select`/`epoll` 等方案的优劣。
+2. RIO 函数库解决了标准 I/O 的哪些问题？为什么不能直接使用 `read()` / `write()`？
+3. 如何通过 [[18_程序代码优化|代码优化]] 进一步提升 Web 服务器性能？（减少系统调用、零拷贝、内存映射等）
+4. 试分析 `gprof` 输出中各函数的调用关系和时间占比，找出性能热点。
+
+---
+
+> [!quote] 参考资料
+> - 《深入理解计算机系统》(CSAPP) 第11章：网络编程
+> - 《Unix网络编程》(UNP) 卷1：套接字联网API
+> - man pages: `socket(2)`, `bind(2)`, `listen(2)`, `accept(2)`, `connect(2)`
diff --git a/操作系统/操作系统实践/实践02_多进程多线程服务器.md b/操作系统/操作系统实践/实践02_多进程多线程服务器.md
new file mode 100644
index 0000000..e89ba0e
--- /dev/null
+++ b/操作系统/操作系统实践/实践02_多进程多线程服务器.md
@@ -0,0 +1,628 @@
+# 实践02：Web服务器的多进程与多线程模型实现
+
+> [!info] 实验信息
+> **课程**：操作系统实践
+> **实验名称**：实验二 — Web服务器的多进程与多线程模型实现
+> **前置实验**：[[实践01_Web服务器初步实现]]
+
+## 实验目的
+
+1. 将 Web 服务器改造为多进程、多线程、预线程、线程池四种版本
+2. 掌握并行网络服务器的设计方法
+3. 使用 `http_load` 进行性能测试与对比分析
+4. 理解不同并发模型的优劣及适用场景
+
+> [!tip] 关联理论课程
+> - [[06_进程控制]] — `fork`、信号处理、僵尸进程回收
+> - [[07_多线程编程]] — `pthread_create`、线程同步
+> - [[10_并发服务器]] — 并发模型概述与对比
+
+---
+
+## 源代码文件清单
+
+> [!note] 本次实验新增文件（在实验一基础上）
+> | 文件 | 说明 |
+> |------|------|
+> | `togglesp.c` | 多进程 toggle 服务器 |
+> | `togglest.c` | 多线程 toggle 服务器 |
+> | `togglest_pre.c` | 预线程 toggle 服务器 |
+> | `togglest_pool.c` | 线程池 toggle 服务器 |
+
+---
+
+## 一、四种并发模型总览
+
+### 模型架构图
+
+```mermaid
+graph TD
+    subgraph "模型一：多进程 Process-per-Connection"
+        C1[客户端 1] -->|accept| S1[主进程]
+        S1 -->|fork| P1[子进程 1]
+        S1 -->|fork| P2[子进程 2]
+        S1 -->|fork| P3[子进程 3]
+        P1 --> R1[处理请求]
+        P2 --> R2[处理请求]
+        P3 --> R3[处理请求]
+    end
+```
+
+```mermaid
+graph TD
+    subgraph "模型二：多线程 Thread-per-Connection"
+    
+        C2[客户端] -->|accept| SM[主线程]
+        SM -->|pthread_create| T1[线程 1]
+        SM -->|pthread_create| T2[线程 2]
+        SM -->|pthread_create| T3[线程 3]
+        T1 --> H1[处理请求]
+        T2 --> H2[处理请求]
+        T3 --> H3[处理请求]
+        
+    end
+```
+
+```mermaid
+graph TD
+    subgraph "模型三：预线程 Pre-threaded"
+        C3[客户端] -->|accept| PM[主线程]
+        PM -->|放入任务队列| Q[(任务队列)]
+        Q -->|取任务| W1[工作线程 1]
+        Q -->|取任务| W2[工作线程 2]
+        Q -->|取任务| W3[工作线程 3]
+        Q -->|取任务| W4[工作线程 N]
+    end
+```
+
+```mermaid
+graph TD
+    subgraph "模型四：线程池 Thread Pool"
+        C4[客户端] -->|submit| POOL[线程池管理器]
+        POOL -->|dispatch| Q2[(任务队列)]
+        Q2 -->|worker| WT1[工作线程 1]
+        Q2 -->|worker| WT2[工作线程 2]
+        Q2 -->|worker| WT3[工作线程 N]
+        WT1 -->|完成| POOL
+        WT2 -->|完成| POOL
+    end
+```
+
+### 四种模型对比
+
+| 模型 | 源文件 | 创建时机 | 优点 | 缺点 |
+|------|--------|----------|------|------|
+| 多进程 | `togglesp.c` | 按需 `fork` | 简单、进程隔离 | `fork` 开销大 |
+| 多线程 | `togglest.c` | 按需 `pthread_create` | 比 `fork` 轻量 | 线程创建仍有开销 |
+| 预线程 | `togglest_pre.c` | 启动时创建线程池 | 无运行时创建开销 | 需要任务队列同步 |
+| 线程池 | `togglest_pool.c` | 启动时创建线程池 | 最优性能、可复用 | 实现复杂度最高 |
+
+---
+
+## 二、任务一：验证 Toggle 服务器的四种版本
+
+### 2.1 编译
+
+```bash
+# 多进程版本
+gcc -o togglesp togglesp.c csapp.c -lpthread
+
+# 多线程版本
+gcc -o togglest togglest.c csapp.c -lpthread
+
+# 预线程版本
+gcc -o togglest_pre togglest_pre.c csapp.c -lpthread
+
+# 线程池版本
+gcc -o togglest_pool togglest_pool.c csapp.c -lpthread
+```
+
+### 2.2 分别运行与测试
+
+```bash
+# ---- 测试多进程版本 ----
+./togglesp 8080 &
+./togglec localhost 8080
+# 输入: Hello World
+# 输出: hELLO wORLD
+
+# ---- 测试多线程版本 ----
+./togglest 8081 &
+./togglec localhost 8081
+
+# ---- 测试预线程版本 ----
+./togglest_pre 8082 &
+./togglec localhost 8082
+
+# ---- 测试线程池版本 ----
+./togglest_pool 8083 &
+./togglec localhost 8083
+```
+
+> [!warning] 注意
+> 测试前确保端口未被占用，可用 `lsof -i:8080` 或 `netstat -tlnp` 检查。
+
+---
+
+## 三、多进程模型详解 — togglesp.c
+
+### 3.1 整体流程
+
+```mermaid
+sequenceDiagram
+    participant Main as 主进程
+    participant Child as 子进程
+    participant Client as 客户端
+
+    Main->>Main: Signal(SIGCHLD, handler)
+    Main->>Main: listen_sock = open_listen_sock(port)
+    loop 持续接受连接
+        Main->>Main: conn_sock = accept(...)
+        Main->>Main: fork()
+        alt 子进程
+            Main->>Child: 进入子进程
+            Child->>Main: close(listen_sock)
+            Child->>Client: toggle(conn_sock, hit)
+            Child->>Child: exit(0)
+        else 父进程
+            Main->>Main: close(conn_sock)
+        end
+    end
+```
+
+### 3.2 核心代码解析
+
+#### 信号处理：回收僵尸进程
+
+```c
+void sigchld_handler(int sig) {
+    while (waitpid(-1, 0, WNOHANG) > 0);
+    // WNOHANG: 非阻塞，避免信号处理函数中阻塞
+    // while 循环: 一次回收所有已终止的子进程（防止信号丢失）
+}
+```
+
+> [!important] 为什么用 `while` 循环？
+> Unix 信号不排队。如果两个子进程几乎同时终止，可能只收到一次 `SIGCHLD`。循环调用 `waitpid` 确保所有僵尸进程都被回收。
+
+#### toggle 函数：大小写转换
+
+```c
+void toggle(int conn_sock, int hit) {
+    int n;
+    char buf[MAXLINE];
+
+    while ((n = recv(conn_sock, buf, MAXLINE, 0)) > 0) {
+        // 逐字节进行大小写转换
+        for (int i = 0; i < n; i++) {
+            if (isupper(buf[i]))
+                buf[i] = tolower(buf[i]);
+            else if (islower(buf[i]))
+                buf[i] = toupper(buf[i]);
+        }
+        send(conn_sock, buf, n, 0);  // 原样发回转换后的数据
+    }
+}
+```
+
+#### 主循环：fork 并发处理
+
+```c
+int main(int argc, char **argv) {
+    int listen_sock, conn_sock, hit;
+    socklen_t clientlen;
+    struct sockaddr_storage clientaddr;
+
+    Signal(SIGCHLD, sigchld_handler);        // 注册 SIGCHLD 处理函数
+    listen_sock = open_listen_sock(argv[1]); // 创建监听套接字
+
+    for (hit = 1; ; hit++) {
+        clientlen = sizeof(clientaddr);
+        conn_sock = accept(listen_sock,
+                           (SA *)&clientaddr, &clientlen);
+
+        if (Fork() == 0) {          // 子进程
+            close(listen_sock);     // 关闭监听套接字（子进程不需要）
+            toggle(conn_sock, hit); // 处理请求
+            close(conn_sock);       // 关闭连接套接字
+            exit(0);                // 子进程退出
+        }
+        close(conn_sock);           // 父进程关闭连接套接字
+    }
+}
+```
+
+> [!note] 父子进程的套接字处理
+> - **父进程**：`close(conn_sock)` — 父进程不处理该连接
+> - **子进程**：`close(listen_sock)` — 子进程不接受新连接
+> - 这是多进程服务器的标准模式，避免文件描述符泄漏
+
+### 3.3 多进程模型的优缺点
+
+```
+优点                              缺点
++----------------------------------+----------------------------------+
+| 进程间地址空间隔离               | fork() 系统调用开销大             |
+| 一个进程崩溃不影响其他进程       | 每个进程占用独立内存空间          |
+| 编程模型简单直观                 | 进程数受系统限制                  |
+| 天然线程安全（无共享数据）       | 上下文切换开销大                  |
++----------------------------------+----------------------------------+
+```
+
+---
+
+## 四、多线程模型详解 — togglest.c
+
+### 4.1 核心结构
+
+```c
+// 线程参数结构体
+typedef struct {
+    int conn_sock;
+    int hit;
+} thread_args_t;
+
+void *thread_toggle(void *vargp) {
+    thread_args_t *args = (thread_args_t *)vargp;
+    int conn_sock = args->conn_sock;
+    int hit = args->hit;
+    Free(vargp);                    // 释放参数内存
+
+    toggle(conn_sock, hit);         // 处理请求（复用 toggle 函数）
+    Close(conn_sock);               // 关闭连接
+    return NULL;
+}
+
+int main(int argc, char **argv) {
+    listen_sock = open_listen_sock(port);
+
+    for (hit = 1; ; hit++) {
+        conn_sock = accept(listen_sock, ...);
+
+        // 为每个连接分配参数
+        thread_args_t *args = Malloc(sizeof(thread_args_t));
+        args->conn_sock = conn_sock;
+        args->hit = hit;
+
+        // 创建分离线程（自动回收，无需 join）
+        Pthread_create(&tid, NULL, thread_toggle, args);
+    }
+}
+```
+
+> [!tip] 为什么要用 `pthread_detach`？
+> 如果不分离线程，线程终止后其资源不会自动释放，造成资源泄漏（类似僵尸进程）。使用 `pthread_detach` 或 `pthread_create` 后立即 `pthread_detach` 可避免此问题。
+
+### 4.2 多线程 vs 多进程
+
+```mermaid
+graph LR
+    subgraph 多进程
+        A1[主进程] -->|fork| A2[子进程]
+        A2 -->|独立地址空间| A3[处理请求]
+    end
+
+    subgraph 多线程
+        B1[主线程] -->|pthread_create| B2[新线程]
+        B2 -->|共享地址空间| B3[处理请求]
+    end
+
+    style A1 fill:#ffcdd2
+    style A2 fill:#ffcdd2
+    style A3 fill:#ffcdd2
+    style B1 fill:#c8e6c9
+    style B2 fill:#c8e6c9
+    style B3 fill:#c8e6c9
+```
+
+---
+
+## 五、预线程模型详解 — togglest_pre.c
+
+### 5.1 设计思想
+
+预线程模型在服务器启动时就创建固定数量的工作线程，所有线程共享一个任务队列，形成**生产者-消费者**模型。
+
+```mermaid
+graph LR
+    P[主线程/生产者] -->|sbuf_insert| Q[(共享任务队列<br/>conn_sock)]
+    Q -->|sbuf_remove| W1[工作线程 1]
+    Q -->|sbuf_remove| W2[工作线程 2]
+    Q -->|sbuf_remove| W3[工作线程 3]
+    Q -->|sbuf_remove| WN[工作线程 N]
+
+    style P fill:#bbdefb
+    style Q fill:#fff9c4
+    style W1 fill:#c8e6c9
+    style W2 fill:#c8e6c9
+    style W3 fill:#c8e6c9
+    style WN fill:#c8e6c9
+```
+
+### 5.2 核心代码解析
+
+#### Sbuf：带信号量的共享缓冲区
+
+```c
+typedef struct {
+    int *buf;       // 缓冲区数组
+    int n;          // 缓冲区容量
+    int front;      // 队头索引
+    int rear;       // 队尾索引
+    sem_t mutex;    // 互斥信号量
+    sem_t slots;    // 空槽数量信号量
+    sem_t items;    // 已有项目数信号量
+} sbuf_t;
+
+void sbuf_insert(sbuf_t *sp, int item) {
+    P(&sp->slots);              // 等待空槽
+    P(&sp->mutex);              // 加锁
+    sp->buf[(++sp->rear) % sp->n] = item;  // 入队
+    V(&sp->mutex);              // 解锁
+    V(&sp->items);              // 增加项目数
+}
+
+int sbuf_remove(sbuf_t *sp) {
+    P(&sp->items);              // 等待有项目
+    P(&sp->mutex);              // 加锁
+    int item = sp->buf[(++sp->front) % sp->n];  // 出队
+    V(&sp->mutex);              // 解锁
+    V(&sp->slots);              // 增加空槽数
+    return item;
+}
+```
+
+> [!important] 信号量的顺序不能颠倒！
+> `sbuf_insert` 中先 `P(slots)` 再 `P(mutex)`，如果反过来，可能导致死锁：线程持有 mutex 但等待 slots，而其他线程无法获取 mutex 来释放 slots。
+
+#### 工作线程函数
+
+```c
+void *thread_toggle(void *vargp) {
+    sbuf_t *sp = (sbuf_t *)vargp;
+    Pthread_detach(pthread_self());
+
+    while (1) {
+        int conn_sock = sbuf_remove(sp);   // 阻塞等待任务
+        toggle(conn_sock, -1);             // 处理请求
+        Close(conn_sock);                  // 关闭连接
+    }
+    return NULL;
+}
+
+int main(int argc, char **argv) {
+    sbuf_t sbuf;
+    sbuf_init(&sbuf, SBUFSIZE);           // 初始化缓冲区
+
+    // 启动时创建 N 个工作线程
+    for (int i = 0; i < NTHREADS; i++)
+        Pthread_create(&tid, NULL, thread_toggle, &sbuf);
+
+    listen_sock = open_listen_sock(port);
+
+    while (1) {
+        conn_sock = accept(listen_sock, ...);
+        sbuf_insert(&sbuf, conn_sock);     // 主线程生产
+    }
+}
+```
+
+### 5.3 预线程模型的优势
+
+```
+传统模型（按需创建）             预线程模型（预先创建）
+accept --> fork/create           accept --> 入队
+  |                                |
+  +--> [创建开销] --> 处理        +--> [零开销] --> 工作线程直接处理
+```
+
+- **消除运行时创建开销**：线程在启动时一次性创建完毕
+- **控制并发度**：线程数固定，避免系统过载
+- **生产者-消费者解耦**：主线程只负责 accept，工作线程只负责处理
+
+---
+
+## 六、任务二~四：将 Toggle 服务器改造为 Weblet 服务器
+
+### 6.1 改造思路
+
+Toggle 服务器的核心逻辑是**大小写转换**，Weblet 服务器的核心逻辑是**HTTP 请求解析与响应**。改造的关键在于将 `toggle()` 函数替换为 HTTP 处理逻辑。
+
+```mermaid
+graph TD
+    A[Toggle 服务器] -->|替换核心处理函数| B[Weblet 服务器]
+
+    A --> A1["toggle(): 大小写转换"]
+    B --> B1["doit(): HTTP 请求处理"]
+
+    B1 --> B2[解析请求行 GET /path HTTP/1.1]
+    B1 --> B3[解析请求头]
+    B1 --> B4[构建响应: 静态/动态内容]
+    B1 --> B5[发送响应给客户端]
+```
+
+### 6.2 多进程 Weblet
+
+```c
+// 仿照 togglesp.c 的结构
+void sigchld_handler(int sig) {
+    while (waitpid(-1, 0, WNOHANG) > 0);
+}
+
+int main(int argc, char **argv) {
+    Signal(SIGCHLD, sigchld_handler);
+    listen_sock = open_listen_sock(port);
+
+    for (hit = 1; ; hit++) {
+        conn_sock = accept(listen_sock, ...);
+
+        if (Fork() == 0) {
+            close(listen_sock);
+            doit(conn_sock, hit);   // 替换为 HTTP 处理
+            close(conn_sock);
+            exit(0);
+        }
+        close(conn_sock);
+    }
+}
+```
+
+### 6.3 多线程 Weblet
+
+```c
+// 仿照 togglest.c 的结构
+void *thread_doit(void *vargp) {
+    int conn_sock = *((int *)vargp);
+    Free(vargp);
+    Pthread_detach(pthread_self());
+
+    doit(conn_sock, -1);           // HTTP 处理
+    Close(conn_sock);
+    return NULL;
+}
+
+int main(int argc, char **argv) {
+    listen_sock = open_listen_sock(port);
+
+    while (1) {
+        clientlen = sizeof(clientaddr);
+        conn_sock = accept(listen_sock, ...);
+
+        int *fdp = Malloc(sizeof(int));
+        *fdp = conn_sock;
+        Pthread_create(&tid, NULL, thread_doit, fdp);
+    }
+}
+```
+
+### 6.4 预线程 Weblet
+
+```c
+// 仿照 togglest_pre.c 的结构
+void *thread_doit(void *vargp) {
+    sbuf_t *sp = (sbuf_t *)vargp;
+    Pthread_detach(pthread_self());
+
+    while (1) {
+        int conn_sock = sbuf_remove(sp);
+        doit(conn_sock, -1);       // HTTP 处理
+        Close(conn_sock);
+    }
+}
+
+int main(int argc, char **argv) {
+    sbuf_t sbuf;
+    sbuf_init(&sbuf, SBUFSIZE);
+
+    for (int i = 0; i < NTHREADS; i++)
+        Pthread_create(&tid, NULL, thread_doit, &sbuf);
+
+    listen_sock = open_listen_sock(port);
+
+    while (1) {
+        conn_sock = accept(listen_sock, ...);
+        sbuf_insert(&sbuf, conn_sock);
+    }
+}
+```
+
+---
+
+## 七、任务五：性能对比测试（http_load）
+
+### 7.1 测试方法
+
+```bash
+# 生成 URL 文件
+echo "http://localhost:8080/index.html" > urls.txt
+
+# 使用 http_load 进行压力测试
+# -p 并发数，-s 测试时间（秒）
+http_load -p 10 -s 10 urls.txt    # 10 并发，持续 10 秒
+http_load -p 50 -s 10 urls.txt    # 50 并发，持续 10 秒
+http_load -p 100 -s 10 urls.txt   # 100 并发，持续 10 秒
+http_load -p 200 -s 10 urls.txt   # 200 并发，持续 10 秒
+```
+
+### 7.2 测试结果记录模板
+
+| 并发数 | 多进程 (req/s) | 多线程 (req/s) | 预线程 (req/s) | 线程池 (req/s) |
+|--------|---------------|---------------|---------------|---------------|
+| 10 | | | | |
+| 50 | | | | |
+| 100 | | | | |
+| 200 | | | | |
+
+### 7.3 预期结论
+
+> [!abstract] 性能排序
+> **线程池 >= 预线程 > 多线程 > 多进程**
+>
+> - **多进程**：`fork()` 开销随并发数增加显著上升
+> - **多线程**：`pthread_create` 比 `fork` 轻量，但仍有创建开销
+> - **预线程**：启动时创建线程池，运行时零创建开销
+> - **线程池**：在预线程基础上增加了线程复用和动态管理
+
+---
+
+## 八、关键知识点总结
+
+### fork 与 pthread_create 的对比
+
+| 特性 | fork (多进程) | pthread_create (多线程) |
+|------|--------------|------------------------|
+| 地址空间 | 复制（写时复制） | 共享 |
+| 创建开销 | 大（页表复制） | 较小 |
+| 通信方式 | 进程间通信（管道等） | 直接共享内存 |
+| 崩溃隔离 | 互相隔离 | 一个线程崩溃可能影响全部 |
+| 文件描述符 | 复制 | 共享 |
+| 信号处理 | 各进程独立 | 需要协调 |
+
+### 信号量在生产者-消费者中的应用
+
+```mermaid
+sequenceDiagram
+    participant P as 生产者（主线程）
+    participant M as mutex
+    participant S as slots 信号量
+    participant I as items 信号量
+    participant C as 消费者（工作线程）
+
+    P->>S: P(slots) — 等待空槽
+    P->>M: P(mutex) — 加锁
+    P->>P: 插入任务到队列
+    P->>M: V(mutex) — 解锁
+    P->>I: V(items) — 通知有新任务
+
+    C->>I: P(items) — 等待任务
+    C->>M: P(mutex) — 加锁
+    C->>C: 从队列取出任务
+    C->>M: V(mutex) — 解锁
+    C->>S: V(slots) — 释放空槽
+    C->>C: 处理请求
+```
+
+---
+
+## 常见问题
+
+> [!failure] 问题：多进程版本出现僵尸进程
+> **原因**：未正确处理 `SIGCHLD` 信号，或信号处理函数中未使用 `WNOHANG` 循环回收。
+> **解决**：确保 `sigchld_handler` 中使用 `while (waitpid(-1, 0, WNOHANG) > 0);`
+
+> [!failure] 问题：多线程版本出现段错误（Segmentation Fault）
+> **原因**：传递给线程的参数在主线程中被覆盖。
+> **解决**：为每个线程 `malloc` 独立的参数结构体，不要传递局部变量的地址。
+
+> [!failure] 问题：预线程版本程序卡死不响应
+> **原因**：信号量使用顺序错误导致死锁。
+> **解决**：`sbuf_insert` 中先 `P(slots)` 后 `P(mutex)`；`sbuf_remove` 中先 `P(items)` 后 `P(mutex)`。
+
+---
+
+## 扩展阅读
+
+- [[06_进程控制]] — fork、waitpid、信号处理详细原理
+- [[07_多线程编程]] — pthread 线程编程详解
+- [[10_并发服务器]] — 三种并发模型的理论对比
+- [[实践01_Web服务器初步实现]] — 实验一基础 Web 服务器
diff --git a/操作系统/操作系统实践/实践03_线程池与业务分割.md b/操作系统/操作系统实践/实践03_线程池与业务分割.md
new file mode 100644
index 0000000..4e47f2e
--- /dev/null
+++ b/操作系统/操作系统实践/实践03_线程池与业务分割.md
@@ -0,0 +1,675 @@
+# 实践03 Web服务器的线程池和业务分割模型
+
+> [!abstract] 实验概要
+> - **实验名称**: 实验三. Web服务器的线程池和业务分割模型
+> - **实验目的**: 将webserver改造为预线程版本和业务分割模型，并进行性能测试，掌握并行网络服务器的设计、性能测试和优化方法
+> - **前置知识**: [[07_多线程编程]]、[[10_并发服务器]]、[[实践02_多进程多线程服务器]]
+> - **核心概念**: 线程池、生产者-消费者模型、业务分割、性能测试
+
+---
+
+## 一、实验目的
+
+1. 理解预线程化（prethreading）服务器的工作原理
+2. 掌握线程池的设计与实现方法
+3. 理解业务分割模型的架构思想
+4. 学会使用 `http_load` 进行服务器性能测试
+5. 掌握使用 `vmstat`、`iostat`、`gprof` 等工具监测系统性能
+6. 通过对比分析，理解不同并发模型的性能差异
+
+---
+
+## 二、涉及知识点
+
+- POSIX 线程池设计（详见 [[07_多线程编程]]）
+- 生产者-消费者模型与信号量同步
+- 预线程化服务器模型（详见 [[10_并发服务器]]）
+- 业务分割（Pipeline）并行模型
+- 消息队列设计与实现
+- 性能测试工具：`http_load`、`vmstat`、`iostat`、`gprof`
+- 并行服务器的性能瓶颈分析与优化
+
+---
+
+## 三、源代码文件清单
+
+| 文件名 | 说明 |
+|--------|------|
+| `taskline.c` / `taskline.h` | 预线程服务器任务管理程序 |
+| `pool.c` / `pool.h` | 线程池服务器的线程管理和任务管理程序 |
+| `urls` | `http_load` 测试 URL 列表 |
+
+> [!tip] 编译命令
+> 使用调试模式编译：
+> ```bash
+> make M="-DDEBUG" rebuild
+> ```
+
+---
+
+## 四、实验任务
+
+### 任务一：准备工作
+
+将源代码复制到 Ubuntu 环境并编译：
+
+```bash
+# 复制源代码到工作目录
+cp -r /path/to/source/* ./
+
+# 使用调试模式编译
+make M="-DDEBUG" rebuild
+```
+
+> [!warning] 注意事项
+> 确保系统已安装 `http_load` 工具，如未安装：
+> ```bash
+> sudo apt-get install http-load
+> ```
+
+### 任务二：阅读和理解线程池实现
+
+阅读并理解 `togglest_pool.c` 的线程池实现，编译运行验证其正确性。
+
+#### 线程池核心数据结构
+
+```c
+/* pool.h - 线程池定义 */
+typedef struct {
+    pthread_t *threads;       /* 线程数组 */
+    int thread_count;         /* 线程数量 */
+    int *task_queue;          /* 任务队列（socket fd） */
+    int queue_size;           /* 队列容量 */
+    int front;                /* 队头指针 */
+    int rear;                 /* 队尾指针 */
+    int count;                /* 当前队列中任务数 */
+    pthread_mutex_t mutex;    /* 互斥锁 */
+    sem_t slots;              /* 空闲槽位信号量 */
+    sem_t items;              /* 可用任务信号量 */
+    int shutdown;             /* 关闭标志 */
+} thread_pool_t;
+```
+
+#### 线程池核心操作
+
+```c
+/* pool.c - 线程池操作实现 */
+
+/* 初始化线程池 */
+void pool_init(thread_pool_t *pool, int threads, int queue_size) {
+    pool->threads = (pthread_t *)malloc(threads * sizeof(pthread_t));
+    pool->task_queue = (int *)malloc(queue_size * sizeof(int));
+    pool->thread_count = threads;
+    pool->queue_size = queue_size;
+    pool->front = pool->rear = pool->count = 0;
+    pool->shutdown = 0;
+
+    pthread_mutex_init(&pool->mutex, NULL);
+    sem_init(&pool->slots, 0, queue_size);
+    sem_init(&pool->items, 0, 0);
+
+    /* 预创建所有工作线程 */
+    for (int i = 0; i < threads; i++) {
+        pthread_create(&pool->threads[i], NULL, worker, (void *)pool);
+    }
+}
+
+/* 向任务队列添加任务（生产者） */
+void pool_enqueue(thread_pool_t *pool, int conn_fd) {
+    sem_wait(&pool->slots);          /* 等待空闲槽位 */
+    pthread_mutex_lock(&pool->mutex); /* 进入临界区 */
+    pool->task_queue[pool->rear] = conn_fd;
+    pool->rear = (pool->rear + 1) % pool->queue_size;
+    pool->count++;
+    pthread_mutex_unlock(&pool->mutex);
+    sem_post(&pool->items);          /* 通知有新任务 */
+}
+
+/* 从任务队列取出任务（消费者） */
+int pool_dequeue(thread_pool_t *pool) {
+    sem_wait(&pool->items);          /* 等待可用任务 */
+    pthread_mutex_lock(&pool->mutex); /* 进入临界区 */
+    int conn_fd = pool->task_queue[pool->front];
+    pool->front = (pool->front + 1) % pool->queue_size;
+    pool->count--;
+    pthread_mutex_unlock(&pool->mutex);
+    sem_post(&pool->slots);          /* 释放槽位 */
+    return conn_fd;
+}
+
+/* 工作线程主函数 */
+void *worker(void *arg) {
+    thread_pool_t *pool = (thread_pool_t *)arg;
+    while (1) {
+        int conn_fd = pool_dequeue(pool);  /* 取出任务 */
+        if (conn_fd < 0) break;            /* 收到关闭信号 */
+        handle_request(conn_fd);           /* 处理 HTTP 请求 */
+        close(conn_fd);                    /* 关闭连接 */
+    }
+    return NULL;
+}
+```
+
+#### 线程池工作流程
+
+```
+主线程(Accept) --> 任务队列 --> 工作线程1 (处理请求)
+                   [conn_fd] --> 工作线程2 (处理请求)
+                           --> 工作线程N (处理请求)
+```
+
+> [!info] 生产者-消费者模型
+> 线程池本质上是一个 **多生产者-多消费者** 模型：
+> - **生产者**：主线程不断 `accept` 新连接，将 `conn_fd` 放入队列
+> - **消费者**：工作线程从队列取出 `conn_fd`，处理 HTTP 请求
+> - 信号量 `slots` 和 `items` 实现了线程间的同步
+>
+> 该模型在 [[07_多线程编程]] 中已有详细讨论，此处是其在网络服务器中的实际应用。
+
+### 任务三：实现 Web 服务器线程池版本
+
+仿照 `togglest_pool.c` 的设计，将 webserver 改造为线程池版本，并使用 `http_load` 测试性能。
+
+#### 编译与运行
+
+```bash
+# 编译线程池版 webserver
+make M="-DDEBUG" rebuild
+
+# 启动服务器
+./webserver 8080
+
+# 另一终端：http_load 性能测试
+http_load -parallel 5 -fetches 50 -seconds 20 urls
+```
+
+#### urls 文件示例
+
+```
+http://localhost:8080/index.html
+http://localhost:8080/test.html
+http://localhost:8080/image.jpg
+```
+
+> [!example] http_load 参数说明
+> | 参数 | 含义 |
+> |------|------|
+> | `-parallel N` | 并发连接数为 N |
+> | `-fetches N` | 总共发起 N 次请求 |
+> | `-seconds N` | 测试持续 N 秒 |
+>
+> 两参数同时指定时，先满足的条件生效。
+
+### 任务四：设计实现业务分割模型
+
+将 webserver 改造为业务分割模型，将 HTTP 请求处理拆分为三个阶段，每个阶段由独立的线程池负责。
+
+#### 业务分割架构图
+
+```mermaid
+graph LR
+    C[客户端请求] --> A[read msg<br/>threadpool]
+    A -->|文件名 + socket| Q1[filename<br/>queue]
+    Q1 --> B[read file<br/>threadpool]
+    B -->|内容 + socket| Q2[msg<br/>queue]
+    Q2 --> D[send msg<br/>threadpool]
+    D --> R[客户端响应]
+
+    style A fill:#4CAF50,color:#fff
+    style B fill:#2196F3,color:#fff
+    style D fill:#FF9800,color:#fff
+    style Q1 fill:#E91E63,color:#fff
+    style Q2 fill:#9C27B0,color:#fff
+```
+
+#### 业务分割详细流程
+
+```mermaid
+graph TB
+    subgraph "阶段一：消息读取与解析"
+        A1[线程从 socket 读取 HTTP 请求] --> A2[解析请求行<br/>GET /path HTTP/1.1]
+        A2 --> A3[提取文件名]
+        A3 --> A4[将 filename + conn_fd<br/>加入 filename queue]
+    end
+
+    subgraph "阶段二：文件读取"
+        B1[线程从 filename queue<br/>取出 filename + conn_fd] --> B2[打开并读取文件内容]
+        B2 --> B3[构造 HTTP 响应]
+        B3 --> B4[将 response + conn_fd<br/>加入 msg queue]
+    end
+
+    subgraph "阶段三：响应发送"
+        C1[线程从 msg queue<br/>取出 response + conn_fd] --> C2[通过 socket<br/>发送 HTTP 响应]
+        C2 --> C3[关闭连接]
+    end
+
+    A4 --> B1
+    B4 --> C1
+
+    style A1 fill:#4CAF50,color:#fff
+    style B1 fill:#2196F3,color:#fff
+    style C1 fill:#FF9800,color:#fff
+```
+
+#### 消息传递时序图
+
+```mermaid
+sequenceDiagram
+    participant Client as 客户端
+    participant RM as read msg<br/>threadpool
+    participant FQ as filename<br/>queue
+    participant RF as read file<br/>threadpool
+    participant MQ as msg<br/>queue
+    participant SM as send msg<br/>threadpool
+
+    Client->>RM: HTTP 请求 (socket)
+    activate RM
+    RM->>RM: 读取 socket 数据
+    RM->>RM: 解析 HTTP 请求<br/>提取 filename
+    RM->>FQ: enqueue(filename, socket)
+    deactivate RM
+
+    FQ->>RF: dequeue(filename, socket)
+    activate RF
+    RF->>RF: 打开文件
+    RF->>RF: 读取文件内容
+    RF->>RF: 构造 HTTP 响应
+    RF->>MQ: enqueue(response, socket)
+    deactivate RF
+
+    MQ->>SM: dequeue(response, socket)
+    activate SM
+    SM->>Client: 发送 HTTP 响应
+    SM->>SM: 关闭连接
+    deactivate SM
+```
+
+#### 三个线程池的职责
+
+> [!note] 线程池一：read msg threadpool
+> - **职责**: 从 socket 读取 HTTP 请求消息并解析
+> - **输入**: 客户端的 socket 连接
+> - **处理**: 调用 `recv()` 读取数据，解析请求行获取文件名
+> - **输出**: 将 `filename + conn_fd` 加入 filename queue
+> - **关键点**: I/O 密集型操作，需要处理不完整读取
+
+> [!note] 线程池二：read file threadpool
+> - **职责**: 根据文件名读取文件内容
+> - **输入**: 从 filename queue 取出的 `filename + conn_fd`
+> - **处理**: 打开文件、读取内容、构造 HTTP 响应头和正文
+> - **输出**: 将 `response + conn_fd` 加入 msg queue
+> - **关键点**: 磁盘 I/O 密集型操作，是性能瓶颈之一
+
+> [!note] 线程池三：send msg threadpool
+> - **职责**: 将 HTTP 响应发送回客户端
+> - **输入**: 从 msg queue 取出的 `response + conn_fd`
+> - **处理**: 调用 `send()` 发送响应数据
+> - **输出**: 关闭 socket 连接
+> - **关键点**: 网络 I/O 密集型操作
+
+#### 两个消息队列
+
+> [!important] 消息队列设计
+> 消息队列是线程池之间通信的桥梁，采用生产者-消费者模型实现：
+>
+> **filename queue**:
+> - 生产者: read msg threadpool
+> - 消费者: read file threadpool
+> - 数据: `{char filename[256], int conn_fd}`
+>
+> **msg queue**:
+> - 生产者: read file threadpool
+> - 消费者: send msg threadpool
+> - 数据: `{char *response, int length, int conn_fd}`
+
+#### 消息队列核心实现
+
+```c
+/* 消息队列数据结构 */
+typedef struct {
+    int conn_fd;
+    char filename[256];     /* filename queue 使用 */
+    char *response;         /* msg queue 使用 */
+    int response_len;       /* 响应长度 */
+} queue_item_t;
+
+typedef struct {
+    queue_item_t *items;
+    int capacity;
+    int front;
+    int rear;
+    int count;
+    pthread_mutex_t mutex;
+    sem_t slots;
+    sem_t items_sem;
+} message_queue_t;
+
+/* 初始化消息队列 */
+void mq_init(message_queue_t *mq, int capacity) {
+    mq->items = (queue_item_t *)calloc(capacity, sizeof(queue_item_t));
+    mq->capacity = capacity;
+    mq->front = mq->rear = mq->count = 0;
+    pthread_mutex_init(&mq->mutex, NULL);
+    sem_init(&mq->slots, 0, capacity);
+    sem_init(&mq->items_sem, 0, 0);
+}
+
+/* 入队操作 */
+void mq_enqueue(message_queue_t *mq, queue_item_t *item) {
+    sem_wait(&mq->slots);
+    pthread_mutex_lock(&mq->mutex);
+    mq->items[mq->rear] = *item;
+    mq->rear = (mq->rear + 1) % mq->capacity;
+    mq->count++;
+    pthread_mutex_unlock(&mq->mutex);
+    sem_post(&mq->items_sem);
+}
+
+/* 出队操作 */
+void mq_dequeue(message_queue_t *mq, queue_item_t *item) {
+    sem_wait(&mq->items_sem);
+    pthread_mutex_lock(&mq->mutex);
+    *item = mq->items[mq->front];
+    mq->front = (mq->front + 1) % mq->capacity;
+    mq->count--;
+    pthread_mutex_unlock(&mq->mutex);
+    sem_post(&mq->slots);
+}
+```
+
+#### 业务分割服务器主框架
+
+```c
+/* taskline.c - 业务分割 webserver 主框架 */
+#include "taskline.h"
+#include "pool.h"
+
+#define READ_MSG_THREADS    4   /* 读消息线程池大小 */
+#define READ_FILE_THREADS   4   /* 读文件线程池大小 */
+#define SEND_MSG_THREADS    4   /* 发送消息线程池大小 */
+#define QUEUE_CAPACITY      64  /* 消息队列容量 */
+
+/* 两个消息队列 */
+message_queue_t filename_queue;  /* 文件名队列 */
+message_queue_t msg_queue;       /* 响应消息队列 */
+
+/* 阶段一：读取并解析 HTTP 请求 */
+void *read_msg_worker(void *arg) {
+    while (1) {
+        int conn_fd = pool_dequeue(&read_msg_pool);
+
+        char buf[8192];
+        int n = recv(conn_fd, buf, sizeof(buf) - 1, 0);
+        if (n <= 0) { close(conn_fd); continue; }
+        buf[n] = '\0';
+
+        /* 解析 HTTP 请求 */
+        char method[16], path[256], version[16];
+        sscanf(buf, "%s %s %s", method, path, version);
+
+        /* 构造文件路径 */
+        char filename[256];
+        snprintf(filename, sizeof(filename), ".%s", path);
+
+        /* 将 filename + conn_fd 加入 filename queue */
+        queue_item_t item;
+        item.conn_fd = conn_fd;
+        strncpy(item.filename, filename, sizeof(item.filename));
+        mq_enqueue(&filename_queue, &item);
+    }
+    return NULL;
+}
+
+/* 阶段二：读取文件内容 */
+void *read_file_worker(void *arg) {
+    while (1) {
+        queue_item_t item;
+        mq_dequeue(&filename_queue, &item);
+
+        /* 打开并读取文件 */
+        int fd = open(item.filename, O_RDONLY);
+        if (fd < 0) {
+            /* 文件不存在，构造 404 响应 */
+            item.response = build_404_response(&item.response_len);
+        } else {
+            /* 读取文件，构造 200 响应 */
+            item.response = build_200_response(fd, &item.response_len);
+            close(fd);
+        }
+
+        /* 将 response + conn_fd 加入 msg queue */
+        mq_enqueue(&msg_queue, &item);
+    }
+    return NULL;
+}
+
+/* 阶段三：发送 HTTP 响应 */
+void *send_msg_worker(void *arg) {
+    while (1) {
+        queue_item_t item;
+        mq_dequeue(&msg_queue, &item);
+
+        /* 发送响应 */
+        send(item.conn_fd, item.response, item.response_len, 0);
+        free(item.response);
+        close(item.conn_fd);
+    }
+    return NULL;
+}
+
+int main(int argc, char **argv) {
+    if (argc != 2) {
+        fprintf(stderr, "Usage: %s <port>\n", argv[0]);
+        exit(1);
+    }
+
+    /* 初始化两个消息队列 */
+    mq_init(&filename_queue, QUEUE_CAPACITY);
+    mq_init(&msg_queue, QUEUE_CAPACITY);
+
+    /* 初始化三个线程池 */
+    pool_init(&read_msg_pool,  READ_MSG_THREADS,  QUEUE_CAPACITY);
+    pool_init(&read_file_pool, READ_FILE_THREADS, QUEUE_CAPACITY);
+    pool_init(&send_msg_pool,  SEND_MSG_THREADS,  QUEUE_CAPACITY);
+
+    /* 启动三个阶段的工作线程 */
+    pthread_t tid;
+    for (int i = 0; i < READ_MSG_THREADS; i++)
+        pthread_create(&tid, NULL, read_msg_worker, NULL);
+    for (int i = 0; i < READ_FILE_THREADS; i++)
+        pthread_create(&tid, NULL, read_file_worker, NULL);
+    for (int i = 0; i < SEND_MSG_THREADS; i++)
+        pthread_create(&tid, NULL, send_msg_worker, NULL);
+
+    /* 主线程接受连接 */
+    int listen_fd = open_listen_sock(atoi(argv[1]));
+    printf("业务分割 webserver 启动，端口 %s\n", argv[1]);
+
+    while (1) {
+        struct sockaddr_in cliaddr;
+        socklen_t clien = sizeof(cliaddr);
+        int conn_fd = accept(listen_fd,
+                             (struct sockaddr *)&cliaddr, &clien);
+        if (conn_fd < 0) continue;
+
+        /* 将新连接放入 read msg 线程池的任务队列 */
+        pool_enqueue(&read_msg_pool, conn_fd);
+    }
+
+    return 0;
+}
+```
+
+> [!tip] 与 [[实践02_多进程多线程服务器]] 的对比
+> - 实践02 中每个请求由单个线程串行完成「读消息 -> 读文件 -> 发送响应」全部工作
+> - 本实验将三个阶段拆分到不同的线程池，实现了 **流水线并行**
+> - 当一个线程在发送响应时，其他线程已经在处理新请求的文件读取，提高了吞吐量
+
+---
+
+## 五、性能测试
+
+### 5.1 http_load 测试
+
+```bash
+# 低并发测试
+http_load -parallel 5 -fetches 50 -seconds 20 urls
+
+# 中并发测试
+http_load -parallel 20 -fetches 200 -seconds 20 urls
+
+# 高并发测试
+http_load -parallel 50 -fetches 500 -seconds 20 urls
+```
+
+> [!example] http_load 输出指标
+> | 指标 | 含义 |
+> |------|------|
+> | fetches | 成功完成的请求总数 |
+> | elapsed | 测试耗时（秒） |
+> | mean bytes/transfer | 平均每次传输字节数 |
+> | fetches/sec | 每秒完成的请求数（吞吐量） |
+> | msecs/connect | 平均连接建立时间 |
+> | msecs/first-response | 平均首字节响应时间 |
+> | HTTP response codes | 各状态码的出现次数 |
+
+### 5.2 系统性能监测
+
+#### vmstat 监控
+
+```bash
+# 每 2 秒采集一次，共 10 次
+vmstat 2 10
+```
+
+> [!info] vmstat 关键字段
+> | 字段 | 含义 |
+> |------|------|
+> | `r` | 运行队列中的进程数 |
+> | `b` | 阻塞等待 I/O 的进程数 |
+> | `us` | 用户态 CPU 占用百分比 |
+> | `sy` | 内核态 CPU 占用百分比 |
+> | `wa` | I/O 等待 CPU 时间百分比 |
+> | `free` | 空闲内存（KB） |
+> | `buff` | 缓冲区大小（KB） |
+
+#### iostat 监控
+
+```bash
+# 每 2 秒采集一次，共 10 次
+iostat -k 2 10
+```
+
+> [!info] iostat 关键字段
+> | 字段 | 含义 |
+> |------|------|
+> | `tps` | 每秒传输次数 |
+> | `kB_read/s` | 每秒读取数据量（KB） |
+> | `kB_wrtn/s` | 每秒写入数据量（KB） |
+> | `await` | 平均 I/O 等待时间（ms） |
+> | `util` | 设备利用率百分比 |
+
+#### gprof 性能分析
+
+```bash
+# 编译时加入性能分析选项
+gcc -pg -o webserver webserver.c pool.c taskline.c -lpthread
+
+# 运行服务器并进行测试
+./webserver 8080 &
+http_load -parallel 20 -fetches 200 -seconds 20 urls
+
+# 生成性能分析报告
+gprof ./webserver gmon.out > perf.txt
+cat perf.txt
+```
+
+> [!warning] gprof 使用注意
+> 1. 编译时必须加 `-pg` 选项
+> 2. 程序需要正常退出（`Ctrl+C` 终止可能无法生成 `gmon.out`）
+> 3. 分析结果包括各函数的调用次数和执行时间占比
+
+### 5.3 性能监测指标
+
+> [!important] 实验需要监测的关键指标
+>
+> **线程池指标**:
+> - 线程池中线程的 **平均活跃时间** 及 **阻塞时间**
+> - 线程 **最高/最低/平均活跃数量**
+>
+> **消息队列指标**:
+> - filename queue 中的消息长度（积压情况）
+> - msg queue 中的消息长度（积压情况）
+>
+> **系统资源指标**:
+> - 系统 I/O 使用率（`iostat`）
+> - 内存使用情况（`vmstat`）
+> - CPU 使用率和等待率（`vmstat`）
+
+---
+
+## 六、性能对比分析
+
+### 不同模型的性能对比
+
+| 模型 | 优点 | 缺点 | 适用场景 |
+|------|------|------|----------|
+| 迭代式服务器 | 实现简单 | 无法并发处理 | 学习演示 |
+| 多进程服务器（[[实践02_多进程多线程服务器]]） | 进程隔离，稳定性好 | fork 开销大 | 连接数少 |
+| 多线程服务器（[[实践02_多进程多线程服务器]]） | 共享内存，开销小 | 线程数爆炸风险 | 通用场景 |
+| 预线程化服务器 | 线程复用，无创建开销 | 固定线程数 | 高并发 |
+| 业务分割模型 | 流水线并行，吞吐量高 | 复杂度高，队列延迟 | 极高并发 |
+
+### 业务分割模型的优缺点
+
+> [!success] 优势
+> 1. **流水线并行**: 三个阶段可以同时处理不同的请求
+> 2. **资源隔离**: I/O 密集操作和计算操作分别由不同线程池处理
+> 3. **可独立扩展**: 每个阶段的线程数可以根据瓶颈独立调整
+> 4. **缓存友好**: 文件读取线程可以实现文件内容缓存
+
+> [!failure] 劣势
+> 1. **复杂度高**: 需要管理多个线程池和消息队列
+> 2. **队列延迟**: 消息在队列中排队等待会产生额外延迟
+> 3. **内存开销**: 消息队列和中间数据结构占用额外内存
+> 4. **调试困难**: 多线程池间的数据流转增加了调试难度
+
+---
+
+## 七、常见问题与解决
+
+| 问题 | 原因 | 解决方法 |
+|------|------|----------|
+| 编译报错 `undefined reference to pthread` | 未链接 pthread 库 | 编译时加 `-lpthread` |
+| 队列满导致线程阻塞 | 消息队列容量不足 | 增大 `QUEUE_CAPACITY` 或增加下游线程数 |
+| 文件读取阶段成为瓶颈 | 磁盘 I/O 速度限制 | 增加 read file 线程数，或引入文件缓存 |
+| 内存泄漏 | response 未 `free` | 确保 send 线程发送后释放内存 |
+| 连接泄漏 | 异常路径未 `close(conn_fd)` | 在每个异常处理分支都关闭 socket |
+| 线程安全问题 | 共享变量未加锁 | 使用互斥锁保护所有共享数据 |
+| http_load 测试连接被拒 | 服务器未启动或端口错误 | 确认服务器运行状态和端口号 |
+
+---
+
+## 八、实验总结
+
+通过本实验，应掌握以下能力：
+
+1. **线程池设计与实现**: 理解预线程化技术，掌握基于生产者-消费者模型的线程池实现方法
+2. **业务分割架构**: 理解将复杂业务拆分为多个阶段并行处理的设计思想
+3. **消息队列设计**: 掌握线程间安全通信的消息队列实现
+4. **性能测试方法**: 学会使用 `http_load`、`vmstat`、`iostat`、`gprof` 等工具进行全面的性能测试
+5. **性能优化思路**: 通过对比分析不同模型的性能指标，理解并发服务器的优化方向
+
+> [!question] 思考题
+> 1. 如果文件读取阶段成为瓶颈，除了增加线程数外，还有哪些优化策略？
+> 2. 业务分割模型中，如何确定每个线程池的最佳线程数量？
+> 3. 与 [[10_并发服务器]] 中的预线程化模型相比，业务分割模型在什么场景下优势更明显？
+> 4. 如果需要支持动态内容（如 CGI），业务分割模型应如何调整？
+
+---
+
+## 相关链接
+
+- [[07_多线程编程]] - pthread 编程基础、生产者-消费者模型
+- [[10_并发服务器]] - 预线程化服务器模型
+- [[实践02_多进程多线程服务器]] - 多进程和多线程服务器实现