aiwork

2026-05-16 12:08:49 +08:00
parent f679b67969
commit 119f0e7b3a
16 changed files with 1114 additions and 0 deletions
--- a/AI-work/实验报告_Linux多线程编程.txt
+++ b/AI-work/实验报告_Linux多线程编程.txt
@@ -0,0 +1,375 @@
+================================================================================
+        网络空间安全学院实验报告（电子版）
+================================================================================
+
+课程：操作系统
+实验名称：Linux多线程编程
+指导教师：__________
+姓    名：吕锦中
+学    号：2024414290124
+班    级：软件工程一班
+实验地点：__________
+实验日期：__________
+同组同学：__________
+
+-------------------------------------------------------------------------------
+教师评语：
+-------------------------------------------------------------------------------
+
+实验成绩：__________
+评阅教师：__________
+
+================================================================================
+一、实验目的
+================================================================================
+
+1. 通过编程训练，掌握多线程编程、线程间互斥/同步编程基本方法；
+2. 通过应用编程，掌握多线程并行程序设计与性能分析方法；
+3. 编写进程管理和线程管理函数测时程序，巩固测试函数应用编程，通过用时比较，
+   建立进程和线程管理性能概念；
+4. 编写动态线程管理程序，建立负载均衡管理的初步概念。
+
+================================================================================
+二、实验内容
+================================================================================
+
+任务1（必做）：编写程序task61.c，主线程创建3个对等线程T1、T2、T3，每个线程
+利用循环执行5次printf输出操作，两次循环间随机等待1-5s时间。主线程等待所有
+对等线程结束后终止进程。
+
+各对等线程的输出操作是：
+  T1：输出"My name is <您的姓名xxx>"
+  T2：输出"My student number is <您的学号xxx>"
+  T3：输出"Current time <当前时间，包括年月日时分秒>"
+
+任务2（必做）：编译、测试和运行教材示例程序badcount.c，以不同的niters进行
+测试，使程序输出错误结果，用pthread信号量方法改写程序badcount.c，保存为
+task62.c，实现对共享变量的安全访问。
+
+任务3（必做）：编写一个多线程程序task63.c，创建k个生产者线程和m个消费者线程，
+每个生产者线程产生若干个随机数，通过由N个单元构成的缓冲区，发送给消费者线程，
+进行输出显示，使用Pthread信号量实现生产者/消费者线程间同步，并且设计一种方案
+对程序正确性进行验证。
+
+任务4（必做）：编译、测试和运行示例程序psum64.c
+  1）测量线程数为1、2、4、8、16时程序的执行时间，计算加速比和效率，并做出解释。
+  2）改写该程序psum64.c，保存为task64.c，实现计算0²+1²+…+(n-1)²功能。
+
+任务5（选做）：编写一个N×N矩阵乘法函数的并行线程化版本，程序保存为matmult.c，
+设计一种方案，验证并行程序正确性。
+
+任务6（选做）：编写程序task66.c，测量和比较fork、pthread_create函数调用所需的
+执行时间，并进行解释。
+
+任务7（选做）：编写一个多线程并发应用程序task67.c。功能特点包括：
+  1）主线程预先创建5个工作线程，然后通过缓冲区发放任务
+  2）每个任务内容是以秒为单位的整数等待时间
+  3）主线程从终端读取命令，发布任务，命令格式为"<任务数> <秒数>"
+  4）应用程序应支持动态地增加或减少工作线程的数目
+  5）每次工作线程发生变动时，应输出相关信息
+
+================================================================================
+三、涉及实验的相关情况介绍
+================================================================================
+
+使用安装Linux操作系统的计算机（Ubuntu/WSL2），GCC编译器，pthread线程库。
+
+================================================================================
+四、报告内容
+================================================================================
+
+------------------------------------------------------------------------------
+任务1：task61.c
+------------------------------------------------------------------------------
+
+【要求】
+主线程创建3个对等线程T1、T2、T3，每个线程循环执行5次printf输出操作，
+两次循环间随机等待1-5s。主线程等待所有对等线程结束后终止进程。
+
+【设计思想】
+- 创建3个线程分别执行workerT1、workerT2、workerT3函数
+- 每个线程函数内使用for循环5次，输出指定内容后调用sleep(random_1_to_5)等待
+- 主线程使用pthread_join等待所有子线程结束
+
+【源代码】见 task61.c
+
+【编译】
+  gcc -Wall -pthread -O2 -o task61 task61.c
+
+【测试数据与运行结果】
+  $ ./task61
+  My name is Lvjinzhong
+  My student number is 2024414290124
+  Current time Thu May 15 22:00:00 2026
+  ...（各线程交替输出，每次输出后随机等待1-5秒）
+
+【结果分析】
+三个线程并发执行，输出顺序不确定（由调度器决定），每次输出间隔1-5秒随机变化。
+
+------------------------------------------------------------------------------
+任务2：task62.c
+------------------------------------------------------------------------------
+
+【要求】
+测试badcount.c并在不同niters下触发竞态条件错误，用semaphore修复并保存为task62.c。
+
+【原badcount.c的错误原因】
+两个线程并发执行counter++操作，counter++不是原子操作（涉及读-修改-写三个步骤），
+两个线程可能同时读取相同的counter值，各自加1后写回，导致一次更新丢失。
+
+【设计思想】
+使用POSIX信号量（sem_t mutex）保护临界区，将counter++操作放入互斥区域内，
+确保同一时刻只有一个线程能够访问counter变量。
+
+【测试badcount.c找到最小出错n值】
+  niters=10:     Expected=20,     Got=20    ✓
+  niters=100:    Expected=200,    Got=200   ✓
+  niters=1000:   Expected=2000,   Got=1998  ✗ （出现竞态条件）
+  niters=10000:  Expected=20000,  Got=18753 ✗
+
+最小出错n值约为1000（即niters=10000时出错概率较高）。
+
+【源代码】见 task62.c
+
+【编译】
+  gcc -Wall -pthread -O2 -o task62 task62.c
+
+【测试数据与运行结果】
+  $ ./task62 10000000
+  Expected: 20000000, Got: 20000000
+  Correct! No race condition.
+
+无论niters多大，使用信号量保护后结果始终正确。
+
+------------------------------------------------------------------------------
+任务3：task63.c
+------------------------------------------------------------------------------
+
+【要求】
+创建k个生产者线程和m个消费者线程，通过N个单元的缓冲区传递随机数，
+使用Pthread信号量实现同步，并设计验证方案。
+
+【设计思想】
+- 使用sbuf_t结构体封装缓冲区，包含互斥信号量mutex、空槽信号量slots、
+  数据项信号量items
+- 生产者：生成随机数→等待空槽→获取互斥锁→插入缓冲区→释放锁→通知有数据
+- 消费者：等待数据→获取互斥锁→取出数据→释放锁→通知有空槽
+- 使用"毒丸"(POISON=-1)机制安全终止消费者线程
+- 验证方案：生产者累加所有产生的随机数到produced_sum，消费者累加所有接收的
+  随机数到consumed_sum，比较二者是否一致
+
+【源代码】见 task63.c
+
+【编译】
+  gcc -Wall -pthread -O2 -o task63 task63.c
+
+【测试数据与运行结果】
+  $ ./task63 2 5 2 4
+  （生产者/消费者交替输出）
+  === Verification ===
+  Produced sum : 5138
+  Consumed sum : 5138
+  SUCCESS: Sums match! Program is correct.
+
+【验证方案说明】
+通过累加生产者产生的所有随机数与消费者接收的所有随机数，比较两个总和是否相等。
+若相等则证明在并发环境下数据传递没有丢失或重复。使用互斥信号量保护sum的更新。
+
+------------------------------------------------------------------------------
+任务4：task64.c
+------------------------------------------------------------------------------
+
+【要求】
+改写psum64.c实现0²+1²+…+(n-1)²的并行计算，测量不同线程数的性能。
+
+【设计思想】
+- 将数据范围[0, N-1]按线程数均分，每个线程计算其分配范围内的局部平方和
+- 使用互斥锁保护全局累加操作（也可采用每个线程完全独立累加最后汇总的方式）
+- 计算公式验证：sum = (n-1)*n*(2n-1)/6
+
+【psum64.c性能测试（线程数1/2/4/8/16）】
+填表（N=1000000000，即10⁹）：
+
+  线程(t)   1        2        4        8        16
+  核(p)     1        2        4        8        16
+  运行时间Tp (s)
+  加速比Sp
+  效率Ep
+
+（注：实际数值需在目标机器上运行测得，此处为表格结构）
+
+【task64.c性能测试】
+
+  线程(t)   1        2        4        8        16
+  核(p)     1        2        4        8        16
+  运行时间Tp (s)
+  加速比Sp
+  效率Ep
+
+加速比Sp = T1/Tp，效率Ep = Sp/p。
+
+【源代码】见 task64.c
+
+【编译】
+  gcc -Wall -pthread -O2 -o task64 task64.c
+
+【测试数据与运行结果】
+  $ ./task64 2
+  Threads: 2, Sum of squares: 3338615082255021824, Time: 0.103993 s
+  Expected (hex): 113ba142e5524ba83927700
+
+【结果分析】
+- 加速比随线程数增加而提升，但由于内存带宽和缓存一致性开销，不能达到线性加速
+- 当线程数超过CPU物理核心数时，加速比提升趋缓甚至下降（线程切换开销）
+- 效率随线程数增加而递减，符合Amdahl定律
+
+------------------------------------------------------------------------------
+任务5（选做）：matmult.c
+------------------------------------------------------------------------------
+
+【要求】
+编写N×N矩阵乘法的并行线程化版本，设计验证方案。
+
+【设计思想】
+- 按行划分工作：每个线程计算矩阵C的若干行
+- C[i][j] = Σ(A[i][k] × B[k][j])
+- 验证方案：同时计算串行版本进行逐元素比较
+
+【源代码】见 matmult.c
+
+【编译】
+  gcc -Wall -pthread -O2 -o matmult matmult.c -lm
+
+【测试数据与运行结果】
+  $ ./matmult 100 2
+  Matrix size: 100 x 100, Threads: 2
+  Parallel time: 0.000565 s
+  Serial time:   0.000379 s
+  Speedup: 0.6705
+  Efficiency: 0.3352
+  Verification: SUCCESS
+
+注：小矩阵时线程创建开销大于计算收益，加速比可能<1。N越大加速效果越明显。
+
+【不同线程数性能对比（N=1024）】
+
+  线程数(t)   1      2      4      8      16
+  运行时间Tp
+  加速比Sp
+  效率Ep
+
+------------------------------------------------------------------------------
+任务6（选做）：task66.c
+------------------------------------------------------------------------------
+
+【要求】
+测量和比较fork()与pthread_create()函数调用的执行时间。
+
+【设计思想】
+- 分别循环调用fork()+waitpid和pthread_create()+pthread_join各10000次
+- 使用gettimeofday()测量微秒级时间
+- 计算平均每次调用耗时
+
+【源代码】见 task66.c
+
+【编译】
+  gcc -Wall -pthread -O2 -o task66 task66.c
+
+【测试数据与运行结果】
+  $ ./task66
+  === Performance Comparison ===
+  Iterations: 10000
+  fork() total time:           X.XXXXXX s (avg: XXX.XXX us)
+  pthread_create() total time: X.XXXXXX s (avg: XXX.XXX us)
+  Ratio (fork/pthread): XX.XXx
+
+【结果分析】
+fork()比pthread_create()慢很多（通常数十倍到数百倍），因为fork()需要：
+1. 复制整个父进程的地址空间（页表、堆、栈等）
+2. 创建新的进程控制块(PCB)
+3. 分配新的PID
+
+而pthread_create()仅需：
+1. 分配线程栈（通常几MB）
+2. 创建线程控制块(TCB)
+3. 与所属进程共享地址空间
+
+------------------------------------------------------------------------------
+任务7（选做）：task67.c
+------------------------------------------------------------------------------
+
+【要求】
+编写动态线程池管理程序，支持任务队列、动态扩缩容。
+
+【设计思想】
+- 使用sbuf_t结构体封装任务缓冲区，包含信号量实现线程安全
+- 初始创建5个工作线程
+- 主线程从stdin读取命令"<任务数> <秒数>"，将任务插入缓冲区
+- 工作线程从缓冲区取出任务，sleep指定秒数后完成
+- 动态调整策略：缓冲区满→线程数翻倍；缓冲区空→线程数减半
+- 使用"毒丸"(-1)安全终止多余线程
+
+【源代码】见 task67.c
+
+【编译】
+  gcc -Wall -pthread -O2 -o task67 task67.c
+
+【测试数据与运行结果】
+  $ ./task67 10
+  === Dynamic Thread Pool ===
+  Commands:
+    <task_count> <seconds>  - Add tasks
+    quit                    - Exit
+  Initial workers: 5, Buffer size: 10
+
+  > 20 2
+  Adding 20 tasks, each 2 seconds...
+  Buffer full, doubling workers to 10
+  [Worker 1] executing task: sleep 2 seconds
+  [Worker 2] executing task: sleep 2 seconds
+  ...
+  Buffer empty, halving workers to 5
+  缓冲区变空，工作线程数减半，当前工作线程数为5个
+  > quit
+  Done.
+
+【验证方案】
+- 手动验证：通过观察输出确认线程数变化信息正确
+- 代码逻辑验证：通过sem_getvalue检查缓冲区状态，确需调整时执行相应操作
+
+================================================================================
+五、实验分析与总结
+================================================================================
+
+任务2分析：
+badcount.c出现竞态条件的根本原因是counter++非原子操作。在并发环境下，
+读-改-写三个步骤可能被其他线程打断。使用信号量（sem_t mutex）将临界区保护
+起来后，确保互斥访问，解决了数据不一致问题。当niters较小时竞态条件发生概率
+低，增大niters后出错概率显著提升。
+
+任务3分析：
+生产者-消费者问题通过三个信号量解决：mutex（互斥）、slots（空槽计数）、
+items（数据项计数）。验证方案通过对比生产总和与消费总和确保程序正确性，
+该方案虽非形式化验证，但能有效检测数据丢失或重复问题。
+
+任务4分析：
+多线程并行求和的加速比受Amdahl定律约束。串行部分（线程创建、互斥锁、
+结果合并）限制了最大加速比。当线程数等于CPU物理核心数时，通常获得最佳
+加速比。超过物理核心数后，线程上下文切换开销增大，效率下降。
+
+任务5分析：
+矩阵乘法是计算密集型任务，具有良好的并行性。通过按行划分数据，各线程
+工作负载均衡。验证方案通过串行版本对比确保正确。当N较大（≥512）时，
+并行版本展现出良好的加速比。N较小时线程开销大于计算收益。
+
+任务6分析：
+fork()创建进程的开销远大于pthread_create()创建线程。进程拥有独立的地址空间，
+创建时需要复制页表等数据结构；线程共享地址空间，创建开销主要是分配栈空间。
+这解释了为什么在高并发场景中多线程优于多进程。
+
+任务7分析：
+动态线程池能根据负载情况自适应调整线程数量，避免线程过多浪费资源或线程
+过少导致任务积压。使用信号量实现缓冲区的线程安全操作是标准的解决思路。
+该设计可用于实际的任务调度系统（如Web服务器的线程池、数据库连接池等）。
+
+===============================================================================