Notes on Advanced Unix Enviroment Programming

 

3. File IO

  • strerror perror, perror(argv[0]) 通过这种方式在管道程序中知道具体是哪个程序错误
  • 进程表 文件表 v节点表 每个进程保存当前打开文件的偏移量
  • dup dup2复制文件描述符,即共享

4. FILE & DIR

  • stat fstat lstat返回文件信息
struct stat {
    mode_t st_mode; /* file type & mode */
    ino_t st_ino; /* i-node number */
    dev_t st_dev; /* device number */
    dev_t st_rdev; /* device number for special files */
    nlink_t st_nlink; /*number of links */
    uid_t st_uid; /* user ID of owner */
    gid_t st_gid; /* group ID of owner */
    off_t st_size; /* size in bytes */
    time_t st_atime; /* time of last access */
    time_t st_mtime; /* time of last modification */
    time_t st_ctime; /* time of last file status change */
    blksize_t st_blksize; /* best I/O block size */
    blkcnt_t st_blocks; /* number of disk blocks allocated */
};
  • 文件访问权限 u(user) g(group) o(other)
    • dir 都应具有执行权限
    • int access(const char *pathname, int mode)

5. Std IO

  • tmpnam
  • tmpfile
  • mkstemp

6. System Data File & Info

  • /etc/passwd
  • /etc/group
  • uname

7. Process Enviroment

  • exit函数总是执行一个标准IO的清理关闭工作,为所有打开流调用fclose函数
  • atexit(void (*func)(void))
  • getenv & putenv
  • 共享库:在所有进程都可以引用的存储区,维护例程的副本开销发生在该程序第一次被调用时。另一个优点是用库函数的新版本代替老版本,而无需对使用该库的程序重新链接编辑。
  • malloc calloc realloc

8. 进程控制

  • 特殊进程ID
    • ID == 0 调度进程
    • ID == 1 Init进程
    • ID == 2 守护进程
  • fork文件共享,具有指向相同的文件表。失败原因:1. 系统限制, 2. 系统对用户的限制
  • fork有下面两种用法
    • 一个父进程希望复制自己,如网络程序中父进程创建子进程处理请求
    • 一个进程要执行一个不同的程序。在这种情况下,子进程从fork返回后立即调用exec
  • 僵尸进程:在Unix术语中,一个已经终止,但是其父进程尚未对其进行善后处理,终止子进程的有关信息,释放它仍占用的资源的进程被称为僵尸进程。
  • wait waitpid
  • 进程时间:墙上时钟时间 用户CPU时间 系统CPU时间
  • exec函数族。当进程调用一种exec函数时,该进程执行的程序完全替换为新程序,而新程序则是从其main函数开始执行。因为调用exec并不创建新进程,所以前后的进程ID并未改变。exec只是用一个全新的程序替换了当前进程的正文、数据、堆和栈段。
  • system system在其实现中调用了fork, exec, waitpid
// system实现
#include <stdio.h>
//#include <stdlib.h>
#include <unistd.h>
#include <signal.h>
#include <errno.h>

static void error_exit(char *msg) {
    perror(msg);
    //exit(1);
}

static int system(const char *cmd_string)
{
    pid_t pid;
    int status;
    if (cmd_string == NULL) return 1;
    if ((pid = fork()) < 0) {
        status = -1;
    }
    else if (pid == 0) {
        execl("/bin/sh", "sh", "-c", cmd_string, (char *)0);
        _exit(127);
    }
    else {
        while(waitpid(pid, &status, 0) < 0) {
            if (errno != EINTR) {
                status = -1;
                break;
            }
        }
    }

    return status;
}

int main() {
    int status;
    if ((status = system("date")) < 0) error_exit("data error");

    return 0;
}

9. 进程关系

  • 终端登录 /etc/ttys
  • 进程租 gid
  • 会话 sid
  • 作业控制
    • SIGINT(Ctrl+C)
    • SIGQUIT(Ctrl+\)
    • SIGTSTP(Ctrl+Z)
make all > make.out &
[1]     1475
作业号  进程ID
  • stty tostop禁止后台作业输出至控制台

10. 信号

  • 信号处理(忽略、捕捉、系统默认)
  • 重要典型信号(SIGABRT, SIGHUP, SIGKILL, SIGCHLD)
  • signal函数
  • 可重入函数:可以被信号中断的函数,不可重入函数如malloc, free有以下原因:
    • 它们使用静态数据结构
    • 它们调用malloc或free
    • 它们是标准的IO函数,标准IO好多均以不可重入的方式使用了全局数据结构
  • alarm pause
  • abort
  • 僵尸进程解决方案
    • 忽略 signal(SIGCHLD,SIG_IGN);
    • 等 wait waitpid
    • 异步通知 捕捉信号SIGCHLD,并处理
    • 调用fork两次 APUE8.6节
// 调用fork两次,避免僵尸进程
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <signal.h>

void error_exit(char *msg) {
    perror(msg);
    exit(1);
}

int main() 
{
    pid_t pid;
    if (pid = fork() < 0) {
        error_exit("fork error");
    }
    else if (pid == 0) {
        if ((pid = fork()) < 0) error_exit("fork error");
        else if (pid > 0) exit(0);

        sleep(2);
        printf("second child, pid %d ppid %d\n", getpid(), getppid());
        exit(0);
    }
    if (waitpid(pid, NULL, 0) != pid) {
        error_exit("waitpid error");
    }
    return 0;
}

11. 线程

  • 标示 pthread_equal(tid1, tid2) pthread_self()
  • pthread_create(pthread tid, *attr, void *(thread_func)(void *), void *arg)
  • 线程终止
    • 从启动例程中返回
    • 被同一进程中的其他线程取消 pthread_cancel(tid)
    • 线程调用pthread_exit(void *sta)
  • int pthread_join(tid, void **sta)
  • 互斥量 pthread_mutex_t
    • pthread_mutex_init(*mutex, *attr)
    • pthread_mutex_destroy(*mutex)
    • pthread_mutex_lock(*mutex)
    • pthread_mutex_unlock(*mutex)
  • 读写锁
    • 读模式加锁状态
    • 写模式加锁状态
    • 不加锁状态

      一次只有一个线程可以占有写模式的读写锁,但是多个线程可以同时占有读模式的读写锁。读写锁非常适用于对数据结构读的次数远远大于写的情况。

  • 条件变量

利用线程间共享的全局变量进行同步,主要包括两个动作,一个线 程等待条件白能量的条件成立而挂起,另一个线程使条件成立。为了防止竞争,条件变量总是和一个互斥锁结合在一起。

传递给pthread_cond_wait的互斥量对条件进行保护,调用者把锁住的互斥量传给函数。函数把调用线程放到等待条件的线程列表上,然后对这个互斥量解锁,这两个操作是原子操作。pthread_cond_wait返回时,互斥量被再次锁住。 pthread_cond_wait相当于解锁,允许其他线程加锁。

pthread_cond_t cond;
pthread_cond_init
pthread_cond_destroy
pthread_cond_wait
pthread_cond_signal
pthread_cond_broadcast
  • 线程同步的几种方式: 互斥量,读写锁,条件变量

12. 线程控制

  • 线程属性 互斥量,读写锁属性
  • 线程安全函数
  • 线程私有数据
  • 守护线程:朱线程结束后会自动把daemon线程杀死。例如javapython线程库中的setdaemon方法

13. 守护进程

守护进程也称精灵进程(daemon)是生存期较长的一种进程。它们常常在系统自举时启动,仅在系统关闭时才终止。因为它们没有控制终端,所以说它们是在后台运行的。Unix系统中有很多守护进程,它们执行日常事务活动

  • init kevent syslog
  • 守护进程一般为单实例进程

14. 高级IO

  • 记录锁fcntl
  • 多输入多输出的解决方案
    • 设置为非阻塞IO,然后轮询状态
    • 异步IO,内核通过信号通知
    • IO多路转接
  • IO多路转接

    先构造一张有关描述符的列表,然后调用一个函数,直到这些描述符中的一个已经准备好进行IO时,该函数才返回

  • select poll epoll
  • readn writen

15. 进程间通信

  • 管道 特点:半双工,进程具有公共祖先
int pipe(int fid[2]) // 返回两个设备Id,0为读,1为写,通过read,write系统调用进行读写
  • popen pcolse及其实现
  • FIFO命名管道
  • 消息队列 msgget msgsnd msgrev
  • 信号量,信号实际上是同步原语而不是IPC,常用于共享资源(如共享存储)的同步访问
  • 共享存储
  • IPC速度比较 共享存储 > 管道 > FIFO > socket
  • Question: shell的管道如何实现?

16. 网络IPC: 套接字

  • socket 函数族 socket, bind, connect, listen, accept
  • 网络字节序 htonl, htons, ntohl, ntohs

17. 高级进程间通信

  • 基于Streams管道,全双工
  • Unix域套接字:用于同一台机器上运行的进程之间的通信