当前位置：首页 > news >正文

020 实现一个简易 Shell

news 2025/7/15 14:16:56

🦄 个人主页: 小米里的大麦-CSDN博客
🎏 所属专栏: Linux_小米里的大麦的博客-CSDN博客
🎁 GitHub主页: 小米里的大麦的 GitHub
⚙️ 操作环境: Visual Studio 2022

在这里插入图片描述

文章目录

- - 从零到一实现一个简易 `Shell`
  - - 1. `Shell` 的基本功能
    - 2. 实现 `Shell` 的提示符
    - - 1. 获取用户信息
      - 2. 定义提示符格式
      - 3. 实现 `interact` 函数
      - 3. 使用 `strtok` 分割字符串
      - 4. 命令执行
      - 5. 内置命令实现
      - 6. 外部命令执行
      - 7. 解析重定向符号
      - 8. 执行重定向
      - 9. 主循环
    - 3. 源码一览
- 共勉

从零到一实现一个简易 `Shell`

这应该是个蛮有趣的话题：“什么是 Shell”？相信只要摸过计算机，对于操作系统(不论是 Linux、Unix 或者是 Windows)有点概念的朋友们大多听过这个名词，因为只要有“操作系统“那么就离不开 Shell 这个东西。不过，在讨论 Shell 之前，我们先来了解一下计算机的运行状况吧！举个例子来说：当你要计算机传输出来“音乐”的时候，你的计算机需要什么东西呢？

硬件：当然就是需要你的硬件有“声卡芯片”这个配备，否则怎么会有声音；
核心管理：操作系统的核心可以支持这个芯片组，当然还需要提供芯片的驱动程序啰；
应用程序：需要使用者（就是你）输入发生声音的指令啰！

这就是基本的一个输出声音所需要的步骤！也就是说，你必须要“输入”一个指令之后，“硬件“才会通过你下达的指令来工作！那么硬件如何知道你下达的指令呢？那就是 kernel（核心）的控制工作了！也就是说，我们必须要通过“Shell”将我们输入的指令与 Kernel 沟通，好让 Kernel 可以控制硬件来正确无误的工作！基本上，我们可以通过下面这张图来说明一下：

以上内容摘自《鸟哥的 Linux 私房菜基础学习篇（第四版）》311 页。

1. `Shell` 的基本功能

一个基本的 Shell 需要具备以下功能：

提示符显示：显示当前用户、主机名和工作目录，例如 [user@host ~]#。
命令读取：从标准输入读取用户输入的命令。
命令解析：将输入的命令行分割为命令和参数。
命令执行：支持内置命令（如 cd、export）和外部命令（如 ls、cat）。
重定向支持：支持输入重定向 <、输出重定向 > 和追加输出重定向 >>。
环境变量管理：支持查看和设置环境变量。
退出机制：支持通过 exit 退出 Shell。

让我们一步步实现这些功能。

2. 实现 `Shell` 的提示符

Shell 的提示符是用户交互的起点，通常显示为 [用户名@主机名当前目录]#。我们需要获取用户名、主机名和当前工作目录。

1. 获取用户信息

用户名：使用 getenv("USER") 获取当前用户名。
主机名：使用 getenv("HOSTNAME") 获取主机名。
当前目录：使用 getcwd() 获取当前工作目录。

2. 定义提示符格式

我们通过宏定义设置提示符的格式：

#define LEFT "["        // 左括号
#define RIGHT "]"       // 右括号
#define LABLE "#"       // 提示符号

3. 实现 `interact` 函数

interact 函数负责显示提示符并读取用户输入：

void interact(char* cline, int size)
{getpwd();  // 获取当前工作目录printf(LEFT"%s@%s %s"RIGHT""LABLE" ", getusername(), gethostname1(), pwd);char* s = fgets(cline, size, stdin);  // 读取用户输入assert(s);                            // 确保读取成功(void)s;						    // 显式标记该变量已被“使用”，从而抑制编译器警告（这是一种代码规范技巧，表明有意忽略此变量）cline[strlen(cline) - 1] = '\0';      // 去除末尾换行符check_redir(cline);                   // 检查重定向符号
}

getpwd() 调用 getcwd(pwd, sizeof(pwd)) 更新全局变量 pwd。
printf 格式化输出提示符，例如 [user@host /home]#。
fgets 从标准输入读取命令行。
check_redir 检查是否有重定向符号（稍后实现）。
命令行解析：用户输入的命令行需要被分割成命令和参数。例如，输入 ls -l /home 应分割为 ["ls", "-l", "/home"]。

3. 使用 `strtok` 分割字符串

我们使用 strtok 函数按空格或制表符分割命令行：

#define DELIM " \t"  // 分隔符：空格和制表符int splitstring(char cline[], char* _argv[])
{int i = 0;argv[i++] = strtok(cline, DELIM);       // 分割第一个 tokenwhile (_argv[i++] = strtok(NULL, DELIM));  // 继续分割后续 tokenreturn i - 1;                           // 返回参数个数
}

strtok(cline, DELIM) 分割第一个 token（命令）。
循环调用 strtok(NULL, DELIM) 获取后续参数。
返回值是参数个数 argc，存储在全局数组 argv 中。

全局变量定义如下：

#define LINE_SIZE 1024
#define ARGC_SIZE 32
char commandline[LINE_SIZE];  // 存储用户输入
char* argv[ARGC_SIZE];        // 存储分割后的参数

4. 命令执行

Shell 需要区分两种命令：

内置命令：由 Shell 直接处理，如 cd、export、echo。
外部命令：通过 fork 和 exec 执行系统中的可执行文件。

5. 内置命令实现

内置命令在 Shell 进程中直接执行，无需创建子进程。我们在 buildCommand 函数中实现：

int buildCommand(char* _argv[], int _argc)
{// cd 命令：切换目录if (_argc == 2 && strcmp(_argv[0], "cd") == 0){chdir(argv[1]);              // 切换工作目录getpwd();sprintf(getenv("PWD"), "%s", pwd);  // 更新 PWD 环境变量return 1;                    // 表示已处理}// export 命令：设置环境变量else if (_argc == 2 && strcmp(_argv[0], "export") == 0){strcpy(myenv, _argv[1]);putenv(myenv);               // 添加到环境变量表return 1;}// echo 命令：打印参数else if (_argc == 2 && strcmp(_argv[0], "echo") == 0){if (strcmp(_argv[1], "$?") == 0){printf("%d\n", lastcode);  // 打印上一次命令退出码lastcode = 0;}else if (*_argv[1] == '$'){char* val = getenv(_argv[1] + 1);  // 获取环境变量值if (val){printf("%s\n", val);}}else{printf("%s\n", _argv[1]);  // 直接打印参数}return 1;}// 增强 ls 命令if (strcmp(_argv[0], "ls") == 0){_argv[_argc++] = "--color";    // 添加颜色选项_argv[_argc] = NULL;}return 0;  // 未处理，交给外部命令执行
}

cd：使用 chdir 切换目录，并更新 PWD 环境变量。
export：使用 putenv 设置环境变量，myenv 是全局缓冲区。
echo：支持打印上一次退出码、环境变量 VAR 或普通字符串。
ls 增强：自动添加 --color 选项以显示彩色输出。
返回值：1 表示内置命令已处理，0 表示需要外部执行。

6. 外部命令执行

外部命令通过 fork 创建子进程并使用 execvp 执行：

void NormalExcute(char* _argv[])
{pid_t id = fork();if (id < 0){perror("fork");return;}else if (id == 0)  // 子进程{int fd = 0;if (rdir == IN_RDIR){fd = open(rdirfilename, O_RDONLY);dup2(fd, 0);  // 重定向标准输入}else if (rdir == OUT_RDIR){fd = open(rdirfilename, O_CREAT | O_WRONLY | O_TRUNC, 0666);dup2(fd, 1);  // 重定向标准输出}else if (rdir == APPEND_RDIR){fd = open(rdirfilename, O_CREAT | O_WRONLY | O_APPEND, 0666);dup2(fd, 1);  // 追加重定向标准输出}execvp(_argv[0], _argv);  // 执行命令exit(EXIT_CODE);          // exec 失败退出}else  // 父进程{int status = 0;pid_t rid = waitpid(id, &status, 0);if (rid == id){lastcode = WEXITSTATUS(status);  // 记录退出码}}
}

fork() 创建子进程。
子进程根据重定向类型（rdir）打开文件并使用 dup2 重定向。
execvp 执行命令，从 PATH 中查找可执行文件。
父进程使用 waitpid 等待子进程结束，并记录退出码到 lastcode。
重定向支持，Shell 支持三种重定向：
- 输入重定向：< filename
- 输出重定向：> filename
- 追加输出重定向：>> filename

7. 解析重定向符号

在 check_redir 函数中解析重定向：

#define NONE -1
#define IN_RDIR 0
#define OUT_RDIR 1
#define APPEND_RDIR 2char* rdirfilename = NULL;  // 重定向文件名
int rdir = NONE;            // 重定向类型void check_redir(char* cmd)
{char* pos = cmd;while (*pos){if (*pos == '>'){if (*(pos + 1) == '>')  // >>{*pos++ = '\0';*pos++ = '\0';while (isspace(*pos)) pos++;rdirfilename = pos;rdir = APPEND_RDIR;break;}else  // >{*pos = '\0';pos++;while (isspace(*pos)) pos++;rdirfilename = pos;rdir = OUT_RDIR;break;}}else if (*pos == '<')  // <{*pos = '\0';pos++;while (isspace(*pos)) pos++;rdirfilename = pos;rdir = IN_RDIR;break;}pos++;}
}

遍历命令行，检测 <、> 或 >>。
将符号替换为 \0 以分割命令和文件名。
设置全局变量 rdir 和 rdirfilename。
interact 函数调用 check_redir 进行解析。

8. 执行重定向

在 NormalExcute 中根据 rdir 处理重定向：

输入重定向：打开文件并重定向到标准输入（文件描述符 0）。
输出重定向：创建或截断文件并重定向到标准输出（文件描述符 1）。
追加输出重定向：创建或追加文件并重定向到标准输出。
环境变量管理：
- 查看：通过 echo $VAR 查看环境变量值。
- 设置：通过 export VAR = VALUE 设置环境变量。

这些功能已在 buildCommand 的 echo 和 export 实现中完成。

9. 主循环

Shell 的主循环负责持续运行：

int main()
{while (!quit){rdirfilename = NULL;  // 重置重定向信息rdir = NONE;interact(commandline, sizeof(commandline));  // 获取输入int argc = splitstring(commandline, argv);   // 解析命令if (argc == 0) continue;int n = buildCommand(argv, argc);            // 处理内置命令if (!n){NormalExcute(argv);                      // 执行外部命令}}return 0;
}

重置重定向状态。
获取并解析用户输入。
处理内置命令或外部命令。
quit 变量控制退出（当前代码中未实现 exit 命令，可扩展）。

3. 源码一览

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <assert.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <ctype.h>
#include <fcntl.h>// ======================== 宏定义区域 ========================
#define LEFT "["                            // shell 显示用的左括号
#define RIGHT "]"                           // shell 显示用的右括号
#define LABLE "#"                           // shell 显示用的提示符号
#define DELIM " \t"                         // 分隔符（空格和制表符）
#define LINE_SIZE 1024                      // 每一行命令最大长度
#define ARGC_SIZE 32                        // 最大命令参数个数
#define EXIT_CODE 44                        // 子进程执行失败退出码// 重定向类型定义
#define NONE -1
#define IN_RDIR     0                       // 输入重定向（<）
#define OUT_RDIR    1                       // 输出重定向（>）
#define APPEND_RDIR 2                       // 追加输出重定向（>>）// ======================== 全局变量 ========================
int lastcode = 0;                           // 上一次命令的返回码
int quit = 0;                               // 控制是否退出 shell
extern char** environ;                      // 系统环境变量表
char commandline[LINE_SIZE];                // 存储用户输入命令
char* argv[ARGC_SIZE];                      // 存储分割后的命令参数
char pwd[LINE_SIZE];                        // 当前工作目录
char* rdirfilename = NULL;                  // 重定向的文件名
int rdir = NONE;                            // 当前重定向类型char myenv[LINE_SIZE];                      // 存储 export 设置的环境变量// ======================== 工具函数 ========================// 获取当前用户名
const char* getusername()
{return getenv("USER");
}// 获取主机名
const char* gethostname1()
{return getenv("HOSTNAME");
}// 获取当前路径（PWD）
void getpwd()
{getcwd(pwd, sizeof(pwd));
}// 解析重定向符号（< > >>）并设置 rdir 和 rdirfilename
void check_redir(char* cmd)
{char* pos = cmd;while (*pos){if (*pos == '>'){if (*(pos + 1) == '>')          // >> 追加重定向{ *pos++ = '\0';*pos++ = '\0';while (isspace(*pos)){pos++;}rdirfilename = pos;rdir = APPEND_RDIR;break;}else                            // > 普通输出重定向{ *pos = '\0';pos++;while (isspace(*pos)){pos++;}rdirfilename = pos;rdir = OUT_RDIR;break;}}else if (*pos == '<')               // < 输入重定向{*pos = '\0';pos++;while (isspace(*pos)){pos++;}rdirfilename = pos;rdir = IN_RDIR;break;}pos++;}
}// 显示 shell 提示符并获取用户输入命令
void interact(char* cline, int size)
{getpwd();printf(LEFT"%s@%s %s"RIGHT""LABLE" ", getusername(), gethostname1(), pwd);char* s = fgets(cline, size, stdin);    // 获取用户输入assert(s);                              // 确保输入成功(void)s;							 // 显式标记该变量已被“使用”，从而抑制编译器警告（这是一种代码规范技巧，表明有意忽略此变量）cline[strlen(cline) - 1] = '\0';        // 去除换行符check_redir(cline);                     // 检查是否有重定向
}// 将命令行字符串根据空格分割成参数数组
int splitstring(char cline[], char* _argv[])
{int i = 0;argv[i++] = strtok(cline, DELIM);while (_argv[i++] = strtok(NULL, DELIM));   // 使用 strtok 循环分割return i - 1;
}// 执行普通命令（fork+exec）
void NormalExcute(char* _argv[])
{pid_t id = fork();if (id < 0){perror("fork");return;}else if (id == 0)                           // 子进程执行命令{int fd = 0;if (rdir == IN_RDIR){fd = open(rdirfilename, O_RDONLY);dup2(fd, 0);                        // 标准输入重定向}else if (rdir == OUT_RDIR){fd = open(rdirfilename, O_CREAT | O_WRONLY | O_TRUNC, 0666);dup2(fd, 1);                        // 标准输出重定向}else if (rdir == APPEND_RDIR) {fd = open(rdirfilename, O_CREAT | O_WRONLY | O_APPEND, 0666);dup2(fd, 1);                        // 标准输出追加重定向}execvp(_argv[0], _argv);                // 执行命令（从 PATH 路径中查找）exit(EXIT_CODE);                        // exec 出错则退出}else                                        // 父进程等待子进程结束{int status = 0;pid_t rid = waitpid(id, &status, 0);if (rid == id){lastcode = WEXITSTATUS(status);     // 记录子进程退出码}}
}// 构建内置命令：cd, export, echo
int buildCommand(char* _argv[], int _argc)
{if (_argc == 2 && strcmp(_argv[0], "cd") == 0){chdir(argv[1]);                         // 切换工作目录getpwd();sprintf(getenv("PWD"), "%s", pwd);      // 更新环境变量 PWDreturn 1;}else if (_argc == 2 && strcmp(_argv[0], "export") == 0){strcpy(myenv, _argv[1]);putenv(myenv);                          // 添加或修改环境变量return 1;}else if (_argc == 2 && strcmp(_argv[0], "echo") == 0){if (strcmp(_argv[1], "$?") == 0){printf("%d\n", lastcode);           // 打印上一次命令的返回码lastcode = 0;}else if (*_argv[1] == '$'){char* val = getenv(_argv[1] + 1);   // 获取环境变量值if (val){printf("%s\n", val);}}else{printf("%s\n", _argv[1]);}return 1;}// 针对 ls 增加颜色选项if (strcmp(_argv[0], "ls") == 0){_argv[_argc++] = "--color"; // 自动加上颜色显示_argv[_argc] = NULL;}return 0;
}// ======================== 主函数入口 ========================
int main()
{while (!quit){// 初始化重定向信息rdirfilename = NULL;rdir = NONE;// 获取用户输入的命令行interact(commandline, sizeof(commandline));// 分割命令行为参数数组int argc = splitstring(commandline, argv);if (argc == 0) continue;// 处理内置命令int n = buildCommand(argv, argc);// 执行普通命令if (!n){NormalExcute(argv);}}return 0;
}