OS21.【Linux】环境变量
目录
1.与环境变量有关的实验
A.对比命令和自制程序的运行
为什么.像ls、pwd这样的命令运行是不需要加路径?
执行自制程序而不加路径的方法,看看PATH环境变量
方法1:将自制程序移动到系统的搜索路径下
方法2:临时修改PATH环境变量
B.查看系统中所有环境变量
解释几个常见的环境变量
C.获取环境变量的函数getenv()
2.环境变量
解释全局属性
命令行参数
a.out子进程是如何得到环境变量表的?
证明能被子进程继承,也就证明的全局属性
添加环境变量的命令:export
取消环境变量的命令:unset
使用第三方变量environ来访问环境变量
3.系统变量的分类
环境变量
本地变量
set命令
证明本地变量不可被继承
4.系统命令的分类
常规命令和内建命令
man和help的区别
5.总结获取环境变量的几种方法
6.拓展阅读:自定义入口函数
7.附: C89标准文档对main函数的描述
1.与环境变量有关的实验
从与环境变量有关的实验来感受环境变量
A.对比命令和自制程序的运行
1.像ls、pwd这样的命令运行是不需要加路径的
2.如果不配置环境变量,那么运行开发者自制程序是需要加路径的
例如:当前目录下有一个a.out可执行文件,那么运行时需要加路径:
./a.out #.表示当前目录
a.out是由以下代码产生的:
#include <stdio.h>
int main()
{printf("Hello World!");return 0;
}
为什么.像ls、pwd这样的命令运行是不需要加路径?
之前在OS4.【Linux】基本指令入门(3)文章讲过:系统的命令存储在特定的路径下,那么bash执行指令会到特定的路径中找
特定的路径存储在环境变量PATH中
使用echo命令打印系统的环境变量:
echo $PATH #注意: $作用:说明PATH是变量名
那么在搜索命令时,会从左向右按顺序查找这些路径下的命令,如果找到了,之后的路径就不找了
还可以打印其他环境变量:
echo $HOME #查看当前用户的家目录
结论:
1.PATH存储了Linux系统命令的搜索路径
2.执行非系统命令的程序需要加路径,因为PATH中没有;执行系统的命令不需要带路径,因为PATH存储了搜索路径
执行自制程序而不加路径的方法,看看PATH环境变量
方法1:将自制程序移动到系统的搜索路径下
之前OS4.【Linux】基本指令入门(3)在文章做过,这里不再演示
方法2:临时修改PATH环境变量
*注意:以下两种方法都只是临时修改PATH环境变量,重新连接服务器时PATH会恢复默认值,可以得出: PATH是内存中的环境变量
1.直接覆盖掉PATH:
PATH=/home/guest
(按照赋值号=的规则: PATH的新值就是/home/guest)
会导致有些系统命令是用不了的:
例如ls命令不可用,但pwd是可用的,具体为什么pwd可用本文后面会讲
这样就不用添加路径了:
2.对PATH添加新的路径
PATH=$PATH:/home/guest
(要使用冒号分割符,因为冒号分割符的作用就是分开各个路径)
这样就不用添加路径了:
B.查看系统中所有环境变量
使用不带任何选项的env命令:
其中,=前面的大写单词指的是环境变量名, =后面的是该环境变量的值
环境变量名 = 对应的值
解释几个常见的环境变量
USER
指的是当前登录的用户(随su命令切换用户而变)
LOGNAME
和USER不同的是:在某些情况下,它的值可能会保持不变,即使通过su命令切换到其他用户
PWD
指当前处于的绝对路径,其值会在每次执行cd命令后时更新
*注:pwd命令不是使用了PWD环境变量,而是通过getcwd函数实现的
HOME
指当前用户的家目录
SHELL
指当前Shell,它的值通常是/bin/bash
C.获取环境变量的函数getenv()
看看手册:
getenv()的作用:获取指定的环境变量(environment variable),需要包含<stdlib.h>头文件
函数的声明: char* getenv(const char *name);
注意到有两个参数:
示例代码:
#include <stdlib.h>
#include <stdio.h>
int main()
{printf("PATH=%s\n",getenv("PATH"));return 0;
}
运行结果:和不带任何选项的env命令打印的结果是一样的
2.环境变量
从上面的三个实验可以总结出环境变量的定义:
环境变量: 是操作系统中用来指定操作系统运行环境的一些参数,是系统提供的一组 name = value 形式的变量,不同的环境变量有不同的用途,通常具有全局属性
例如编写C/C++代码的时候,在链接的时候,有相关环境变量帮助编译器进行查找所链接的动态静态库
解释全局属性
命令行参数
回顾分析命令行参数的文章:
110.【C语言】编写命令行程序(1)
113.【C语言】编写命令行程序(2)
114.【C语言】实战分析命令行程序:srom转换工具源码分析
一般情况下,main函数用的比较多的两种写法:
int main()
int main(int argc, char* argv[])
但Linux操作系统为main函数提供了第3个参数:char *envp[]
(来自GNU Program-Arguments网站)
注:编译器会根据情况处理main函数的三种不同写法
envp的全称是environment variables pointer array,是环境变量指针数组,可以打印内容
#include <stdio.h>
int main(int argc,char* argv[],char* envp[])
{for (size_t i=0;envp[i];i++){printf("%s\n",envp[i]);}return 0;
}
提示: argv和env表的结构都一样
运行结果:
结论:
1.程序运行需要两张核心向量表: char* argv[],char* envp[],指针数组的结尾元素的值为空指针 2.main函数之前还有一些函数,这些函数负责向main函数传递这两张表的指针和参数的个数argc
a.out子进程是如何得到环境变量表的?
上方运行了a.out子进程,子进程打印了操作系统的所有环境变量
bash在启动时,会从操作系统的配置文件中读取环境变量信息,bash产生的子进程会继承bash得到的环境变量!
证明能被子进程继承,也就证明的全局属性
添加环境变量的命令:export
例如添加临时环境变量:
export MY_ENV=1
注意: 不能写成MY_ENV=1,这样写是添加本地变量;变成环境变量需要加export前缀
检查是否成功添加:
env | grep MY_ENV
再次执行a.out,会发现MY_ENV已经被bash的子进程a.out继承了
取消环境变量的命令:unset
使用第三方变量environ来访问环境变量
查询environ的含义:
extern char **environ其实是存一些环境变量字符串指针的数组, 最后一个元素的值为空指针
libc中定义的全局变量environ指向环境变量表,environ没有包含在任何头文件中,所以在使用时要用extern声明
例如以下代码:
#include <stdio.h>
#include <unistd.h>
int main()
{extern char** environ;for ( int i = 0; environ[i]; i++) {printf("%d:%s\n", i, environ[i]);}
}
运行结果:
3.系统变量的分类
系统变量主要分为本地变量和环境变量
环境变量
见上方内容
本地变量
创建本地变量的命令
本地变量名 = 本地变量值 #前面不要加export
本地变量和环境变量不同,本地变量主要作用范围是当前shell进程,不会被子进程继承,但环境变量可以被子进程继承
例如添加2个本地变量:
(\是续行符,可以帮助开发者写多行命令)
环境变量中是查不到的:
set命令
作用: 查系统中所有的变量(本地变量+环境变量)
例如查之前添加的本地变量:
证明本地变量不可被继承
证明bash的子进程无法获取上面提到的VAL1和VAL2的值即可
#include <stdio.h>
#include <stdlib.h>
int main()
{printf("VAL1=%s",getenv("VAL1"));printf("VAL2=%s",getenv("VAL2"));return 0;
}
运行结果:值为空
将VAL1和VAL2用export导出,再打印:
4.系统命令的分类
常规命令和内建命令
问题:执行echo命令让bash产生了子进程,那为什么能获取本地变量?
显然echo不是常规命令
Linux下有两种命令:
1.常规命令: 通过创建子进程;来执行常规命令
2.内建命令(也称内置命令,英文名为builtin): bash 不创建子进程,而是由自己亲自执行,类似于 bash 调用了自己写的或者系统提供的函数
例如cd命令调用了chdir()系统调用接口,是由bash自己执行的函数,cd命令的作用是让进程改变自己的路径
成功切换返回0,否则返回-1
可以写一个简单的切换路径的程序:
#include <stdio.h>
#include <unistd.h>
int main(int argc, char* argv[])
{if (argc == 1){printf("Usage:cd path");return -1;}if (chdir(argv[1]))printf("%s: No such directory\n", argv[1]);elseprintf("Change path successfully\n");while (1){scanf("%s", argv[1]);if (chdir(argv[1]))printf("%s: No such directory\n", argv[1]);elseprintf("Change path successfully\n");}return 0;
}
注意:这个程序和cd命令还不太一样, 是让进程改变自己的路径,不是更改bash的路径,因此使用上方代码切换路径后,pwd命令打印的值是不变的
可以在cwd文件中看到:
当然可以继续切换看看cwd的值的变化
man和help的区别
man主要查看的是外部命令和一些系统调用和函数,例如ls、printf……
help主要查看的就是内置命令了。
提示:使用type命令可以查看命令的类型,例如
5.总结获取环境变量的几种方法
1.使用命令env
2.使用getenv()函数
3.直接打印char* envp[]
4.第三方变量environ获取
6.拓展阅读:自定义入口函数
Linux下可以通过自定义入口函数的方法来达到不从main函数(cppreference main_function)开始执行的目的
在https://www.geeksforgeeks.org/c/write-running-c-code-without-main/提到一种方法;
#include<stdio.h>
#include<stdlib.h> // entry point function
int nomain(); void _start(){ // calling entry point nomain(); exit(0);
} int nomain()
{ puts("Geeksforgeeks"); return 0;
}
编译命令:
gcc -o nomain.out nomain.c -nostartfiles
运行结果:
摘自stackoverflow what-is-the-use-of-start-in-c的回答:
The symbol
_start
is the entry point of your program. That is, the address of that symbol is the address jumped to on program start. Normally, the function with the name_start
is supplied by a file calledcrt0.o
which contains the startup code for the C runtime environment. It sets up some stuff, populates the argument arrayargv
, counts how many arguments are there, and then callsmain
. Aftermain
returns,exit
is called.If a program does not want to use the C runtime environment, it needs to supply its own code for
_start
. For instance, the reference implementation of the Go programming language does so because they need a non-standard threading model which requires some magic with the stack. It's also useful to supply your own_start
when you want to write really tiny programs or programs that do unconventional things.
翻译: _start符号是Linux下规定的函数的入口点,程序启动时会跳转到该符号所表示的地址
正常情况下, 由_start标识的的函数由crt0.o文件提供,它包含了 C 运行时环境的启动代码. 该代码会完成一些初始化工作: 填充参数数组 argv ,统计参数个数argc,然后调用main函数. main 返回后,再调用exit函数
如果某个程序不想使用C运行时环境,就必须自行提供 _start 的实现
当你想编写体积极小的程序,或者做一些非常规操作时,自己写 _start 也很有用