手指放血:Linux下获得CPU利用率和内存使用情况(C实现)

来源:百度文库 编辑:中财网 时间:2024/05/06 14:57:54
详见:http://www.cppblog.com/dyj057/archive/2007/01/31/18221.aspx

在Linux中如果要监视一个进程的运行情况,如查看它的CPU使用效率和内存使用情况,就需要从系统的 /proc目录的读取一些系统信息。然后分析得到结果,特别是在嵌入式中的应用程序这个功能就很重要。本文中的代码是从top命令的源代码分析中获得,并做了部分修改,在FC6+GCC4.1调试通过。从这个工程中我也获得一些感悟。
1. Linux系统很优雅,如果在Windows中做这个功能就需要调用ActiveX控件。而在Linux中只需要读取文本。
2.想完成什么功能,如果不知道怎么做,就想有没有没有其它的软件有这个功能,如果有,查看它的源代码就可以了,然后定制自己需要的功能。
3.多想多看多做,学习技术的不二法门。

top命令源代码下载:http://www.groupsys.com/top/download.shtml
工程下载:
http://www.cppblog.com/Files/dyj057/mytop.zip
下面是获得系统CPU和内存情况的代码:

void
get_system_info(info)
    
struct system_info * info;
{
     char buffer[ 4096 + 1
];
     int
fd, len;
     char *
p;
     int
i;

     /* get load averages */

     {
     fd
= open( " loadavg " , O_RDONLY);
     len = read(fd, buffer, sizeof (buffer) - 1
);
     close(fd);
     buffer[len] = ' \0 '
;

     info -> load_avg[ 0 ] = strtod(buffer, &
p);
     info -> load_avg[ 1 ] = strtod(p, &
p);
     info -> load_avg[ 2 ] = strtod(p, &
p);
     p = skip_token(p);             /* skip running/tasks */

     p = skip_ws(p);
     if ( *
p)
         info -> last_pid =
atoi(p);
     else

         info -> last_pid = - 1 ;
     }

     /* get the cpu time info */

     {
     fd
= open( " stat " , O_RDONLY);
     len = read(fd, buffer, sizeof (buffer) - 1
);
     close(fd);
     buffer[len] = ' \0 '
;

     p = skip_token(buffer);             /* "cpu" */

     cp_time[ 0 ] = strtoul(p, & p, 0 );
    
     cp_time[ 1 ] = strtoul(p, & p, 0
);
     cp_time[ 2 ] = strtoul(p, & p, 0
);
     cp_time[ 3 ] = strtoul(p, & p, 0
);

     /* convert cp_time counts to percentages */

     percentages( 4 , cpu_states, cp_time, cp_old, cp_diff);
     }
    
     /* get system wide memory usage */

     {
    
char * p;

     fd = open( " meminfo "
, O_RDONLY);
     len = read(fd, buffer, sizeof (buffer) - 1
);
     close(fd);
     buffer[len] = ' \0 '
;

     /*
be prepared for extra columns to appear be seeking
        to ends of lines */

    
     p
= buffer;
     p =
skip_token(p);
     memory_stats[ 0 ] = strtoul(p, & p, 10 ); /* total memory */

    
     p
= strchr(p, ' \n ' );
     p =
skip_token(p);
     memory_stats[ 1 ] = strtoul(p, & p, 10 ); /* free memory */

    
    
     p
= strchr(p, ' \n ' );
     p =
skip_token(p);
     memory_stats[ 2 ] = strtoul(p, & p, 10 ); /* buffer memory */

    
     p
= strchr(p, ' \n ' );
     p =
skip_token(p);
     memory_stats[ 3 ] = strtoul(p, & p, 10 ); /* cached memory */

    
    
for (i = 0 ; i < 8 ;i ++ ) {
         p ++
;
         p = strchr(p, ' \n '
);
     }
    
     p =
skip_token(p);
     memory_stats[ 4 ] = strtoul(p, & p, 10 ); /* total swap */

    
     p
= strchr(p, ' \n ' );
     p =
skip_token(p);
     memory_stats[ 5 ] = strtoul(p, & p, 10 ); /* free swap */

    
     }

    
/* set arrays and strings */
     info -> cpustates = cpu_states;
     info -> memory =
memory_stats;
}
上面函数的实现可具体参考 /home/mxzh/opt/top-3.5/machine/m_linux.c的实现
关于编译:下载
mytop.zip解压后,对于main.c里的进程号,要根据proc下的进程号修改,也可以把
read_one_proc_stat( (pid_t)6246, &proc);
   
        struct top_proc *p = &proc;
   
       printf("%s\n",format_next_process(p));屏蔽掉
然后gcc -o mytop main.c m_linux.c machine.h top.h os.h utils.c utils.h 即可

 

//------------------------------------------------------------

"proc文件系统是一个伪文件系统,它只存在内存当中,而不占用外存空间。它以文件系统的方式为访问系统内核数据的操作提供接口。用户和应用程序可以通过proc得到系统的信息,并可以改变内核的某些参数。"

    这里将介绍如何从/proc文件系统中获取与防火墙相关的一些性能参数,以及如何通过/proc文件系统修改内核的相关配置。

    1、从/proc文件系统获取相关的性能参数
    cpu使用率:    /proc/stat
    内存使用情况:      /proc/meminfo
    网络负载信息:    /proc/net/dev

相应的计算方法:(摘自:什么是proc文件系统,见参考资料)
    (1)   处理器使用率   
    (2)   内存使用率   
    (3)   流入流出数据包   
    (4)   整体网络负载   
     这些数据分别要从/proc/stat、/proc/net/dev、/proc/meminfo三个文件中提取。如里有问题或对要提取的数据不太清楚,可以使用man   proc来查看proc文件系统的联机手册。   
    (1)   处理器使用率   
    这里要从/proc/stat中提取四个数据:用户模式(user)、低优先级的用户模式(nice)、内核模式(system)以及空闲的处理器时间(idle)。它们均位于/proc/stat文件的第一行。CPU的利用率使用如下公式来计算。   
    CPU利用率   =   100   *(user   +   nice   +   system)/(user   +   nice   +   system   +   idle)   
   (2)   内存使用率   
    这里需要从/proc/meminfo文件中提取两个数据,当前内存的使用量(cmem)以及内存总量(amem)。   
    内存使用百分比   =   100   *   (cmem   /   umem)   
    (3)网络利用率   
    为了得到网络利用率的相关数据,需要从/proc/net/dev文件中获得两个数据:从本机输出的数据包数,流入本机的数据包数。它们都位于这个文件的第四行。   
    性能收集程序开始记录下这两个数据的初始值,以后每次获得这个值后均减去这个初始值即为从集群启动开始从本节点通过的数据包。   
    利用上述数据计算出网络的平均负载,方法如下:   
    平均网络负载   =   (输出的数据包+流入的数据包)   /   2
   
    2. 通过/proc文件系统调整相关的内核配置
    允许ip转发   /proc/sys/net/ipv4/ip_forward
    禁止ping    /proc/sys/net/ipv4/icmp_echo_ignore_all
   
    可以在命令行下直接往上述两个“文件”里头写入"1"来实现相关配置,如果写入"0"将取消相关配置。不过在系统重启以后,这些配置将恢复默认设置,所以,如果想让这些修改生效,可以把下面的配置直接写入/etc/profile文件,或者其他随系统启动而执行的程序文件中。

echo 1 > /proc/sys/net/ipv4/ip_forward
echo 1 > /proc/sys/net/ipv4/icmp_echo_ignore_all

    如果需要获取其他的性能参数,或者需要对内核进行更多的配置,可以参考下面链接中的proc文件系统介绍,也可以直接通过man proc查看相关的信息。

参考资料和相关链接

[1] 什么是proc文件系统
http://blog.chinaunix.net/u1/37836/showart_304248.html
[2] Linux下如何获取cpu的使用率
http://topic.csdn.net/t/20060701/23/4855045.html
[3] Exploring the /proc/net/ Directory
http://www.linuxdevcenter.com/pub/a/linux/2000/11/16/LinuxAdmin.html?page=1
[4] /proc/net introduction
http://www.redhat.com/docs/manuals/enterprise/RHEL-4-Manual/en-US/Reference_Guide/s2-proc-dir-net.html
[5] 使用ulimit和proc去调整系统参数
http://www.linuxfly.org/post/73.htm

注:文件里面是一个增量,每过一个时间间隔对应的项使用了CPU都会有增加,要算百分比,得用上上一次的状态值.

这里计算cpu使用率是有问题的,需要使用上一状态的值来计算。 返回 elf 发表于 2007-11-16 09:06 #4
正确的计算方法是,等上一个时间:

1、记录某个时刻cpu的使用情况
2、等上一个时间段
3、再记录此刻的cpu使用情况
4、计算总的时间片
把第一次的所有cpu使用情况求和,得到j1
把第二次的所有cpu使用情况求和,得到j2
j2-j1得到这个时间段的所有时间片
即total=j2-j1=第二次的所有列的和-第一次的所有列的和
5、计算idle时间
idle对应第五列的数据,用第二次的减去第一次的即可
idle=第二次的第五列-第一次的第五列
6、计算cpu使用率
rate=(total-idle)/total 见:http://oss.lzu.edu.cn/blog/article.php?tid_1379.html

我们在搞性能测试的时候,对后台服务器的CPU利用率监控是一个常用的手段。服务器的CPU利用率高,则表明服务器很繁忙。如果前台响应时间越来越大,而后台CPU利用率始终上不去,说明在某个地方有瓶颈了,系统需要调优。这个是即使不懂技术的人都容易理解的事情。

上面理解对吗?我个人觉得不十分准确。这个要看后台你测试的进程是什么类型的。如果是计算密集型的进程,当前端压力越来越大的时候,很容易把CPU利用率打上去。但是如果是I/O网络密集型的进程,即使客户端的请求越来越多,但是服务器CPU不一定能上去,这个是你要测试的进程的自然属性决定的。

什么是CPU利用率呢?在Linux/Unix下,CPU利用率分为用户态,系统态和空闲态,分别表示CPU处于用户态执行的时间,系统内核执行的时间,和空闲系统进程执行的时间。从计算机加电开始,CPU就一直忙个不停,所以CPU的利用率始终是100%。当没有用户进程需要执行的时候,CPU就执行系统缺省的空闲进程。我们所指的CPU利用率是指CPU执行非系统空闲进程的时间 / CPU总的执行时间。

在Linux的内核中,有一个全局变量:Jiffies。 Jiffies代表时间。它的单位随硬件平台的不同而不同。系统里定义了一个常数HZ,代表每秒种最小时间间隔的数目。这样jiffies的单位就是 1/HZ。Intel平台jiffies的单位是1/100秒,这就是系统所能分辨的最小时间间隔了。每个CPU时间片,Jiffies都要加1。 CPU的利用率就是用执行用户态+系统态的Jiffies除以总的Jifffies来表示。

在Linux系统中,CPU利用率的计算来源在/proc/stat文件,这个文件的头几行记录了每个CPU的用户态,系统态,空闲态等状态下的不同的Jiffies,常用的监控软件就是利用/proc/stat里面的这些数据来计算CPU的利用率的。包含了所有CPU活动的信息,该文件中的所有值都是从系统启动开始累计到当前时刻。/proc/stat/
[work@builder ~]$ cat /proc/stat
cpu 432661 13295 86656 422145968 171474 233 5346
cpu0 123075 2462 23494 105543694 16586 0 4615
cpu1 111917 4124 23858 105503820 69697 123 371
cpu2 103164 3554 21530 105521167 64032 106 334
cpu3 94504 3153 17772 105577285 21158 4 24
intr 1065711094 1057275779 92 0 6 6 0 4 0 3527 0 0 0 70 0 20 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 7376958 0 0 0 0 0 0 0 1054602 0 0 0 0 0 0 0 30 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
ctxt 19067887
btime 1139187531
processes 270014
procs_running 1
procs_blocked 0


输出解释
CPU 以及CPU0、CPU1、CPU2、CPU3每行的每个参数意思(以第一行为例)为:
参数 解释
user (432661) 从系统启动开始累计到当前时刻,用户态的CPU时间(单位:jiffies) ,不包含 nice值为负进程。1jiffies=0.01秒
nice (13295) 从系统启动开始累计到当前时刻,nice值为负的进程所占用的CPU时间(单位:jiffies)
system (86656) 从系统启动开始累计到当前时刻,核心时间(单位:jiffies)
idle (422145968) 从系统启动开始累计到当前时刻,除硬盘IO等待时间以外其它等待时间(单位:jiffies)
iowait (171474) 从系统启动开始累计到当前时刻,硬盘IO等待时间(单位:jiffies) ,
irq (233) 从系统启动开始累计到当前时刻,硬中断时间(单位:jiffies)
softirq (5346) 从系统启动开始累计到当前时刻,软中断时间(单位:jiffies)

CPU时间=user+system+nice+idle+iowait+irq+softirq

“intr”这行给出中断的信息,第一个为自系统启动以来,发生的所有的中断的次数;然后每个数对应一个特定的中断自系统启动以来所发生的次数。
“ctxt”给出了自系统启动以来CPU发生的上下文交换的次数。
“btime”给出了从系统启动到现在为止的时间,单位为秒。
“processes (total_forks) 自系统启动以来所创建的任务的个数目。
“procs_running”:当前运行队列的任务的数目。
“procs_blocked”:当前被阻塞的任务的数目。那么CPU利用率的计算方法:可以使用取两个采样点,计算其差值的办法。

(idle2-idle1)/cpu2-cpu1

//------z直接贴代码

#include
#include
#include
#include
#include
#include
#include
#define PNUM 7
#define SPACE 2
#define USERSPACE 5
static char* sko_token(const char * buf)
{
while(isspace(*buf) )buf++;
while((*buf) && !isspace(*buf))buf++;
return (char*) buf;
}

long total_time(long* ptime)
{
long total=0;
int i ;
for( i = 0 ; i < PNUM ; i++)
   {
    total +=ptime[i];
   }
return total;
}

void de_time(double* ptime,long* de_time,long* de_retime)
{
double total,retotal,batotal;
int i ;
batotal = (double)total_time(de_retime)-(double)total_time(de_time);
for( i = 0 ; i < PNUM ; i++)
   {
    ptime[i]=(de_retime[i]-de_time[i])/batotal;
   }
}

void get_time(long* ptime)
{
char buff[4096+1];
int len , i ;
char* pstr;
FILE* fp;
fp=NULL;
fp=fopen("/proc/stat","r");
if(fp !=NULL)
    {
      len = fread(buff,sizeof(char),sizeof(buff)-1,fp);
      fclose(fp);
    }else
     {
       fclose(fp);
     }
buff[len] ="\0";
pstr=sko_token(buff);
for(i = 0 ; i < PNUM ; i++)
   {
    ptime[i] = strtoul(pstr,&pstr,0);
   }
}

void copy_time(long* de_time,long* de_retime)
{
int i;
for(i = 0; i < PNUM;i++)
   {
    de_time[i]=de_retime[i];
   }
}

void deamon_process()
{
int pid,i;
if(pid=fork())
{
   exit(0);
}else if(pid < 0)
   {
    _exit(1);
   }
setsid();
if(pid=fork())
   {
    exit(0);
   }else if(pid < 0)
    {
     _exit(1);
    }
for( i=0;i< NOFILE;++i)
   {
    close(i);
   }

chdir("/tmp");
umask(0);
signal(SIGCHLD,SIG_IGN);
}

int write_log(const char* pstr)
{
FILE *fp;
time_t timep;
fp = NULL;
if((fp=fopen("test.log","a"))==NULL)
{
   fclose(fp);
   return 0;
}else
   {
    time(&timep);
    fprintf(fp,"%s %s \r\n ",asctime(localtime(&timep)),pstr);
                     fclose(fp);
   }
return 1;
}

void system_reboot()
{
sync();
reboot(LINUX_REBOOT_CMD_RESTART);
}

int main(void)
{
long cp_time[7];
long cp_retime[7];
double d_time[7];
char buf[25];
deamon_process();
sleep(USERSPACE);
get_time(cp_time);
for(;;)
   {
    sleep(SPACE);
    get_time(cp_retime);
    de_time(d_time,cp_time,cp_retime);
    if(!d_time[3])
     {
      write_log("reboot system \r\n");
      system_reboot();
     }
    copy_time(cp_time,cp_retime);
   }
return 0;
}