随着计算机网络的广泛普及,系统管理员这个职业也变得越来越普遍。面对纷繁复杂的设备和用户的各种需求,新手系统管理员难免会感到眼花缭乱,不知所措。本文旨在为新手系统管理员提供一个快速上手的指南,帮助他们掌握系统管理的必备知识。

一般来说,网络系统由主机系统、交换设备、路由设备、布线系统以及其他辅助系统(如 UPS、稳压电源)等部分组成。幸运的是,系统集成商在完成系统集成后,通常已经调试好了布线系统和辅助系统。交换设备和路由设备也基本就绪,只需要您进行一些小的修改即可。作为系统管理员,您只需了解这些设备的状态灯含义,判断是否发生硬件故障。一般情况下,对于小的故障,关闭设备并重启后,系统会自动排除。重大问题通常需要厂商协助解决。快速上手的关键在于掌握主机系统,占整体系统的五分之一。您也需要了解交换机和路由器的基本设置,但这是您成为高级管理员后才需要考虑的事项。以下是快速上手的重点内容:

用户管理

无论是 Unix 还是 Windows NT,用户管理都是首要任务。作为新手,您必须立即掌握用户添加、删除和限制等操作。这包括两个方面:

一是使用友好的图形界面管理工具集。在 Sun Solaris 系统中,使用 Openwin 环境下的 /usr/bin/admintools 工具集;在 SCO Unix 中使用 Sysadmsh 管理 Shell 管理用户;在 Novell 系统中,使用 Syscon 菜单即可完成用户及用户组的添加、删除和限制设置等。对于多用户批处理,可以使用 makeusr 和 userdef 实用程序。在 Windows NT 中,使用程序组中的管理工具(公用)组下的域用户管理工具或用户管理工具。使用这些工具,您可以轻松明了地进行用户的创建、删除以及锁定和权限限制等操作。您还可以在 Windows NT 中使用用户组管理和控制面板中的系统属性程序来管理用户环境设置,使用 System Policy Editor 配置基于计算机或用户的域范围配置以及编写登录脚本。

二是掌握字符命令行下的用户管理。主要在 Unix 或 Linux 环境下,包括用编辑工具 Vi、emacs 等对 /etc/passwd 进行操作或直接使用 addusr、delusr 等用户管理命令,以及使用 pwconv 命令 使 /etc/passwd 与 shadow 文件保持一致,使用 SCO 的 /etc/rmuser 命令删除用户。使用 newgrp 命令将用户添加到新组,另外包括用户目录创建命令 mkdir,赋予用户属性和组属性命令 chown 和 chgrp,以及用户区域限制命令 quota 限制用户区域大小,避免用户区域占用硬盘空间过大,造成系统崩溃。用户的 .profile 和 .login 文件可以使用系统标准的配置文件,或在 .profile 中进行相应设置。使用 su 命令或 su username 进入用户环境以进行具体检测。对于用户的消息发布系统,在 Windows NT 中使用 Alert 功能发出,对远程主机使用 Server Manager 中的 computerlsend message 功能。在 Novell 中采用 send 命令。在 Unix 中使用 wall 或 write 指令,也可使用每日消息文件 /etc/motd 或 news 命令发出 /usr/new 文件内容。

安全及日志管理

作为一名系统管理员,您必须能够分析系统日志,找到系统故障的原因。在 Windows NT 中,使用 Administrative Tools 菜单中的 Event Viewer 查看系统的 SYSTEM、SECURITY、APPLICATION 日志文件。对于 Netware,错误日志是 SYSSLOG.ER 件,可以通过 syscon 菜单中的 supervisor options 下的 view file server errorlog 查看记录。文卷错误日志文件是各个文卷中的 VOLSLOG.LOG 以及事务跟踪处理系统错误日志文件 SYS:文卷中的 TTSSLOG.ER 件。

Unix 中的各项日志包括 /usr/adm 目录下的系统错误登记文件 message、使用 su 命令的记录文件 sulog、每个用户记录上次注册时间的登记文件 lastlog、系统中注册用户的有关信息文件 wtmp、每个用户所执行命令的内容项文件 acct 以及 /etc 目录下当前注册用户的有关信息文件 utmp 和其他应用程序产生的日志文件。

对于其中的一些日志文件,可以使用 who 或 w 命令查看当前系统的登录使用者;last 命令查看以前的登录情况。这些命令都可以合并使用 grep进行条件控制选择过滤。使用 find 查看文件及其属主,特别监控具有根访问权的进程及文件,以及检查开机文件 /etc/inetd.conf、/etc/rc.local、/etc/passwd 和 cron 或 at 运行的文件。使用 corntab-l 与 corntab-r 命令对用户的 corntab 文件进行列出与删除管理。使用 ls -IR 生成主检查表,并定期生成新表。使用 diff 命令进行比较,并使检查通过的新表成为新的主检查表,直到下一次检查为止。

强烈建议您在 inetd.conf 中注释掉所有的 r 打头的命令文件,并去掉 /etc/hosts.equlv 中的所有项,也不允许用户设立个人的 .rhosts 文件。使可信主机不予设立或为空以加强系统的安全性。

系统进程管理

在 Unix 中,系统报告命令包括:

  • df:报告自由磁盘块数
  • du:总结磁盘使用状况
  • nice:改变某个命令所设优先权
  • pstat:报告系统信息,如节点表或进程表
  • sar:报告系统的活动状态,如 CPU 的使用和缓存区的活动状况
  • time:打印过去的时间、系统时间以及命令的执行时间
  • uptime:报告系统的活动状况,如系统启动时间及已运行时间
  • vmstat:报告页数及系统统计数字,如分支点的情况

BSD Unix 中的 ps -aux 或 system V 中的 ps -ef 以及 Linux 中的 ps aux 用来查看进程状态及其宿主,并使用 kill 命令及时停止不正常的进程。

在 Windows NT 中,使用 Task Manager 查看 CPU 和内存的使用情况,进行进程管理。还可以使用 performance monitor 进行状态监控,及时做出调节。值得注意的是,随着网络应用的扩大,病毒成为对网络安全的一大威胁。在网络上安装病毒检测和清除工具已经成为网络管理的必修课。

备份管理

对于一个重要系统来说,及时备份是必需的。从一开始就必须养成及时定期备份的习惯。掌握备份的基本方法和步骤,以及使用基本的备份还原命令,如:Windows NT 中使用管理工具集中的 NTBackup 程序。由于 Backup 中不存在调度能力,备份必须手工完成或使用 AT 命令行实现调度;也可以采用第三方的备份解决方案。Unix 中,System V 使用 tar、cpio 以及 backup、restor、rolcopy;BSD 中使用 tar、dump、restor 等;SCO 中使用 sysadmin 进行文件系统备份和恢复文件。备份还必须制定计划,指定何时进行何种备份,包括全集备份和递增备份。例如,每周做一次全集备份,每天进行一次递增备份。如果系统不经常变化,则可以每月一次全集备份,每周一次递增备份。

恢复与容错管理

当系统出现故障时,作为系统管理员必须能定位并解决问题。这依赖于对控制台出错信息以及日志文件的分析。更重要的是平日的备份以及应急系统盘的制备。对于 Windows NT 来说,是建立系统引导盘、紧急修复盘等,并使用 Disk Administrator 建立镜像等 RAID 操作。对于 Unix 来说,也依赖于系统安装盘与紧急修复盘的建立。特别是,系统做任何改动后,都要重新生成新的系统恢复盘,并进行同步备份。使用单用户模式排除系统的绝大部分问题,即启动时使用 boot-single 命令。这是关键。管理员的口令是绝对不能忘记的,否则会造成麻烦。对于管理人员而言,自己以及其他用户都加上口令的使用限制,如口令长度和日期限制以及其他限制,是非常必要的。太过简单的口令往往会造成不安全的隐患。在容错上则还包括经常运行各类维护系统命令,如超级块维护命令 SYNC,文件系统检查命令 fsck。

文件系统与开关机管理

在所有多用户系统中,由于广泛采用文件缓冲,对文件的修改在内存进行之后再写入磁盘。内核程序定时刷新这些缓冲区,以保持文件与缓冲区间同步。不终止系统就关机,往往会造成同步的破坏,而出现文件系统的错误。在 Windows NT 中,使用启动菜单中的关闭系统选项来关闭系统。Unix 则采用 shutdown、halt(haltsys)、reboot 等命令。一般推荐使用 shutdown 加参数来关机或进入单用户备份状态,直到完成关机程序后,才能关闭电源。无论如何,这是必须牢记的。

在维护 Unix 文件系统时,应经常运行超级块一致命令 sync,文件系统检查及错误修改命令 fsck。新建一个文件系统时使用 mkfs 命令。Unix System V 的 fsstat 将报告文件系统的状态,以及设备管理命令 mount、umount

网络管理

网络管理涉及调试电子邮件、DNS 和万维网 (WWW)。

  • 电子邮件

    • 使用 sendmail-bt -C filename
    • 或先 mail user,再 telnet host 110,使用 POP3 命令 (如 USER usernamePASS passwdLISTRETR .quit) 调试。
  • DNS

    • 使用 nslookup 命令解析域名,查看是否正确解析为 IP 地址。
  • WWW

    • 通过浏览器进行检查。
    • 查看 ~/.httpd/ 下的浏览日志。

对于 Windows NT,请执行以下步骤:

  • 通过“管理工具”下的“Server Manager”查看服务程序是否正常运行。
  • 使用以下 SMTP 命令进行检测:helo hostSend from: <yourname@hostname>rcpt to: <username@hostname>datamessagebody.exit
  • POP3 命令与 Unix 相同。
  • 直接通过在线管理方式管理 WWW,操作简单易懂。

日常网络管理还包括:

  • 使用 ping 查看网络连接状态。
  • 使用 netstat 查看协议统计数据和当前网络连接状态。
  • 使用 ifconfig 进行网络接口设置。
  • 使用 tracert 进行路由状态监视。

对于 Windows NT 系统,还包括:

  • 使用 \winnt\system32\Regedit32 控制注册表。
  • 使用 ipconfig 查看 IP 设置。
  • 使用 NT Server 随附的 Network Monitor 进行网络负载和性能统计。

对于 Novell 系统,可以使用以下工具进行管理:

  • NETADMIN 实用程序
  • 图形界面管理工具 Netware Administrator (用于监视本地服务器状态)

对于第三方网络管理软件,可以选择以下选项:

  • HP OpenView
  • BAY Optivity
  • IBM Netview
  • Sun SunNetManager

总结

作为系统管理员,掌握这些操作至关重要。及时进行系统升级也很重要,以修复已知漏洞并防止黑客入侵。需要注意的是,新手可能会犯操作错误,因此在进行任何更改之前,应备份要更改的部分并详细记录操作步骤。细致、谨慎和认真,才能最大限度地保证系统的正常运行。外出时,请务必使用锁屏程序锁定屏幕,以防止他人乘机入侵系统。