
IT系统运维工程师应聘指南:基础设施管理专项
2024/2/18大约 16 分钟
IT系统运维工程师应聘指南01 - 基础设施管理专项指南
岗位职责重点
负责服务器、网络设备、操作系统、数据库等的安装、配置与维护;管理虚拟化平台(如VMware、Hyper-V等)和阿里云平台
一、服务器管理详细操作指南
1.1 服务器硬件安装与配置
操作步骤详解:
服务器上架安装:
# 1. 服务器上架前检查清单
- 确认机柜空间和承重
- 检查电源供应(双路电源)
- 确认网络接口位置
- 准备导轨和螺丝
# 2. 硬件配置检查
- CPU:检查型号、核心数、主频
- 内存:检查容量、类型(DDR4/DDR5)、频率
- 存储:检查硬盘类型(SSD/HDD)、RAID配置
- 网卡:检查千兆/万兆网卡配置BIOS/UEFI配置:
# 关键配置项目
1. 启动顺序设置
2. RAID配置(RAID1/RAID5/RAID10)
3. 网络启动(PXE)配置
4. 电源管理设置
5. 虚拟化支持开启(VT-x/AMD-V)面试重点问题:
Q1: 如何配置服务器RAID?
A: RAID配置步骤:
1. 开机进入RAID配置界面(通常是Ctrl+R或F2)
2. 选择RAID级别:
- RAID1:镜像,容错性好,容量减半
- RAID5:至少3块盘,允许1块盘故障
- RAID10:结合RAID1和RAID0的优势
3. 选择硬盘,创建虚拟驱动器
4. 设置条带大小(通常64KB或128KB)
5. 初始化阵列Q2: 服务器无法启动如何排查?
A: 故障排查流程:
1. 检查电源指示灯状态
2. 查看POST自检信息
3. 检查内存条是否松动
4. 检查硬盘连接和RAID状态
5. 查看系统日志(BMC/iDRAC)
6. 检查CPU温度和风扇运行状态1.2 操作系统安装与配置
Linux系统安装详细步骤:
CentOS 8安装配置:
# 1. 制作安装介质
dd if=CentOS-8.x.x-x86_64-dvd1.iso of=/dev/sdX bs=4M status=progress
# 2. 分区规划
/boot - 1GB (ext4)
/ - 50GB (xfs)
/var - 20GB (xfs)
/home - 10GB (xfs)
/tmp - 5GB (xfs)
swap - 8GB (物理内存的1-2倍)
# 3. 网络配置
vi /etc/sysconfig/network-scripts/ifcfg-ens33
TYPE=Ethernet
PROXY_METHOD=none
BROWSER_ONLY=no
BOOTPROTO=static
DEFROUTE=yes
IPV4_FAILURE_FATAL=no
IPV6INIT=yes
IPV6_AUTOCONF=yes
IPV6_DEFROUTE=yes
IPV6_FAILURE_FATAL=no
NAME=ens33
UUID=xxxx-xxxx-xxxx-xxxx
DEVICE=ens33
ONBOOT=yes
IPADDR=192.168.1.100
NETMASK=255.255.255.0
GATEWAY=192.168.1.1
DNS1=8.8.8.8
DNS2=114.114.114.114
# 4. 系统初始化配置
# 关闭SELinux
sed -i 's/SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config
# 关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
# 配置时间同步
yum install -y chrony
systemctl enable chronyd
systemctl start chronyd
# 配置SSH
vi /etc/ssh/sshd_config
Port 22
Protocol 2
PermitRootLogin no
PubkeyAuthentication yes
PasswordAuthentication yes
MaxAuthTries 3
ClientAliveInterval 60
ClientAliveCountMax 3
# 创建管理用户
useradd -m -s /bin/bash admin
echo "admin:Password123!" | chpasswd
usermod -aG wheel admin
# 配置sudo权限
echo "admin ALL=(ALL) NOPASSWD:ALL" >> /etc/sudoers.d/adminWindows Server 2019安装配置:
# 1. 系统初始化配置
# 设置计算机名
Rename-Computer -NewName "WEB-SERVER-01" -Restart
# 2. 网络配置
$adapter = Get-NetAdapter -Name "Ethernet"
New-NetIPAddress -InterfaceIndex $adapter.ifIndex -IPAddress 192.168.1.101 -PrefixLength 24 -DefaultGateway 192.168.1.1
Set-DnsClientServerAddress -InterfaceIndex $adapter.ifIndex -ServerAddresses 8.8.8.8,114.114.114.114
# 3. 启用远程桌面
Set-ItemProperty -Path 'HKLM:\System\CurrentControlSet\Control\Terminal Server' -name "fDenyTSConnections" -value 0
Enable-NetFirewallRule -DisplayGroup "Remote Desktop"
# 4. 安装必要角色和功能
Install-WindowsFeature -Name Web-Server -IncludeManagementTools
Install-WindowsFeature -Name RSAT-AD-Tools
# 5. 配置Windows Update
# 设置自动更新策略
Set-ItemProperty -Path "HKLM:\SOFTWARE\Policies\Microsoft\Windows\WindowsUpdate\AU" -Name "NoAutoUpdate" -Value 0面试重点问题:
Q3: Linux系统如何进行性能调优?
A: 系统性能调优策略:
# 1. 内核参数优化
vi /etc/sysctl.conf
net.core.rmem_max = 134217728
net.core.wmem_max = 134217728
net.ipv4.tcp_rmem = 4096 65536 134217728
net.ipv4.tcp_wmem = 4096 65536 134217728
net.ipv4.tcp_congestion_control = bbr
vm.swappiness = 10
fs.file-max = 6553600
# 2. 文件描述符限制
vi /etc/security/limits.conf
* soft nofile 65535
* hard nofile 65535
* soft nproc 65535
* hard nproc 65535
# 3. 磁盘I/O调度算法
echo deadline > /sys/block/sda/queue/scheduler
# 4. CPU调频策略
cpupower frequency-set -g performanceQ4: 如何排查Linux系统负载高的问题?
A: 系统负载排查步骤:
# 1. 查看系统负载
uptime
# Load average: 1分钟、5分钟、15分钟平均负载
# 2. 分析CPU使用情况
top -p 1
# 查看各进程CPU使用率
ps aux --sort=-%cpu | head -20
# 3. 分析内存使用情况
free -h
# 查看内存使用详情
cat /proc/meminfo
# 4. 分析磁盘I/O
iostat -x 1 5
# 查看磁盘I/O统计信息
iotop
# 5. 分析网络连接
netstat -tulnp | grep :80
ss -tuln
# 6. 查看系统日志
journalctl -f
tail -f /var/log/messages二、网络设备管理详细操作指南
2.1 交换机配置
华为交换机基础配置:
# 1. 进入系统视图
<Huawei>system-view
[Huawei]
# 2. 修改设备名称
[Huawei]sysname Switch-Core-01
[Switch-Core-01]
# 3. 创建VLAN
[Switch-Core-01]vlan batch 10 20 30 100
[Switch-Core-01]vlan 10
[Switch-Core-01-vlan10]description Management-VLAN
[Switch-Core-01-vlan10]quit
# 4. 配置接口
[Switch-Core-01]interface gigabitethernet 0/0/1
[Switch-Core-01-GigabitEthernet0/0/1]port link-type access
[Switch-Core-01-GigabitEthernet0/0/1]port default vlan 10
[Switch-Core-01-GigabitEthernet0/0/1]quit
# 5. 配置Trunk接口
[Switch-Core-01]interface gigabitethernet 0/0/24
[Switch-Core-01-GigabitEthernet0/0/24]port link-type trunk
[Switch-Core-01-GigabitEthernet0/0/24]port trunk allow-pass vlan 10 20 30
[Switch-Core-01-GigabitEthernet0/0/24]quit
# 6. 配置管理IP
[Switch-Core-01]interface vlanif 10
[Switch-Core-01-Vlanif10]ip address 192.168.10.254 255.255.255.0
[Switch-Core-01-Vlanif10]quit
# 7. 配置默认路由
[Switch-Core-01]ip route-static 0.0.0.0 0.0.0.0 192.168.10.1
# 8. 配置SSH服务
[Switch-Core-01]ssh server enable
[Switch-Core-01]aaa
[Switch-Core-01-aaa]local-user admin password cipher Admin@123
[Switch-Core-01-aaa]local-user admin privilege level 15
[Switch-Core-01-aaa]local-user admin service-type ssh
[Switch-Core-01-aaa]quit
# 9. 保存配置
[Switch-Core-01]save思科交换机基础配置:
# 1. 进入特权模式
Switch>enable
Switch#
# 2. 进入全局配置模式
Switch#configure terminal
Switch(config)#
# 3. 配置主机名
Switch(config)#hostname Core-Switch-01
Core-Switch-01(config)#
# 4. 创建VLAN
Core-Switch-01(config)#vlan 10
Core-Switch-01(config-vlan)#name Management
Core-Switch-01(config-vlan)#exit
# 5. 配置接口
Core-Switch-01(config)#interface fastethernet 0/1
Core-Switch-01(config-if)#switchport mode access
Core-Switch-01(config-if)#switchport access vlan 10
Core-Switch-01(config-if)#exit
# 6. 配置Trunk
Core-Switch-01(config)#interface fastethernet 0/24
Core-Switch-01(config-if)#switchport mode trunk
Core-Switch-01(config-if)#switchport trunk allowed vlan 10,20,30
Core-Switch-01(config-if)#exit
# 7. 配置SVI
Core-Switch-01(config)#interface vlan 10
Core-Switch-01(config-if)#ip address 192.168.10.254 255.255.255.0
Core-Switch-01(config-if)#no shutdown
Core-Switch-01(config-if)#exit
# 8. 保存配置
Core-Switch-01#copy running-config startup-config2.2 路由器配置
华为路由器基础配置:
# 1. 配置接口IP
[Huawei]interface gigabitethernet 0/0/0
[Huawei-GigabitEthernet0/0/0]ip address 192.168.1.1 255.255.255.0
[Huawei-GigabitEthernet0/0/0]quit
# 2. 配置静态路由
[Huawei]ip route-static 192.168.2.0 255.255.255.0 192.168.1.2
# 3. 配置OSPF
[Huawei]ospf 1 router-id 1.1.1.1
[Huawei-ospf-1]area 0.0.0.0
[Huawei-ospf-1-area-0.0.0.0]network 192.168.1.0 0.0.0.255
[Huawei-ospf-1-area-0.0.0.0]quit
[Huawei-ospf-1]quit
# 4. 配置NAT
[Huawei]acl number 2000
[Huawei-acl-basic-2000]rule 5 permit source 192.168.1.0 0.0.0.255
[Huawei-acl-basic-2000]quit
[Huawei]interface gigabitethernet 0/0/1
[Huawei-GigabitEthernet0/0/1]nat outbound 2000面试重点问题:
Q5: 如何排查网络连通性问题?
A: 网络故障排查步骤:
# 1. 物理层检查
- 检查网线连接
- 查看接口指示灯状态
- 检查端口是否启用
# 2. 数据链路层检查
# 查看MAC地址表
display mac-address
# 检查VLAN配置
display vlan
# 3. 网络层检查
# ping测试连通性
ping 192.168.1.1
# 查看路由表
display ip routing-table
# 检查ARP表
display arp
# 4. 传输层检查
# 检查端口监听状态
netstat -tlnp
# 测试端口连通性
telnet 192.168.1.1 80
# 5. 应用层检查
# DNS解析测试
nslookup www.baidu.com
# HTTP连接测试
curl -I http://www.baidu.comQ6: 如何配置链路聚合?
A: 链路聚合配置(以华为设备为例):
# 1. 创建Eth-Trunk接口
[Huawei]interface eth-trunk 1
[Huawei-Eth-Trunk1]quit
# 2. 将物理接口加入Eth-Trunk
[Huawei]interface gigabitethernet 0/0/1
[Huawei-GigabitEthernet0/0/1]eth-trunk 1
[Huawei-GigabitEthernet0/0/1]quit
[Huawei]interface gigabitethernet 0/0/2
[Huawei-GigabitEthernet0/0/2]eth-trunk 1
[Huawei-GigabitEthernet0/0/2]quit
# 3. 配置负载分担方式
[Huawei]interface eth-trunk 1
[Huawei-Eth-Trunk1]load-balance src-dst-mac
[Huawei-Eth-Trunk1]quit
# 4. 配置LACP模式
[Huawei]interface eth-trunk 1
[Huawei-Eth-Trunk1]mode lacp-static
[Huawei-Eth-Trunk1]quit三、数据库管理详细操作指南
3.1 MySQL数据库安装配置
MySQL 8.0安装配置:
# 1. 安装MySQL
# CentOS 8
dnf install -y mysql-server mysql
# 2. 启动服务
systemctl start mysqld
systemctl enable mysqld
# 3. 安全配置
mysql_secure_installation
# 4. 配置文件优化
vi /etc/my.cnf.d/mysql-server.cnf
[mysqld]
# 基础配置
port = 3306
datadir = /var/lib/mysql
socket = /var/lib/mysql/mysql.sock
log-error = /var/log/mysql/mysqld.log
pid-file = /var/run/mysqld/mysqld.pid
# 字符集配置
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
# InnoDB配置
innodb_buffer_pool_size = 2G
innodb_log_file_size = 256M
innodb_log_buffer_size = 64M
innodb_flush_log_at_trx_commit = 2
innodb_file_per_table = 1
# 连接配置
max_connections = 500
max_connect_errors = 1000
wait_timeout = 600
interactive_timeout = 600
# 查询缓存
query_cache_type = 1
query_cache_size = 128M
# 慢查询日志
slow_query_log = 1
slow_query_log_file = /var/log/mysql/slow.log
long_query_time = 2
# 5. 创建数据库用户
mysql -u root -p
CREATE DATABASE webapp DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
CREATE USER 'webapp'@'%' IDENTIFIED BY 'WebApp@123!';
GRANT ALL PRIVILEGES ON webapp.* TO 'webapp'@'%';
FLUSH PRIVILEGES;
# 6. 备份脚本
#!/bin/bash
BACKUP_DIR="/backup/mysql"
DATE=$(date +%Y%m%d_%H%M%S)
DB_NAME="webapp"
DB_USER="backup_user"
DB_PASS="BackupPass@123"
mkdir -p $BACKUP_DIR
mysqldump -u$DB_USER -p$DB_PASS \
--single-transaction \
--routines \
--triggers \
--events \
$DB_NAME > $BACKUP_DIR/${DB_NAME}_${DATE}.sql
# 压缩备份文件
gzip $BACKUP_DIR/${DB_NAME}_${DATE}.sql
# 删除7天前的备份
find $BACKUP_DIR -name "*.sql.gz" -mtime +7 -delete3.2 MySQL性能调优
性能监控和优化:
-- 1. 查看数据库状态
SHOW STATUS LIKE 'Threads_connected';
SHOW STATUS LIKE 'Queries';
SHOW STATUS LIKE 'Uptime';
-- 2. 查看慢查询
SHOW VARIABLES LIKE 'slow_query_log';
SHOW VARIABLES LIKE 'long_query_time';
-- 3. 分析慢查询日志
-- 使用mysqldumpslow工具
mysqldumpslow -s t -t 10 /var/log/mysql/slow.log
-- 4. 查看表状态
SHOW TABLE STATUS LIKE 'users';
-- 5. 分析SQL执行计划
EXPLAIN SELECT * FROM users WHERE email = 'user@example.com';
-- 6. 查看索引使用情况
SHOW INDEX FROM users;
-- 7. 优化表
OPTIMIZE TABLE users;
-- 8. 分析表
ANALYZE TABLE users;面试重点问题:
Q7: MySQL主从复制如何配置?
A: MySQL主从复制配置步骤:
# 主服务器配置
# 1. 修改配置文件 /etc/my.cnf
[mysqld]
server-id = 1
log-bin = mysql-bin
binlog-format = ROW
sync_binlog = 1
innodb_flush_log_at_trx_commit = 1
# 2. 重启MySQL服务
systemctl restart mysqld
# 3. 创建复制用户
mysql -u root -p
CREATE USER 'replication'@'%' IDENTIFIED BY 'Repl@123!';
GRANT REPLICATION SLAVE ON *.* TO 'replication'@'%';
FLUSH PRIVILEGES;
# 4. 获取binlog位置
SHOW MASTER STATUS;
# 从服务器配置
# 1. 修改配置文件
[mysqld]
server-id = 2
relay-log = relay-bin
read-only = 1
# 2. 重启MySQL服务
systemctl restart mysqld
# 3. 配置主从关系
mysql -u root -p
CHANGE MASTER TO
MASTER_HOST='192.168.1.100',
MASTER_USER='replication',
MASTER_PASSWORD='Repl@123!',
MASTER_LOG_FILE='mysql-bin.000001',
MASTER_LOG_POS=154;
# 4. 启动从服务器
START SLAVE;
# 5. 检查状态
SHOW SLAVE STATUS\GQ8: 如何处理MySQL数据库锁等待问题?
A: 锁等待问题排查和处理:
-- 1. 查看当前锁等待情况
SELECT * FROM information_schema.INNODB_LOCKS;
SELECT * FROM information_schema.INNODB_LOCK_WAITS;
-- 2. 查看当前事务状态
SELECT * FROM information_schema.INNODB_TRX;
-- 3. 查看正在执行的SQL
SHOW PROCESSLIST;
-- 4. 杀死阻塞进程
KILL <process_id>;
-- 5. 查看锁等待超时设置
SHOW VARIABLES LIKE 'innodb_lock_wait_timeout';
-- 6. 分析死锁信息
SHOW ENGINE INNODB STATUS;
-- 7. 预防措施
-- 合理设计索引,减少锁定范围
-- 控制事务大小,及时提交
-- 避免长时间的查询操作
-- 按相同顺序访问表和行四、虚拟化平台管理详细操作指南
4.1 VMware vSphere管理
ESXi主机配置:
# 1. ESXi主机网络配置
# 通过vSphere Client连接ESXi主机
# 配置管理网络:
- IP地址:192.168.1.50
- 子网掩码:255.255.255.0
- 默认网关:192.168.1.1
- DNS服务器:8.8.8.8
# 2. 存储配置
# 添加NFS存储
esxcli storage nfs add -H 192.168.1.200 -s /datastore1 -v datastore1
# 添加iSCSI存储
esxcli iscsi software set --enabled=true
esxcli iscsi adapter discovery sendtarget add -A vmhba33 -a 192.168.1.201
# 3. 虚拟交换机配置
# 创建标准交换机
esxcli network vswitch standard add -v vSwitch1
esxcli network vswitch standard portgroup add -p "VM Network" -v vSwitch1
esxcli network vswitch standard uplink add -u vmnic1 -v vSwitch1
# 4. 虚拟机创建
# 通过PowerCLI创建虚拟机
Connect-VIServer -Server 192.168.1.50 -User root -Password ESXi@123
$vm = New-VM -Name "Web-Server-01" -ResourcePool (Get-ResourcePool) -Datastore "datastore1" -DiskGB 40 -MemoryGB 4 -NumCpu 2 -GuestId "centos7_64Guest"
# 添加网络适配器
$vm | New-NetworkAdapter -NetworkName "VM Network" -StartConnected -Type Vmxnet3虚拟机模板制作:
# 1. 准备基础虚拟机
# 安装操作系统
# 安装VMware Tools
# 进行系统优化配置
# 2. 系统准备(Linux)
# 清理日志文件
rm -rf /var/log/*
rm -rf /tmp/*
# 清理网络配置
rm -f /etc/udev/rules.d/70-persistent-net.rules
rm -f /etc/sysconfig/network-scripts/ifcfg-eth*
# 清理SSH密钥
rm -f /etc/ssh/ssh_host_*
rm -f /root/.ssh/authorized_keys
# 清理命令历史
history -c
> ~/.bash_history
# 3. 关闭虚拟机并转换为模板
# 在vSphere Client中右键虚拟机
# 选择"转换为模板"
# 4. 从模板部署虚拟机
# 右键模板,选择"从此模板部署虚拟机"
# 选择目标主机和存储
# 配置虚拟机规格
# 自定义虚拟机配置4.2 Hyper-V管理
Hyper-V安装配置:
# 1. 安装Hyper-V角色
Install-WindowsFeature -Name Hyper-V -IncludeManagementTools -Restart
# 2. 创建虚拟交换机
New-VMSwitch -Name "External" -NetAdapterName "Ethernet" -AllowManagementOS $true
New-VMSwitch -Name "Internal" -SwitchType Internal
New-VMSwitch -Name "Private" -SwitchType Private
# 3. 配置虚拟机存储路径
Set-VMHost -VirtualHardDiskPath "D:\Hyper-V\Virtual Hard Disks"
Set-VMHost -VirtualMachinePath "D:\Hyper-V\Virtual Machines"
# 4. 创建虚拟机
$VM = New-VM -Name "Web-Server-01" -MemoryStartupBytes 4GB -Generation 2 -SwitchName "External"
Set-VM -Name "Web-Server-01" -ProcessorCount 2 -DynamicMemory -MemoryMinimumBytes 1GB -MemoryMaximumBytes 8GB
# 5. 添加虚拟硬盘
New-VHD -Path "D:\Hyper-V\Virtual Hard Disks\Web-Server-01.vhdx" -SizeBytes 40GB -Dynamic
Add-VMHardDiskDrive -VMName "Web-Server-01" -Path "D:\Hyper-V\Virtual Hard Disks\Web-Server-01.vhdx"
# 6. 添加DVD驱动器
Add-VMDvdDrive -VMName "Web-Server-01" -Path "C:\ISO\CentOS-8.iso"
# 7. 启动虚拟机
Start-VM -Name "Web-Server-01"面试重点问题:
Q9: 虚拟机性能调优有哪些方法?
A: 虚拟机性能调优策略:
1. CPU调优:
- 避免CPU过量分配(1:4比例)
- 启用硬件虚拟化支持
- 配置CPU亲和性
- 使用CPU预留和限制
2. 内存调优:
- 合理配置内存气球驱动
- 启用透明页面共享(TPS)
- 配置内存预留
- 避免内存交换
3. 存储调优:
- 使用SSD存储虚拟机
- 配置多路径I/O
- 优化存储队列深度
- 使用厚置备磁盘
4. 网络调优:
- 使用SR-IOV技术
- 配置网络负载均衡
- 启用巨帧(Jumbo Frame)
- 使用VMXNET3网卡Q10: 如何进行虚拟机的备份和恢复?
A: 虚拟机备份恢复策略:
# VMware环境备份
1. 快照备份:
# 创建快照
New-Snapshot -VM "Web-Server-01" -Name "Before-Update" -Description "System update backup"
# 恢复快照
Set-VM -VM "Web-Server-01" -Snapshot "Before-Update" -Confirm:$false
2. vSphere Data Protection:
# 配置备份策略
- 每日增量备份
- 每周完整备份
- 保留4周备份
3. 第三方备份工具:
# Veeam Backup & Replication
- 配置备份作业
- 设置备份计划
- 配置保留策略
# Hyper-V环境备份
1. Hyper-V备份:
# 导出虚拟机
Export-VM -Name "Web-Server-01" -Path "D:\Backup\"
# 导入虚拟机
Import-VM -Path "D:\Backup\Web-Server-01\Virtual Machines\xxx.vmcx"
2. Windows Server Backup:
# 安装备份功能
Install-WindowsFeature Windows-Server-Backup
# 创建备份策略
$Policy = New-WBPolicy
Add-WBVirtualMachine -Policy $Policy -VirtualMachine "Web-Server-01"
Start-WBBackup -Policy $Policy五、云平台管理详细操作指南
5.1 阿里云ECS管理
ECS实例创建和配置:
# 1. 使用阿里云CLI创建ECS实例
# 安装阿里云CLI
wget https://aliyuncli.alicdn.com/aliyun-cli-linux-latest-amd64.tgz
tar -xzf aliyun-cli-linux-latest-amd64.tgz
sudo mv aliyun /usr/local/bin/
# 配置访问凭证
aliyun configure set \
--profile default \
--mode AK \
--region cn-hangzhou \
--access-key-id LTAI4xxx \
--access-key-secret xxx
# 2. 创建VPC和交换机
aliyun ecs CreateVpc \
--RegionId cn-hangzhou \
--VpcName "production-vpc" \
--CidrBlock "10.0.0.0/16"
aliyun ecs CreateVSwitch \
--RegionId cn-hangzhou \
--VpcId vpc-xxx \
--VSwitchName "web-subnet" \
--CidrBlock "10.0.1.0/24" \
--ZoneId cn-hangzhou-b
# 3. 创建安全组
aliyun ecs CreateSecurityGroup \
--RegionId cn-hangzhou \
--SecurityGroupName "web-sg" \
--Description "Web server security group" \
--VpcId vpc-xxx
# 添加安全组规则
aliyun ecs AuthorizeSecurityGroup \
--RegionId cn-hangzhou \
--SecurityGroupId sg-xxx \
--IpProtocol tcp \
--PortRange "22/22" \
--SourceCidrIp "0.0.0.0/0"
aliyun ecs AuthorizeSecurityGroup \
--RegionId cn-hangzhou \
--SecurityGroupId sg-xxx \
--IpProtocol tcp \
--PortRange "80/80" \
--SourceCidrIp "0.0.0.0/0"
# 4. 创建ECS实例
aliyun ecs CreateInstance \
--RegionId cn-hangzhou \
--ImageId centos_7_9_x64_20G_alibase_xxx.vhd \
--InstanceType ecs.c6.large \
--SecurityGroupId sg-xxx \
--VSwitchId vsw-xxx \
--InstanceName "web-server-01" \
--Password "Server@123!" \
--SystemDisk.Category cloud_ssd \
--SystemDisk.Size 40 \
--InternetMaxBandwidthOut 5
# 5. 启动实例
aliyun ecs StartInstance --InstanceId i-xxx阿里云RDS配置:
# 1. 创建RDS实例
aliyun rds CreateDBInstance \
--RegionId cn-hangzhou \
--Engine MySQL \
--EngineVersion 8.0 \
--DBInstanceClass mysql.n2.medium.1 \
--DBInstanceStorage 100 \
--DBInstanceStorageType cloud_ssd \
--PayType Postpaid \
--SecurityIPList "10.0.1.0/24"
# 2. 创建数据库
aliyun rds CreateDatabase \
--DBInstanceId rm-xxx \
--DBName webapp \
--CharacterSetName utf8mb4
# 3. 创建账号
aliyun rds CreateAccount \
--DBInstanceId rm-xxx \
--AccountName webapp \
--AccountPassword "WebApp@123!" \
--AccountType Normal
# 4. 授权账号
aliyun rds GrantAccountPrivilege \
--DBInstanceId rm-xxx \
--AccountName webapp \
--DBName webapp \
--AccountPrivilege ReadWrite5.2 阿里云监控配置
云监控配置:
# 1. 安装云监控Agent
wget http://cms-download.aliyun.com/cms-go-agent/1.3.7/cms-go-agent-linux-amd64.tar.gz
tar -xzf cms-go-agent-linux-amd64.tar.gz
sudo sh cms-go-agent-linux-amd64/install.sh
# 2. 配置自定义监控
# 创建监控脚本
cat > /usr/local/bin/custom_monitor.sh << 'EOF'
#!/bin/bash
# 获取系统负载
LOAD=$(uptime | awk -F'load average:' '{print $2}' | awk '{print $1}' | sed 's/,//')
# 获取内存使用率
MEM_USAGE=$(free | grep Mem | awk '{printf("%.2f", ($3/$2) * 100.0)}')
# 获取磁盘使用率
DISK_USAGE=$(df -h / | awk 'NR==2 {print $5}' | sed 's/%//')
# 发送到云监控
/usr/local/cms/cms-go-agent \
--metric-name "custom.system.load" \
--metric-value $LOAD \
--dimension "host=$(hostname)"
/usr/local/cms/cms-go-agent \
--metric-name "custom.system.memory" \
--metric-value $MEM_USAGE \
--dimension "host=$(hostname)"
/usr/local/cms/cms-go-agent \
--metric-name "custom.system.disk" \
--metric-value $DISK_USAGE \
--dimension "host=$(hostname)"
EOF
chmod +x /usr/local/bin/custom_monitor.sh
# 3. 配置定时任务
echo "*/5 * * * * /usr/local/bin/custom_monitor.sh" | crontab -面试重点问题:
Q11: 如何设计高可用的云架构?
A: 高可用云架构设计原则:
1. 多可用区部署:
- 应用服务器分布在不同可用区
- 数据库配置主从跨可用区
- 负载均衡器配置健康检查
2. 自动扩缩容:
- 配置弹性伸缩组
- 设置CPU/内存阈值
- 配置扩容/缩容策略
3. 数据备份:
- 自动数据库备份
- 跨地域数据复制
- 定期备份恢复演练
4. 监控告警:
- 全方位监控指标
- 多级别告警策略
- 自动故障恢复
架构示例:
Internet -> SLB -> ECS(多AZ) -> RDS(主从) -> OSS(备份)Q12: 云成本如何优化?
A: 云成本优化策略:
1. 资源右键配置:
- 监控资源使用率
- 选择合适的实例规格
- 关闭非生产环境资源
2. 使用预留实例:
- 购买一年期/三年期实例
- 享受折扣优惠
- 适用于稳定业务
3. 存储优化:
- 使用对象存储替代块存储
- 配置生命周期策略
- 压缩和去重数据
4. 网络优化:
- 使用CDN减少带宽成本
- 合理配置带宽规格
- 使用VPC内网通信
5. 自动化管理:
- 定时开关机策略
- 自动清理临时资源
- 监控成本异常面试准备建议
技术深度准备
- 动手实践:在虚拟环境中完成所有操作步骤
- 故障模拟:人为制造故障,练习排查解决
- 文档整理:将操作步骤和经验教训记录成文档
- 持续学习:关注新技术发展趋势
面试技巧
- 结构化回答:按照"分析-操作-验证"的思路回答
- 举例说明:用具体项目经验支撑技术能力
- 主动提问:展示对技术细节的思考
- 诚实沟通:不会的技术点要诚实说明
常见面试问题汇总
- 服务器硬件故障排查流程
- Linux系统性能调优方法
- 网络连通性问题排查
- 数据库备份恢复策略
- 虚拟化平台选择和配置
- 云平台迁移方案设计
- 高可用架构设计思路
- 安全防护措施实施
建议将本指南作为面试准备的参考资料,结合实际项目经验进行深入学习和实践。