[네트워크] 시스코 BB(백본) 스위치 교체 작업 완벽 가이드 — 사전준비부터 이중화 테스트까지
📌 요약 · 백본(BB) 스위치는 네트워크의 심장 같은 장비라 교체 작업의 난이도와 책임감이 큽니다. 이 글은 시스코 BB 스위치(예: Catalyst 9600 등) 교체의 전체 흐름을 사전 준비 → 정보 수집 → 신규 장비 셋업 → 라이센스 등록 → 슈퍼바이저 이중화 테스트 → 전원 이중화 테스트 → 교체 후 검증 순으로 정리했습니다.
📑 목차
BB 스위치란 — 왜 작업이 까다로울까
BB(Backbone) 스위치는 네트워크 전체 트래픽이 모이는 코어 계층의 대형 섀시(Chassis) 스위치를 말합니다. 시스코의 Catalyst 6800·9600 시리즈가 대표적이고, 슬롯식 구조로 슈퍼바이저(엔진) 카드와 라인 카드, 다중 전원 모듈을 결합해 구성합니다.
BB 스위치 교체 작업이 어려운 이유는 세 가지입니다.
- 영향 범위가 가장 넓음 — 잠시라도 다운되면 사옥 전체나 데이터센터 전 구간이 영향받습니다.
- 포트 수가 매우 많음 — 수십~수백 포트의 description, VLAN, IP, 케이블 매칭을 모두 정확히 옮겨야 합니다.
- 이중화 검증이 필수 — 슈퍼바이저·전원이 이중화돼 있어 각각의 절체(failover) 테스트를 작업 전에 반드시 마쳐야 합니다.
💡 슈퍼바이저 이중화 비유 — 비행기의 정·부조종사
BB 스위치의 슈퍼바이저(Supervisor) 카드는 장비의 뇌입니다. 두 장을 꽂아 운영하면 한쪽이 Active(정조종사), 다른 한쪽이 Standby(부조종사)로 동작합니다. Active가 갑자기 고장 나도 Standby가 즉시 운항을 이어받아 통신이 끊기지 않습니다. 이를 SSO(Stateful Switchover)라고 부릅니다.
작업 전 필수 준비사항
실제 교체 작업 1~2주 전에 다음을 빠짐없이 챙겨야 합니다.
| 항목 | 내용 |
|---|---|
| 설정 백업 | running-config·startup-config를 TFTP/FTP로 외부에 저장. 최소 2벌 보관. |
| IOS·라이센스 백업 | 기존 장비의 IOS 이미지 파일과 라이센스 파일도 같이 백업. |
| 케이블 라벨링 | 기존 장비의 모든 케이블에 포트번호/용도 라벨 부착. 사진 촬영도 권장. |
| 롤백 계획 | 신규 장비 문제 시 기존 장비로 복귀할 수 있는 시간·절차 명문화. |
| 비상 연락망 | 시스코 TAC, 총판 라이센스 담당자, 고객 IT 책임자 연락처 사전 확보. |
| 점검 시간 확보 | 서비스 영향이 최소인 새벽 점검창 확보. 보통 3~5시간. |
기존 장비 정보 수집
① 포트 상태와 VLAN 확인
BB_OLD# show interface status Port Name Status Vlan Duplex Speed Type Gi2/1 DWDM disabled routed full 1000 1000BaseSX Gi2/2 DWDM disabled routed full 1000 1000BaseSX Gi2/3 DR_WORK_DB disabled 7 full auto 1000BaseSX
Status가 disabled로 보이는 포트도 있습니다. 운영 중인지 단순 shutdown인지 description과 함께 반드시 확인해야 합니다.
② 포트 description으로 용도 매칭
BB_OLD# show interfaces description Interface Status Protocol Description Gi2/1 down down To_IDC_DWDM_CH1 Gi2/2 down down To_IDC_DWDM_CH2 Gi2/3 up up DR_WORK_DB_Server
③ 포트별 IP 정보 추적
description이 비어 있는 포트는 어떤 단말이 연결돼 있는지 MAC과 ARP를 조합해 직접 찾아내야 합니다.
BB_OLD# show mac address-table interface gi2/3 ! 포트 → MAC BB_OLD# show arp | include 0011.2233.4455 ! MAC → IP BB_OLD# show cdp neighbors detail ! 옆 장비 식별
⚠️ description 누락 포트 처리
MAC·ARP·CDP로도 식별이 안 되는 포트는 발신 서버/단말 관리자에게 직접 문의하거나, 일시적으로 포트를 shutdown한 뒤 어디서 클레임이 들어오는지로 역추적하는 방법밖에 없습니다. 작업일까지 시간이 부족하면 무리하게 끄지 말고 일단 그대로 옮기는 것이 안전합니다.
④ 모듈 실장과 환경 점검
BB_OLD# show module ! 어느 슬롯에 무슨 모듈이 있는지 BB_OLD# show inventory ! 시리얼 번호 포함 자산 정보 BB_OLD# show power ! 전원 모듈 상태와 용량 BB_OLD# show env all ! 온도/팬/전압 BB_OLD# show platform ! 플랫폼 전반 상태
⑤ 랙 실장도와 케이블 라벨링
실장도는 작업 당일 헷갈리지 않게 슬롯별 모듈 종류와 포트별 연결 대상을 표로 정리한 문서입니다. 사진 촬영(전면·후면)은 별도로 필수. 케이블에는 "BB → 분배스위치 Gi1/0/1", "BB → 서버팜 SW Gi1/1" 같은 식으로 양 끝에 라벨을 붙입니다.
신규 장비 부팅과 기본 셋업
신규 장비는 받은 즉시 단독으로 부팅 테스트를 진행합니다. 운영망과 분리된 별도 환경에서 셋업을 마치는 것이 안전합니다.
① 콘솔 접속 및 호스트네임 설정
Switch> enable Switch# configure terminal Switch(config)# hostname BB_NEW
② SSH 접속 환경 구성
SSH는 RSA 키 생성을 위해 도메인 이름이 필요합니다. 운영 환경에서 외부 도메인 lookup을 막고 싶다면 no ip domain lookup으로 DNS 조회만 끄면 됩니다. 이 두 명령은 서로 다른 동작입니다.
BB_NEW(config)# ip domain-name corp.local ! RSA 키 생성용 도메인 BB_NEW(config)# no ip domain lookup ! 오타 시 DNS 조회 방지 BB_NEW(config)# crypto key generate rsa modulus 2048 BB_NEW(config)# ip ssh version 2 BB_NEW(config)# line vty 0 15 BB_NEW(config-line)# transport input ssh BB_NEW(config-line)# login local
⚠️ 명령어 헷갈리지 않기ip domain-name = SSH RSA 키에 들어갈 호스트 식별자(필수)ip domain lookup = 도메인을 IP로 변환하는 DNS 질의 기능. 오타 시 hang을 막으려 보통 no ip domain lookup으로 꺼둡니다.
컨피그 작성과 매칭
기존 장비의 running-config를 그대로 옮기는 것이 아니라, 신규 장비의 모델에 맞게 변환해야 합니다.
- 포트 명명 규칙 변경 —
GigabitEthernet2/1→TwentyFiveGigE1/0/1등 신규 모델 포트 체계에 맞춰 일괄 변환. - VLAN/description 매칭 — 모든 포트가 기존 VLAN·description을 그대로 유지하도록 작성.
- 지원되지 않는 명령 제거 — 기존 IOS에만 있던 deprecated 명령은 신규 IOS XE에서 제거하거나 대체.
- diff 비교 — 작성한 컨피그를 메모장이 아닌 diff 도구(WinMerge, Beyond Compare)로 기존과 비교해 누락 검증.
스마트 라이센스 등록
Catalyst 9000 시리즈는 일부 기능이 스마트 라이센스(Smart Licensing)로 잠겨 있어, 등록 없이는 라우팅이나 고급 기능을 못 씁니다. 인터넷이 단절된 폐쇄망에서는 SLR(Specific License Reservation) 방식으로 오프라인 등록을 합니다.
① 라이센스 레벨과 SLR 모드 설정
! 라이센스 등급 지정 (구매한 종류에 맞게 essentials / advantage 선택) BB_NEW(config)# license boot level network-advantage addon dna-advantage ! 라이센스 예약 모드 활성화 BB_NEW(config)# license smart reservation ! 라이센스 미등록 로그 차단 (CSSM 통신 시도 끄기) BB_NEW(config)# license smart transport off
② Request Code 생성
BB_NEW# license smart reservation request local Enter this request code in the Cisco Smart Software Manager portal: CB-ZCat9k-ABC1234567...
출력된 Request Code를 시스코 CSSM(Cisco Smart Software Manager) 포털에 입력하면 인증 파일(.lic)을 받을 수 있습니다.
③ 인증 파일 업로드와 설치
! 받은 라이센스 파일을 USB나 FTP로 bootflash:/에 업로드 BB_NEW# copy ftp://10.10.10.5/auth_code.lic bootflash: ! 라이센스 설치 BB_NEW# license smart reservation install file bootflash:/auth_code.lic ! 등록 결과 확인 BB_NEW# show license summary BB_NEW# show license usage
⚠️ 라이센스 정보가 안 보일 때
CSSM에서 해당 시리얼이 검색되지 않거나 등급 표시가 다르면 무리하게 진행하지 말고 시스코 총판 담당자에게 자산 등록 상태부터 확인 요청하세요. 임의로 다른 등급의 라이센스를 적용하면 이후 정식 등록이 막힐 수 있습니다.
슈퍼바이저 Active–Standby 이중화 테스트
신규 장비를 현장에 투입하기 전에 가장 중요한 검증입니다. 슈퍼바이저 한 장을 강제로 다운시켜도 통신이 끊기지 않아야 합니다.
테스트 환경 구성
- 신규 장비에 임시 VLAN과 게이트웨이 IP를 부여하고 PC를 한 대 연결.
- PC에서 게이트웨이로 지속 ping(ping -t) 실행.
- CRT 또는 SecureCRT를 2~3분할해 Active 콘솔 + Standby 콘솔 + PC ping을 한 화면에서 동시 모니터링.
- 정상 상태(이중화 정상)를 먼저 캡처해 기준점을 잡음.
정상 상태 확인 — show redundancy states
BB_NEW# show redundancy states my state = 13 -ACTIVE peer state = 8 -STANDBY HOT Mode = Duplex Unit = Primary Unit ID = 1 Redundancy Mode (Operational) = sso Redundancy Mode (Configured) = sso
Standby 슈퍼바이저에 콘솔로 직접 접속하면 명령어를 입력할 수 없고 다음 문구만 표시됩니다.
BB_NEW-stby#
Standby console disabled
redundancy state 코드 이해하기
| 코드 | 상태 | 의미 |
|---|---|---|
| 1 | DISABLED | 슈퍼바이저가 꺼져 있거나 없음 |
| 4 | STANDBY COLD | 대기 중이지만 절체 즉시 불가 |
| 8 | STANDBY HOT | 완전 동기화. 즉시 절체 가능 (정상 상태) |
| 13 | ACTIVE | 현재 동작 중인 슈퍼바이저 |
⚠️ 가장 흔한 오해
"peer state = 8"을 "DISABLED"로 잘못 기억하는 경우가 있는데, 8은 STANDBY HOT(정상)이고 DISABLED는 1입니다. 절체 테스트에서 peer 슈퍼바이저를 꺼뜨렸을 때 보이는 코드가 1이고, 정상 동작 중일 때 보이는 코드가 8이라고 외워두면 헷갈리지 않습니다.
절체 시나리오 4가지
| 테스트 | 조작 | 기대 결과 |
|---|---|---|
| TEST 1 | 1번 슈퍼바이저 OFF | 2번이 STANDBY HOT → ACTIVE로 절체 (my=13, peer=1). ping 끊김 0회 |
| TEST 2 | 1번 슈퍼바이저 ON (재투입) | 1번이 STANDBY HOT으로 복귀 (현재 ACTIVE는 2번 그대로 유지) |
| TEST 3 | 2번 슈퍼바이저 OFF | 1번이 ACTIVE로 절체 (my=13, peer=1). ping 끊김 0회 |
| TEST 4 | 2번 슈퍼바이저 ON (재투입) | 2번이 STANDBY HOT으로 복귀 (my=13, peer=8) |
각 단계마다 화면 캡처가 필수입니다. 파일명은 TEST1_SUP1_OFF_절체완료.png 같이 단계와 상황을 명시해 저장합니다.
⚠️ Standby에서는 컨피그 입력 불가
슈퍼바이저 두 장이 정상 동기화된 상태에서는 Standby 슈퍼바이저에 직접 콘솔로 접속해도 configure terminal이 막힙니다. 모든 설정은 Active에서만 입력하고, SSO가 자동으로 Standby에 복제합니다.
전원 이중화 테스트
대형 BB 스위치는 보통 전원 모듈 4개를 꽂아 운영합니다. 이때 4개를 한 분전반에 몰지 않고 2개씩 다른 분전반(또는 다른 UPS)에 분리 연결하는 것이 표준입니다. 한쪽 분전반이 죽어도 절반은 살아남도록 하기 위함입니다.
테스트 절차
! 정상 상태 확인 — 전원 4개 모두 정상 BB_NEW# show power BB_NEW# show module
정상 캡처 후 다음 순서로 하나씩 빼며 시스템이 살아있는지 확인합니다.
- 전원 1번 제거 → 2,3,4번 정상 동작 확인 → 캡처
- 전원 1번 복귀 후 2번 제거 → 1,3,4번 정상 확인 → 캡처
- 전원 2번 복귀 후 3번 제거 → 1,2,4번 정상 확인 → 캡처
- 전원 3번 복귀 후 4번 제거 → 1,2,3번 정상 확인 → 캡처
💡 한 번에 두 개 빼면 안 되는 이유
전원 모듈 용량 합계가 부족하면 라인 카드가 꺼지거나 PoE 포트가 절전 모드로 빠집니다. 항상 한 번에 한 개만 빼고, 복귀한 뒤 다음 테스트로 넘어가야 안전합니다.
교체 당일 — 타임테이블과 컷오버
현장 작업은 분 단위 타임테이블로 움직입니다. 아래는 30~40포트 규모 BB 교체의 예시 타임테이블입니다.
| 시간 | 작업 내용 |
|---|---|
| 00:00 ~ 00:15 | 작업 시작 통보, 사전 상태 캡처(show run, show int status, show cdp neighbors) |
| 00:15 ~ 00:30 | 기존 장비 포트 일괄 shutdown, 케이블 한 묶음씩 분리 |
| 00:30 ~ 01:00 | 기존 장비 랙에서 제거, 신규 장비 입고/실장/전원 연결 |
| 01:00 ~ 01:30 | 컨피그 업로드, 라이센스 확인, 인터페이스 활성화 전 점검 |
| 01:30 ~ 02:30 | 케이블 재결선(우선순위 그룹별), 그룹별 ping 테스트 |
| 02:30 ~ 03:00 | 전 포트 up/down 확인, 라우팅 프로토콜 네이버 형성 확인 |
| 03:00 ~ 03:30 | 사용자 단말 통신 테스트, 모니터링 시스템 정상 인지 확인 |
| 03:30 ~ 04:00 | 최종 상태 캡처, write memory, 작업 완료 보고 |
각 구간이 예상보다 30분 이상 지연되면 롤백 결정 시점을 미리 정해두는 것이 좋습니다(예: 새벽 4시까지 안정화 못 하면 기존 장비로 복구).
교체 후 검증과 모니터링
신규 장비가 올라왔다고 끝이 아닙니다. 다음 항목을 빠짐없이 점검해야 합니다.
! 포트 상태 전수 점검 BB_NEW# show interface status | exclude disabled BB_NEW# show interface status err-disabled ! 비정상 차단 포트 ! L2 STP / VLAN BB_NEW# show spanning-tree summary BB_NEW# show vlan brief ! L3 / 라우팅 네이버 BB_NEW# show ip ospf neighbor BB_NEW# show ip bgp summary BB_NEW# show ip route summary ! 시스템 자원과 로그 BB_NEW# show processes cpu sorted | exclude 0.0 BB_NEW# show logging | include %
⚠️ VTP·STP 충돌 주의
신규 장비가 VTP Server 모드로 들어가면서 Configuration Revision 값이 더 높으면, 기존에 살아있는 다른 스위치의 VLAN 정보가 신규 장비 설정으로 덮어쓰여 대형 사고가 납니다. 새 장비 투입 전 반드시 vtp mode transparent 또는 도메인을 새로 잡아 revision을 0으로 초기화하세요.
작업 완료 후 최소 24~72시간은 모니터링 시스템에서 인터페이스 에러, CPU, 메모리, 라우팅 변동을 집중 감시합니다. 다음 정기 점검 때 트래픽 그래프를 작업 이전과 비교해 정상 패턴인지 확인하는 것까지가 BB 교체 작업의 마무리입니다.
자주 묻는 질문
Q. 신규 장비에 미리 컨피그를 전부 넣고 가져가도 되나요?
A. 호스트네임, 로그인 계정, SSH·SNMP 같은 관리용 설정까지만 사전 입력하고, 인터페이스 활성화는 현장에서 그룹별로 하는 것이 안전합니다. 전체 active 상태로 입고하면 운영망에 케이블 한 가닥 잘못 꽂는 순간 루프나 IP 충돌이 발생할 수 있습니다.
Q. 슈퍼바이저 절체 테스트에서 ping이 1~2개 끊기면 문제인가요?
A. SSO + NSF(Nonstop Forwarding)가 정상이라면 0개여야 정상입니다. 끊김이 있다면 NSF가 활성화되지 않았거나 라우팅 프로토콜이 graceful restart 미지원 상태일 수 있습니다. show redundancy의 Operating Redundancy Mode가 sso인지, 라우팅 프로토콜별 nsf 설정이 있는지 확인하세요.
Q. 라이센스가 인터넷이 안 되는 환경에서도 등록 가능한가요?
A. 네, 본문에서 다룬 SLR(Specific License Reservation) 방식으로 가능합니다. 장비에서 Request Code를 받아 인터넷이 되는 PC에서 CSSM에 입력하고, 발급된 .lic 파일을 USB로 옮겨 장비에 설치하면 됩니다. 폐쇄망 운영 환경에서 표준 방식입니다.
Q. 기존 장비 컨피그를 신규 장비에 그대로 붙여넣어도 되나요?
A. 같은 시리즈(예: 9600 → 9600)라도 포트 명명 규칙과 일부 명령어 문법이 다를 수 있습니다. 다른 시리즈(6500 → 9600) 사이는 더 차이가 큽니다. diff 비교 도구로 검증한 뒤 신규 IOS XE에서 거부되는 명령은 대체 문법을 찾아 변환하세요.
Q. 작업 도중 신규 장비에 문제가 생기면 어떻게 해야 하나요?
A. 미리 정해둔 롤백 시점에 따라 기존 장비를 복원합니다. 그래서 기존 장비를 즉시 폐기하지 않고 랙 옆에 대기시키거나 케이블만 분리한 채 보존해두는 것이 필수입니다. 신규 장비 안정화 확인 후 최소 1주일 정도는 기존 장비를 보관하는 것이 안전합니다.
#BB스위치 #백본스위치 #코어스위치 #시스코 #Catalyst9600 #장비교체 #슈퍼바이저이중화 #SSO #스마트라이센스 #SLR #네트워크엔지니어 #네트워크작업 #도담인사이트
댓글
댓글 쓰기