01 · 제가 하는 일
실제 업무
- 호스트, 클러스터, 데이터센터 사이에서 P2V 및 V2V 방식으로 온프레미스 워크로드를 옮기며 다운타임을 최소화합니다.
- 온프레미스 시스템을 클라우드로 올립니다. 가상 머신뿐 아니라 애플리케이션, 데이터, DNS, 그리고 ID 의존성까지 함께 다룹니다.
- 검증된 백아웃 경로를 갖춘 채로 운영체제, 하이퍼바이저, 핵심 서비스의 버전 업그레이드를 진행합니다.
- 운영 환경에 어떤 변경이 가해지기 전에 컷오버 순서와 롤백을 먼저 작성해, 양방향 모두를 문서로 남깁니다.
- 작업 시간, 검증 기준, 그리고 각 단계에서 누가 승인하는지를 정의합니다.
- 체크섬과 대사 작업을 통해 스토리지와 데이터를 옮겨, 전송 중에 무엇도 조용히 누락되지 않도록 합니다.
- 이전 후 하드닝과 구성을 다시 검증해, 새 환경이 기존 환경보다 약해지지 않도록 합니다.
02 · 얻으시는 것
최종적으로 남는 결과물
- 문서화된 변경 계획과 작성된 롤백. 둘 다 작업 시간이 시작되기 전에 검토를 마칩니다.
- 추측이 아니라 검증 기준에 따라 확인하며, 합의된 작업 시간 내에 깔끔하게 마무리되는 컷오버.
- 실제로 작동하는 백아웃 경로. 기준을 통과하지 못하면 제가 책임지고 실행합니다.
- 새 환경이 올바르게 구성되고 하드닝되었음을 보여주는 이전 후 증빙 자료.
- 팀이 읽고 다시 실행할 수 있는 인수인계 문서. 그래서 지식이 저와 함께 떠나지 않습니다.
03 · 도구와 지식
이 분야에서 다루는 것들
04 · 제 접근 방식
계획하고, 범위를 정하고, 끝까지 책임집니다
시작은 30분 범위 산정 통화와 이 작업이 잘 맞는지에 대한 당일 서면 판단입니다. 그다음 눈에 보이는 서버만이 아니라 실제 의존성을 모두 파악하고, 단 하나의 운영 시스템이라도 옮기기 전에 롤백을 첨부한 순서화된 변경 계획을 작성합니다. 작업 시간, 검증 기준, 그리고 백아웃 조건을 미리 합의해 두기 때문에 컷오버 도중에 즉흥적으로 판단할 일이 없습니다. 그 작업 시간 안에 컷오버를 진행하면서 기준을 하나씩 확인하고, 하나라도 실패하면 정상 상태로 롤백합니다. 작업이 끝나면 증빙 자료와 작성된 절차를 함께 드려, 다음 사람도 같은 경로를 따라갈 수 있습니다.
05 · 질문
좋은 질문에 대한 솔직한 답변
다운타임을 어떻게 예측 가능하게 유지하나요?
고정된 순서와 명확한 기준을 갖춰 정해진 작업 시간 안에서 컷오버를 진행함으로써 가능합니다. 시작하기 전에 각 단계에서 성공이 어떤 모습인지, 그리고 각 단계에 얼마나 걸려야 하는지를 미리 알고 있기 때문에, 작업 시간은 막연히 바라는 게 아니라 계획된 것입니다.
컷오버 도중에 마이그레이션이 잘못되면 어떻게 되나요?
시작하기 전에 작성하고 검토해 둔 백아웃 경로를 이용해 마지막 정상 상태로 롤백합니다. 롤백은 미리 결정되어 있고, 압박 속에서 즉석으로 궁리하는 것이 아니라 제가 실행하는 일입니다.
온프레미스에서 클라우드로도 가능한가요, 아니면 온프레미스 간 이전만 하나요?
둘 다 가능하고, 버전 업그레이드도 함께 합니다. 온프레미스에서 클라우드로의 이전은 ID, DNS, 데이터 이동, 그리고 의존성에 더 신경을 씁니다. 클라우드 마이그레이션이 보통 깨지는 지점은 워크로드 자체가 아니라 바로 그곳이기 때문입니다.
06 · 관련 경험