태그 보관물: aws

Lightsail 서버가 자꾸 죽어요

Jetpack이 요즘처럼 많이 말을 건 적이 있었던가?

최근에 Bitnami에서 Amazon Linux 2023으로 이사하면서 Lightsail instance를 한 단계 비싼 것으로 올리고 나서부터 웹사이트가 다운되었다는 Jetpack의 노티가 계속 뜬다.

더 비싸면 더 잘돌아야 되는 것 아닌가?

이런 노티를 받고나서 확인해 보면 블로그가 접속되지 않을 뿐만 아니라 SSH 조차도 뜨지 않는 상태가 되어 있어서 서버를 강제 재시작 하는 방법 밖에 없다. Lightsail의 Metrics 메뉴에서 확인해 보면 이때마다 CPU 사용률이 치솟고 있는 것도 보인다.

적습! – XML RPC

따로 cron task를 걸어 놓은 것도 없는데 이렇게 많은 CPU 자원이 소모되는 이유는 뭘까?

Nginx의 access log를 들여다 봤더니 짧은시간 동안에 한 IP에서 아주 많은 xmlrpc.php에 대한 접속시도가 있었다. XML RPC는 REST API로 대체되어 요즘에는 실제로 사용되는 경우가 거의 없는데, 공격자들은 system.multicall 기능을 활용해 다수의 비밀번호 무차별 대입 공격을 수행하는데 자주 쓴다고 한다.

xmlrpc를 막는 여러가지 방법이 있으나, WordPress에서 막지 않고 아예 Nginx에서 xmlrpc접속을 막아버리도록 다음과 같이 설정해 주었다.

# xmlrpc.php 차단
location = /xmlrpc.php {
    deny all;          # xmlrpc.php 접속을 차단
    access_log off;    # 접속 로그를 남기지 않아서 IO 자원을 아낌
    log_not_found off; # Not found(404) 로그도 남기지 않는다
    return 444;        # Nginx 비표준, 404 응답을 보내지 않고 연결을 끊어버림
}

두번째 적습! – Search Flood

이렇게 막고 나서 하루 정도는 잠잠했었는데, 바로 다음날 저녁에 다시 서버에 접속할 수 없다는 Jetpack의 알람이 왔다.

이번에도 CPU 사용량이 치솟으며 SSH접속도 안될 정도로 무언가를 엄청나게 하고 있었다. 분명히 xmlrpc는 막아 두었는데 이번엔 또 뭘까?

로그를 보니 이번에도 하나의 IP에서 짧은 시간동안에 태그, 검색어, 저자, 문서번호 등으로 엄청난 조회(GET) 요청을 받고 있었다. 이번 것은 XML RPC 공격때와 같이 로그인 비밀번호를 알아 내기 위한 것 보다는 서버에 많은 부하를 주어서 서비스를 방해하려는 목적인 것 같다.

외부에서 들어오는 조회가 진짜인지 가짜인지 확인하는 뾰족한 방법은 없고, 다만 너무 잦은 것이 문제가 되는 상황이니 Rate limiting을 걸어서 이런 경우를 걸러내기로 했다.

Nginx 설정파일을 변경해서 먼저 http 영역에서 비정상적인 검색을 시도하는 IP들을 추적하도록 설정한다.

http {
    ...

    # 검색을 요청하는 경우 IP를 저장해 둔다.
    map $arg_s $search_traffic {
        default "";              # 일반적인 접속, track안함.
        ~.+ $binary_remote_addr; # 검색요청하는 IP는 track.
    }

    # 분당 10회 이상의 검색 시도가 있으면 $search_traffic zone에 추가.
    limit_req_zone $search_traffic zone=search_block:10m rate=10r/m;
    ...
}

그리고 나서 server 영역에는 이러한 시도가 5번을 넘기면 차단하도록 다음과 같이 설정한다. 해당 IP는 Service Unavailable(503) 응답을 받게 될 것이다.

server {
    ...
    location / {
        # 5번까지의 burst시도까지는 허가.
        limit_req zone=search_block burst=5 nodelay;
    
        try_files $uri $uri/ /index.php$is_args$args;
    }
    ...
}

Swap 설정 추가

그리고 조금 놀라웠던 사실인데 AL2023 instance에는 기본적으로 swap 영역이 설정되어 있지 않았다. 서비스가 조금 느려지더라도 응답 못하는 일은 없도록 swap영역을 설정해 주었다. swap 설정하는 방법은 인터넷에 많으니 패스.

결론

Bitnami에서 설정해 준 것으로 안락하게 지내다가, 직접 서버를 설정하겠다고 나선지 며칠만에 무작위 공격들로 가득찬 인터넷을 겪고 보니 새삼 살벌한 세상이 실감된다.

하지만 그 덕에 다양한 공격 방법들과 설정 방법들에 대해 더 알게되니 재미있기도 하다. 상용서비스가 아니라서 문제가 생기면 재부팅이라도 할 수 있으니 그나마 다행이랄까.

Lightsail 스냅샷으로 하위 인스턴스를 생성할 수 없다

Lightsail의 WordPress 인스턴스를 AL2023으로 전환 할 때, All-in-One Migration utility로 import를 시도하는데 이전에 본 적이 없던 internal error가 발생했다. 분명 업로드 가능한 파일 크기도 import하는 압축 파일 보다 크게 설정해 주었고 다른 설정들도 모두 마쳤음에도 계속해서 실패하는 것이다.

YYYY/MM/DD HH:MM:SS [error] 32777#32777: *4 FastCGI sent in stderr: "PHP message: PHP Fatal error:  Uncaught ValueError: Path cannot be empty in /var/www/html/wp-content/plugins/all-in-one-wp-migration/functions.php:1881 
Stack trace: 
#0 /var/www/html/wp-content/plugins/all-in-one-wp-migration/functions.php(1881): fopen() 
#1 /var/www/html/wp-content/plugins/all-in-one-wp-migration/lib/model/import/class-ai1wm-import-upload.php(86): ai1wm_is_filedata_supported() 
#2 /var/www/html/wp-content/plugins/all-in-one-wp-migration/lib/controller/class-ai1wm-import-controller.php(77): Ai1wm_Import_Upload::execute() 
#3 /var/www/html/wp-includes/class-wp-hook.php(341): Ai1wm_Import_Controller::import() 
#4 /var/www/html/wp-includes/class-wp-hook.php(365): WP_Hook->apply_filters() 
#5 /var/www/html/wp-includes/plugin.php(522): WP_Hook->do_action() 
#6 /var/www/html/wp-admin/admin-ajax.php(192): do_action() 
#7 {main} 
  thrown in /var/www/html/wp-content/plugins/all-in-one-wp-migration/functions.php on line 1881" while reading response header from upstream, client: [CLIENT_IP], server: _, request: "POST /wp-admin/admin-ajax.php?action=ai1wm_import&ai1wm_import=1 HTTP/1.1", upstream: "fastcgi://unix:/run/php-fpm/www.sock:", host: "[SERVER_IP]", referrer: "http://[SERVER_IP]/wp-admin/admin.php?page=ai1wm_import"

메모리 문젠가?

Nginx의 로그를 보니 Path cannot be empty ... 라는 PHP Fatal error가 찍혀 있었다. 이 에러메세지 자체로는 문제점이 잘 드러나지 않지만, 검색해보니 업로드가 완료된 후 압축 해제와 import를 처리 하는 과정중에 메모리가 부족해서 이런 문제가 발생할 수 있다는 내용이 있었는데, 업로드가 100%까지 진행되고 나서 그 후에 문제가 발생하는 것으로 볼 때 이 말이 사실일 가능성이 있어 보였다.

혹시나 해서 지금 사용하고 있는 것보다 높은 사양의 인스턴스를 하나 새로 파서 테스트해 보니 오류없이 잘 동작했다. 여기까지 확인해서 메모리 부족 때문에 발생하는 문제라는 확증이 들자 한가지 꼼수가 떠올랐다.

  1. 높은 사양의 인스턴스로 All-in-One으로 마이그레이션을 하고
  2. 스냅샷을 하나 만든 다음
  3. 스냅샷으로 부터 원래의 낮은 사양으로 인스턴스를 생성한다.

“그래, 이런 기발한 방법이!” 라며 먼저 $12짜리 인스턴스에 마이그레이션을 완료하고 스냅샷을 만들었다. 그리고 나서 스냅샷으로 부터 인스턴스를 생성하려고 하는데 이런화면이 나왔다.

스냅샷을 생성할 때의 인스턴스보다 낮은 티어는 생성할 수가 없다는 것이다.

결론

Bitnami 워드프레스를 Amazon Linux 2023으로 마이그레이션

처음 Lightsail로 이사왔을 때 인스턴스 선택에는 큰 고민을 들이지는 않았다. 제공되는 WordPress instance에는 필요한 것들이 이미 다 설치 되어 있어서 인스턴스를 하나 생성하고 기존 블로그를 import하는 것으로 모든 과정들이 비교적 순조롭게 진행된 편이었다. 문제는 이 WordPress 인스턴스가 Bitnami로 되어 있어서 세부적인 관리 작업에는 제약이 많다는 점이다. 그래서 AWS에 최적화 되어 있다는 Amazon Linux2023(AL2023)으로 LEMP를 직접 설치하고 기존의 블로그를 수동으로 마이그레이션 해 보기로 했다.

이번 포스팅에서는 AL2023 인스턴스에 LEMP(Linux, Nginx, MariaDB, PHP)를 설치하고 Bitnami에서 사용하던 데이터베이스와 자료들을 수동으로 옮겨오는 과정을 설명한다. All-in-One 같은 편리한 마이그레이션 유틸리티를 쓰지 않고 굳이 수작업으로 일일이 옮겨야 했던 이유는 All-in-One에서 띄운 오류 때문이었는데 아무런 문제가 없고, 기술적 호기심 또한 없다면 굳이 이 내용을 따라 수작업으로 옮길 필요는 없을 것이다.

AL2023 환경 구축

Lightsail에서 AL2023 인스턴스를 생성한 뒤 시스템을 업데이트하고 LEMP 패키지를 설치한다. Amazon Linux 2023은 Fedora기반으로 패키지 관리에 dnf 명령어를 사용한다. PHP8.3과 필요한 패키지들을 설치해 주고 나서 Nginx, MariaDB, PHP-FPM 서비스들을 실행해 준다.

sudo dnf update -y
sudo dnf install -y nginx mariadb105-server php8.3 php8.3-fpm php8.3-mysqlnd php8.3-gd php8.3-xml php8.3-mbstring php8.3-bcmath php8.3-opcache php8.3-intl php8.3-zip

# 서비스 활성화 및 자동 실행 설정
sudo systemctl start nginx mariadb php-fpm
sudo systemctl enable nginx mariadb php-fpm

데이터베이스 초기화

MariaDB에 WordPress를 위한 database를 생성하고 비밀번호를 설정한다. mysql_secure_installation은 여러 보안 관련한 처리를 해주는데, 사용하지 않는 기능들을 끄거나 비밀번호를 설정하는 과정을 진행해 준다.

설정이 끝나면 root user로 data base를 실행시킨다.

sudo mysql_secure_installation
sudo mysql -u root -p

wordpress database를 생성하고, wpuser사용자를 생성한 다음 권한을 설정하는 과정이다. 나는 비밀번호를 새롭게 만들지 않고 기존에 Bitnami가 생성해 주었던 database 비밀번호(wp-config.php에 있는)를 그대로 사용했다.

CREATE DATABASE wordpress DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
CREATE USER 'wpuser'@'localhost' IDENTIFIED BY '[사용자_비밀번호]';
GRANT ALL PRIVILEGES ON wordpress.* TO 'wpuser'@'localhost';
FLUSH PRIVILEGES;
EXIT;

워드프레스 설치 및 파일 권한 설정

최신 버전의 워드프레스를 다운로드 받아서 /var/www/html/ 위치에 풀어준다.

# 최신 워드프레스 다운로드
wget https://wordpress.org/latest.tar.gz
tar -xzf latest.tar.gz
sudo cp -r wordpress/* /var/www/html/

AL2023 환경에서 Nginx가 파일을 정상적으로 제어할 수 있도록 소유권과 권한을 수정한다.

# /var/www/html안에 있는 파일들의 권한 설정
sudo chown -R nginx:nginx /var/www/html
sudo find /var/www/html -type d -exec chmod 755 {} \;
sudo find /var/www/html -type f -exec chmod 644 {} \;

# PHP-FPM 실행 그룹을 apache에서 nginx로 변경
sudo sed -i 's/user = apache/user = nginx/g' /etc/php-fpm.d/www.conf
sudo sed -i 's/group = apache/group = nginx/g' /etc/php-fpm.d/www.conf

# 서버 재실행
sudo systemctl restart php-fpm

Nginx 설정

/etc/nginx/conf.d/wordpress.conf 파일을 생성하고 아래의 내용을 추가한다. 이 단계에서 나는 server_name 항목에 “[도메인이름]” 대신에 “_”를 넣어주었고 마이그레이션이 끝나고 나서 기존에 사용하던 public IP를 새로운 인스턴스에 연결시킨 다음에 SSL을 업데이트 하는 과정에서 도메인 이름으로 변경해 주었다.

server {
    listen 80;
    server_name [도메인이름];
    root /var/www/html;
    index index.php index.html;

    location / {
        try_files $uri $uri/ /index.php?$args;
    }

    location ~ \.php$ {
        fastcgi_pass unix:/run/php-fpm/www.sock;
        fastcgi_index index.php;
        include fastcgi_params;
        fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
    }
}

설정 후 Nginx를 재실행한다.

sudo systemctl restart nginx

여기까지 되었으면 instance의 IP로 접속했을 때 WordPress의 설치 화면이 보이게 된다.

마이그레이션 수작업

먼저 기존 Bitnami 서버 터미널에서 데이터베이스와 콘텐츠를 가져온다.

# 데이터베이스 덤프
mysqldump -u root -p bitnami_wordpress > backup.sql

# 데이터 압축 (wp-content와 환경설정파일)
cd /opt/bitnami/wordpress
tar -czvf wp_data.tar.gz wp-content wp-config.php

추출한 backup.sql과 wp_data.tar.gz 파일을 새 서버로 전송하고, wp_data.tar.gz 파일은 /var/www/html/ 아래에 풀어준다.

# wp-content 복원
tar -xzvf wp_data.tar.gz
sudo cp -r wp-content/* /var/www/html/wp-content/

DB Import 및 연결 정보 수정

Database backup file을 import 한다.

# Database back up file import
sudo mysql -u root -p wordpress < backup.sql

Database import가 완료되면 /var/www/html/wp-config.php 파일을 열어 새로운 정보로 DB_NAMEDB_USERDB_PASSWORD를 맞춰준다.

여기까지 해서 모든 이전이 잘 수행 되었다면 기존 인스턴스에서 사용하던 Public IP 주소를 떼어다가(detach) 새로운 인스턴스에 붙여(attach)해 준다. 이 과정은 Lightsail의 “네트워크” 항목에서 진행하면 된다.

많은 가이드 문서에서 마이그레이션 이후 IP정보를 업데이트 하는 과정을 거치는데, Lightsail의 경우는 public IP를 그대로 새로운 instance로 옮겨올 수 있어서 이 부분의 귀찮은 과정을 생략할 수 있다.

새로운 HTTPS 인증서 적용

Public IP가 옮겨지고 domain name으로 접속이 잘 이루어진다면, 앞서 말했던 것 처럼 /etc/nginx/conf.d/wordpress.conf 파일의 server_name 부분에 도메인이름을 적어주고 아래의 과정을 따라서 인증서 정보를 업데이트 해준다.

인증서 업데이트를 위한 Certbot 설치

# Certbot 설치
sudo dnf install -y certbot python3-certbot-nginx

# Certbot으로 인증서 업데이트 (Litcoder.com)
sudo certbot --nginx -d Litcoder.com -d www.litcoder.com

certbot certificates 명령어로 생성된 cert와 유효기간을 확인할 수 있다.

Auto renew service 활성화

Expiration date이 되면 자동으로 인증서를 업데이트 하도록 다음과 같이 certbot-renew.timer 서비스를 활성화 해 준다.

sudo systemctl enable certbot-renew.timer
sudo systemctl start certbot-renew.timer

주의! 443은 막혀있다

인증서 업데이트 이후 HTTPS로 접속이 안된다면 443번 포트가 열려 있는지 확인해 보자. Lightsail은 2026년 현재 새롭게 생성한 인스턴스의 22번과 80번 포트만 기본으로 열려 있다. HTTPS를 사용하려면 명시적으로 사용자가 443번을 열어야 한다.

결론

다소 번거로운 과정이기는 했지만, 장기적 관점으로 봤을 때는 Bitnami의 제한에서 벗어나 서버에 대한 세부적인 제어 권한을 가져올 수 있게 되었다는 점에서 시간을 들여 투자해 볼만 한 삽질 이었던 것 같다.