[김성민]님이 남기신 글:
>안녕하세요.
>
>엊그제부터 하루한번씩 시스템이 먹통되는 증상이
있었습니다.
>처음에는 강제로 전원 다시 넣고, 디스크 배드블럭을
체크해봤는데 별다른 메시지가 안나오길래 그냥 두고 보고
있었다가 아까 또 먹통이 되어서요.
>
>[root@localhost]# df -h
>Filesystem Size Used Avail Use% Mounted on
>/dev/sda3 13G 3.0G 9.1G 25% /
>/dev/sda1 122M 18M 98M 16% /boot
>none 506M 0 506M 0% /dev/shm
>/dev/sdb1 34G 8.0G 25G 25% /home
>
>scsi 디스크인데 2번 디스크 sdb1는 통짜로 씁니다.
>messages 로그를 보니 scsi 관련된게 대부분인걸로 봐서 디스크
고장이라는 생각이 드는데요.
>
>1, 2번 디스크중 2번은 os가 없으니 망가진다고 해도 시스템이
먹통되지는 않을거 같은데.. 1번이 고장이라고 보면
되는지요?
>
>모니터 화면에
>Recovery SCD completes
>scsi0:A:1:0 Deviceis disconnected.
>
>이런 문구가 있었는데
>scsi0:A:1:0 여기가 채널을 말하는거 같은데 1이라는 숫자가
채널1이라면 디스크2번이라는
건데, 정확히 모르겠습니다...
>
>1번이 고장인지, 2번이 고장인지요..
>
순서대로
- sici0 : 첫번째 scsi 컨트롤러
- A : A 채널
- 1 : ID 1 로 설정된 disk
- 0 : lun 이 0
따라서 cat /proc/scsi/scsi 로 확인해서 Id 가 01 인 것을
찾아보세요.
그런데 Deviceis disconnected 이 메시지는 컨트롤러 문제 아니면 disk
가 오래되어서 뭔가 문제가 발생되었을때의
메시지입니다.
장비 전원을 내리고 컨트롤로의 케이블을 뽑아서 컨틀롤로
연결부분 그리고 케이블 연결부분등의 먼저를 깨끗하게
제거하고 연결하는게 좋습니다.
>==================================
>
>dd if=/dev/sda of=/dev/sdc bs=1024 와 같이 1번 디스크와 동일한 용량을
3번 디스크에 복사해놓고, 3번은 제거해 놨다가 오늘 또
먹통되었을때 3번 디스크를 scsi 채널 0에 첫번째로 넣고 부팅을
했습니다.
>원래 있던 1번 디스크를 3번 자리에 넣고 임시로 마운트 해서
mysql/data 디렉토리를 새로 부팅한 디스크(dd 로 복사해서 끼운
원래 3번디스크)에 복구시킬려고 아래와 같이
했습니다.
>
>[1]
>1번 디스크(지금 부팅한거)
>/usr/local/mysql 로 이동후,
>data 디렉토리를 지우고,
>/tmp/diskorg (원래 1번 디스크, 장애의심되는거)
에서 mysql/data 디렉토리를
>
>[2]
>1번 디스크(지금 부팅한거)
>/usr/local/mysql/ 로 복사할려고 했더니만,
>
>
>[1] 에서 지운 data 디렉토리가 /tmp/diskorg 쪽 mysql 데이터
디렉토리까지 지운 모양입니다.
>dd 로 복사한 경우 블럭단위까지 복사한다고 하는데 그거
때문에 양쪽 위치가 똑같아서 이런일이 발생하는
건지요???
>
>할수 없이 어제 백업해놓은거로
쓰기는 하는데 일부 데이터가 사라졌습니다..
>(백업본 만든시점과 시간차이가 나서)
>
>상세히 작성한다고 질문이 좀 뒤죽박죽 요상한지
모르겠습니다...
>
>위 두가지 상황에 관련되어 조언 좀 부탁드립니다..
>
>ps. 오늘 먹통시점 로그 첨부합니다.
>/tmp/diskorg 로 원래 디스크 임시로 마운트해서
꺼낸겁니다.
>
>아, 그리고 먹통이 되어도 외부에서 ping 은 됩니다.
========================================
mysql 의 data 는 새벽시간에 른 disk 에 mysqldump 로 cron 에 등록해
놓은게 좋습니다.
os 영역이 아니면 굳지 고생스럽게 dd 로 disk 복사까지는
필요없다고 생각하는데...
|