본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

“SSD도 고장 난다” 토발즈의 발견에 대한 검증

OSS 게시글 작성 시각 2013-09-16 18:59:11

2013년 09월 16일 (월)

ⓒ ITWorld, Lucas Mearian | Computerworld



리누스 토발즈는 SSD가 불사신이 아니라는 사실을 발견했으며, 또한 SSD가 사전에 예고도 없이 사용자가 불편함을 느낄 시점에 작동 불가상태가 될 수도 있다고 밝혔다.

리눅스 커널의 개발자인 리누스 토발즈는 최근 올린 블로그 포스트를 통해 자신의 워크스테이션에 SSD가 작동을 멈추어버려 리눅스 3.12커널의 개발이 중단되었다고 말했다. 토발즈는 “SSD의 작동 중단시점이 좋지 않다. 하지만 나의 메인 워크스테이션의 SSD는 작동이 되지 않기 시작했다. 복구를 위해 할 수 있는 작업들을 모두 마쳐 현실적으로 많은 자료를 잃게 된 것은 아니다”라고 말했다.

SSD는 성능에 있어 HDD보다 우수한 것으로 알려져 있고, 모바일 기기에 더욱 더 신뢰성 있는 수단으로 여겨진다. 왜냐하면 기계적인 부품이 없기 때문이다. 하지만 SSD의 작동 수명은 분명히 제한이 있다. 초기 발매된 SSD의 경우 수명이 제조품질과 사용빈도에 따라서는 심지어 1년에도 미치지 못했다.

SSD의 안정성에 대한 한 조사를 실시한 톰즈 하드웨어(Tom’s Hardware)는 “우리는 SSD도 고장이 발생한다는 사실을 알고 있다. 그나마 할 수 있는 것은 구매할 때 사용자 평가를 10분 정도 훑어보는 것이다”라고 언급한 바 있다.

SSD에 물리적인 구동 영역은 없지만, 반도체 컴포넌트에 작동 실패가 나타날 수 있다. 예를 들어, NAND, SSD 콘트롤러, 콘덴서, 혹은 기타 패시브 컴포넌트가 조금씩 그 기능이 떨어지거나 작동에 완전히 실패하게 되는 상황이 나타날 수도 있다.

토발즈가 블로그를 통해 어떤 업체의 SSD가 고장이 났는지 명시하지는 않았지만, 그는 2008년의 블로그 포스팅에서 아마도 X25(the X25)로 추정되는 80GB 인텔 SSD를 구입했다는 기록이 보인다. X25는 SSD 업계에서는 신뢰성의 척도로 여겨지는 제품이다. 초기의 X25는 당시 기술수준에서는 최고품질의 NAND 플래시 칩을 사용했다고 알려져 있다.

컴퓨터월드의 몇몇 편집자들도 OCZ SSD의 고장을 경험했다고 한다. 하지만 토발즈의 SSD가 구입한지 5년이 되었다는 점을 고려한다면, 제품 자체의 내구성을 문제 삼기는 어려운 실정이다. 특히 워크스테이션에 SSD가 사용된 경우라면 더욱 그러하다.

HIS의 전자 및 미디어 부문의 SSD및 스토리지 애널리스트인 라이언 치엔은 “아마도 SSD 신뢰성을 묘사하는 최상의 척도로서, 컨트롤러 기술의 발전 덕택에 평균적인 제품 내구성은 개선되고 있으며 제품 품질의 표준편차도 낮아지고 있다”고 설명했다.

또 대부분의 SSD는 품질보증기준인 3~5년보다 더 오래 작동되기는 하나 토발즈가 워크로드가 큰 워크스테이션에 SSD를 연결해 사용했다고 한다면 “SSD의 수명은 기대 수준에 미치지 못할 가능성이 크다”고 말했다.

IDC의 SSD 담당 리서치 디렉터인 제프 자누코비츠는 SSD 신뢰성에 영향을 미치는 다른 요인들도 많다고 지적했다.

NAND 플래시 미디어가 핵심적인 역할을 담당하는데, 이는 NAND 플래시 미디어의 품질이 제조업체마다 다르기 때문이다. 그리고 초기 세대의 NAND 플래시의 경우 프로그램 충돌과 전자가 셀 벽으로 흐를 때 나타나는 비트에러와 관련한 내구성이 낮았다. 프로그램 충돌은 메모리 셀의 의도치 않은 프로그래밍 때문이다. 이런 오류가 자주 발생하면 내구성이 손상된다.

일례로, 삼성의 840 EVO SSD는 TLC 메모리를 사용한다. 삼성의 메모리 및 스토리지 부문의 수석 제품 메니저인 크리스 게이서는 그럼에도 정교한 컨트롤러 칩과 소프트웨어 덕택에 SSD가 장착된 노트북이나 데스크톱에 비해 훨씬 더 긴 수명을 자랑한다고 강조했다. 게이서는 “120GB SSD에 매일 10GB씩 쓰기 기능을 수행한다면 10년 이상 사용할 수 있다”고 덧붙였다.

하드디스크와는 달리 SSD는 초기 사용 이후 그 속도가 느려진다. 왜냐하면 충분한 양의 데이터가 SSD에 쓰여지고 난 뒤, SSD의 프로세서가 데이터를 이동시키기 때문이다. 이러한 기능은 읽기-수정-삭제-쓰기(read-modify-erase-write) 사이클로 알려져 있다. 따라서 새로운 데이터가 SSD에 기록될 때마다, 이 데이터는 새로운 데이터가 쓰여지기 전까지 삭제를 앞두고 있어야 한다. 이런 과정을 여러 번 반복하면 NAND 플래시의 셀과 트렌지스터의 기능이 저하된다.

SSD 제조업체들은 에러 수정과 내구성 보완 소프트웨어 기술을 발전시켜왔다. 그 결과 드라이브 전반에 데이터를 고루 분배할 수 있게 되어 특정 셀이 다른 셀보다 더 빠른 속도로 기능이 저하되는 것을 막는다. 그럼에도 사용이 누적되다 보면 SSD가 작동할 수 없는 시점에 다다르게 될 것이다.

SSD 컨트롤러와 펌웨어가 바로 에러 수정과 내구성 보완을 가능하게 하는 요소이다. 야누코비츠는 일반적으로 컨트롤러와 펌웨어가 바로 똑 같은 NAND 플래시를 사용하는 USB 저장장치와 SSD의 성능과 신뢰성을 차별화시키는 요소라고 말한다.

또 DSP 알고리즘과 에러수정코드(ECC)와 같은 SSD 컨트롤러의 정교화를 통해 NAND 플래시의 내재적인 문제를 완화시킬 수 있다고 설명했다.

NAND 프로세스의 크기가 줄어듦에 따라(즉, 트랜지스터가 작아져도 더 많은 밀도와 용량을 수용할 수 있게 되는 상황) 펌웨어가 증가하는 에러를 수정해야 할 필요가 늘어났다. (셀이나 트랜지스터의 크기가 작아질수록, 데이터 에러가 발생할 확률은 높아진다.) 낸드플래시 처리 기술이 발전하여 몇 년 전에는 35나노였던 것이 오늘날 19나노로 줄어들었다. 치엔은 “자료를 종합해 볼 때 SSD 사용자의 보증기간 내 연간 SSD 작동 실패율은 1.5% 내외이다. HDD의 경우 이 수치가 5%이다”라고 지적했다.

결론적으로, SSD의 작동실패는 심지어 리누스 토발즈라고 할지라도 기본적으로 나타나는 것이나, 여전히 하드디스크보다 신뢰성이 더 높고 속도도 빠르다.



※ 본 내용은 한국IDG(주)(http://www.itworld.co.kr)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒITWORLD. 무단전재 및 재배포 금지


[원문출처 : http://www.itworld.co.kr/news/83801]

맨 위로
맨 위로