과거 운영체제 보존의 필요성?!
 
지금 우리는, 엄청난 자료홍수 속에 살고 있습니다. 이들은 모두 디지털 전자장치에 저장되고 있는데요, 오늘은 이 디지털 자료 관리에 대한 이면에 대해 소개하고자 합니다.

디지털 전자장치를 이용한 기록물의 수명은 생각보다 길지 않습니다. 마일러(Mylar) 등의 표면에 자성 재료를 도포한 자기테이프의 수명은 불과 50년 정도, 영원할 것 같은 CD도 제품에 따라 다르긴 하지만 길어야 3~40년입니다. 최근 미국의 컴퓨터 잡지인 ‘PC월드’에서는 구운 CD의 수명이 고작 2~5년에 불과하다는 암울한 소식을 전하기도 했습니다.

플로피디스크 @pandameixiang / http://www.flickr.com/photos/pandameixiang/6784480227


요즘 가장 많이 쓰고 있는 USB 형태의 메모리 스틱도 유한한 플래시 메모리를 사용하기 때문에 데이터 보존기간이 10년 정도(쓰고 지운 횟수에 반비례)입니다. 게다가 갑자기 어떤 전자적 오류가 발생할지도 모릅니다. 그럴 경우 한순간에 모든 정보가 사라지는 대형참사(?)가 발생하게 되는 것이죠. 하지만 저장매체가 다양화되고 자료가 쌓이는 것이 눈에 보이지 않는 디지털 기록의 특성 때문에 사람들은 ‘디지털 저장 강박증’을 앓기 시작했습니다. 무엇이든 저장하고, 정리하지 않은채 모든 기록물을 습관처럼 저장해버리는 것이죠. 하지만 기록 매체의 수명은 앞서 말했듯이 그리 길지도 않으며, 안정적이지도 않습니다.

상형문자 @watchsmart / http://www.flickr.com/photos/watchsmart/1422285303


오히려 기록 매체의 수명으로 따진다면 돌에 새긴 이집트 상형문자가 으뜸이겠죠! 하지만 저장 용량이 아주 형편없다는 단점이 있습니다. 만약 우리가 하나의 저장매체 안에 기록된 정보를 상형문자처럼 돌에 새긴다고 가정해보죠. 아마 어마어마하게 많은 인원이 동원되어야 하거나, 그에 상응하는 시간이 소요되어야 할 것입니다.

하지만 더 중요한 것은 우리가 디지털 전자장치에 저장된 기록물을 읽어낼 운영체제와 소프트웨어의 중요성을 간과하고 있다는 것입니다. 이러한 이야기는 생각보다 쉽게 접할 수 있는데요 아폴로 계획 자료도 그 중 하나죠. 냉전시대 미국과 소련이 치열한 경쟁을 버렸던 우주개발에 있어 아폴로 계획은 미국의 과학발전을 한 단계 끌어올렸습니다. 하지만 그 때 만들어진 방대한 자료를 열어보려 했던 후대 과학자들은 그것을 읽어낼 프로그램이 사라졌다는 사실을 뒤늦게 깨달았습니다.
1~20년 전 사용했던 수많은 프로그램들이 특정 운영체제와 시스템에 종속되어 있다는 사실도 소프트웨어의 중요성을 증명합니다.

'한글' 소프트웨어.(직접 캡처)


이처럼 전자기록물은 그 자체의 보관도 중요하지만 반드시 그것을 읽을 수 있는 소프트웨어도 함께 준비되어야 합니다. 지금 쓰는 이 글도 100년 후에 ‘정확히’ 읽혀지기 위해서는 아래한글 2010이라는 프로그램이 있어야 하고 그에 따른 하드웨어와 운영체제가 그대로 갖춰진 PC가 있어야 합니다. 그것 뿐만이 아닙니다. 하루가 멀다 하고 올라오는 수많은 패치와 백신 프로그램도 있어야 할 것입니다. 불과 10여년 전에 사용했던 도스용 아래한글로 작성한 문서가 있다면 요즘 사용하는 아래한글 2010으로 파일을 불러보면 바로 알 수 있습니다. 그나마 읽어지기는 하겠지만 그 폰트나 문서 서식이 완전히 달라져 있음을 알게 됩니다.

조환규 부산대 교수가 쓴 칼럼 ‘디지털 박물학’에서도 이러한 위험성을 경고합니다. 조환규 교수는 ‘IMF때 정부에서는 고학력자 실업을 위하여 오래된 정부기록물을 특정워드로 옮기는 사업 시행을 예로 들며, 이런 방법 또한 매우 위험하다고 말합니다. ’기록‘의 중요성이 무엇보다도 강한 정부기록물은 평생 보관되어야 하기 때문에 특정 프로그램에 제한을 받지 않는 *TeX와 같은 기록법으로 저장되어야 하는데, 이런 인식이 없다보니 아무 거리낌 없이 자유롭게 문서가 저장되었다는 것이죠. 특정 시스템에 종속된 전자문서가 글자와 숫자뿐만 아니라 다양한 기호와 표식까지 자유롭게 사용되는 지금을 생각할 때 이는 큰 재앙이 될 수 있습니다.

@dolescum / http://www.flickr.com/photos/dolescum/3567689465

개인에게는 번거로울 수 있는 작업이지만 끊임없이 새로운 버전의 소프트웨어나 저장매체가 나올 때 마다 기록물을 새로운 매체로 옮겨야 기록을 보존할 수 있습니다. 이전에 사용한 LP나 CD를 개인용 하드디스크로 옮기거나 클라우드 서비스로 데이터를 관리하는 것도 하나의 방법이 될 수 있습니다.

우스갯 소리로 들릴지도 모르지만, 100년 후 지금의 디지털 자료를 모두 정확히 읽어내려면 ‘지금’ 사용하는 PC를 하드웨어와 소프트웨어까지 완전히 밀봉하여 보관하지 않으면 안 될지 모릅니다. 새로운 저장매체의 개발도 중요하지만 기존의 저장매체들도 읽어낼 수 있는 차세대 시스템의 개발 역시 꾸준히 이루어져야 하는 이유가 여기에 있습니다.

*TeX, 미국 스탠퍼드 대학의 D.E. 크누트 교수가 개발한 문서 정형 시스템. 유닉스상에서 개발된 일괄(batch) 방식으로 테크의 문법에 따라 복잡한 수식을 포함하는 문서를 특정 프로그램에 제한을 받지 않도록 만들 수 있다는 특징이 있다.

 


-[과학칼럼] 디지털 박물학 조환규 부산대 교수·컴퓨터과학

블로그 이미지

굿가이(Goodguy)

우리 생활 속 과학이야기