Wayback Machine

덤프버전 :

웨이백 머신
Wayback Machine

파일:Wayback Machine 로고.svg
설립
1996년 5월 10일
공개
2001년 10월 24일
소유
Internet Archive
유형
저장, 미러
상태
사용 가능
광고
없음
회원가입
선택
작성 언어
C언어, Perl
링크
https://archive.org/
https://archive.org/web

1. 개요
2. 기능
3. 삭제 요청 확인
4. 문제점
4.1. 법률적 문제
4.2. 아카이빙 관련
5. 사건사고
5.1. 인터넷 아카이브 저작권 소송사건
6. 여담
7. 관련 문서



1. 개요[편집]


브루스터 케일이 창립한 미국의 비영리재단인 인터넷 아카이브(Internet Archive)에서 제작한 디지털 타임캡슐이다. 2023년 7월 29일 기준 현재 8150억 개의 페이지가 아카이브 되어있다. 알렉사 인터넷의 컨텐츠와 함께 유지되고 있다.

웨이백 머신에서 자체적으로 보존한 웹 페이지는 저장하고 6~12개월 후에 공개된다. 저장하는 주기가 다르기 때문에 업데이트 때마다 추적, 기록하는 건 아니다. 하지만 어떤 웹사이트는 몇 주 간격이나 또는 하루도 안되어 공개되는 경우도 있다. 게다가 해당 시간대의 들어간 사이트는 검색도 아예 못하게 되어 있다.

특정 웹 페이지의 아카이브를 원하는 경우 https://web.archive.orghttps://archive.org/web/으로 들어가서 자신이 아카이브 하기 원하는 페이지의 주소를 넣으면 된다.

robots.txt크롤링을 막아놓으면 크롤링하지 않는다. archive.is와 달리 자동화된 로봇으로 크롤링을 하여 아카이빙을 하기 때문이다.

PC 버전 웹페이지 주소를 입력했는데 자동으로 모바일 버전 웹페이지로 저장하는 경우가 있다.

URL의 날짜부분 끝에 fw_ 를 붙이면 툴바가 삭제된다.[예시][원본]


2. 기능[편집]


  • 웹 페이지의 과거 모습을 볼 수 있다.
  • API 제공
  • 삭제된 파일 다운로드. 없을 것 같으면서도 있는 경우가 꽤 있다. 오래된 소프트웨어를 찾는 경우에도 도움이 된다.
    • 만약 인터넷에서 다운로드하고 싶은 파일이 있는데 그게 삭제된 경우에는 한번 웨이백 머신에 가서 그 파일의 주소나 페이지 주소를 넣어보자. 웬만하면 대부분의 파일은 다 저장되어 있다.[1]
  • 악성코드가 있는 사이트 보기. 실제로 웨이백 머신에는 악성코드가 있는 저장된 웹사이트도 꽤 있다. 대표적인 예로는 youareanidiot.org.
  • 최근에는 일부 사이트의 아카이브 내에 "팩트 체크"와 관련된 안내 문구도 생긴 것으로 보인다. archive.today랑 다르다고 할 수 있는 점.
  • 최근에는 Ruffle이 웨이백 머신 내에 내장되어 어도비 플래시로 쓰여진 페이지도 볼 수 있게 되었다.


3. 삭제 요청 확인[편집]


삭제 요청을 한 경우 다음의 방법으로 자신의 요청이 어떤 상황인지 대략적으로 알 수 있다.

1. https://archivesupport.zendesk.com/ 으로 간다.

2. Sign in 을 클릭한 후 나오는 화면에서 Forgot password 를 입력.

3. 다음 화면에서, 삭제요청을 했을 당시의 본인의 이메일 주소를 입력한 후 Submit 를 클릭.

4. 그러면 본인의 이메일로 패스워드를 새로 설정하라는 메일이 archive.org 에서 오게 된다.

5. 링크를 클릭해서 나오는 화면에서 원하는 패스워드를 설정한다.

6. 다시 https://archivesupport.zendesk.com/ 로 가서 Sign in 을 클릭한 후, 본인의 이메일과 방금 설정한 패스워드로 로그인을 한다.

7. 로그인 후 https://archivesupport.zendesk.com/hc/en-us/requests 로 이동. My requests 항목에 자신의 요청이 있는 것을 확인. 내용을 클릭하면 요청이 제대로 들어간건지 알 수 있다. 만약 보낸 내용이 매우 길 경우 시스템에서 스팸으로 블락 했을수도 있으니 확인하는게 좋다.

로그아웃은 https://archivesupport.zendesk.com/access/logout 로 할 수 있다.


참고로 Status 항목에 open 이라고 써 있는것은 요청 처리중이라는 뜻 인데, Last activity 부분의 날짜가 한달을 넘었는데도 그대로면 무시당했다고 보면 된다. 또한 Status 가 solved 라고 나와있으면서 어두운 회색일 때는 처리 완료 되었다는 뜻인데, 그럼에도 불구하도 실제로 아무것도 해결되지 않았을 경우, 마찬가지로 무시당했다고 보면 된다.


4. 문제점[편집]



4.1. 법률적 문제[편집]


웨이백 머신, 나아가 인터넷 아카이브 전체가 단순한 박제를 위한 아카이브는 아니지만, 근본적으로 archive.today의 문제점 중 일부 문제(특히 저작권)를 공유한다.

DMCA 관련 문제는 '받아주는' 편이지만, 어지간한 이유나 법적 근거가 있지 않는 한 전부 받아줘야 한다. DMCA 요청 자체가 정확한 법 조항을 근거로 요청자의 법적 신분을 공개하고 선서를 동봉해서 보내는 것이므로 법적 효력이 있기 때문이다. 얼티밋 워리어의 옛 블로그가 이런 식으로 아카이빙에서 제외된 바 있다. # Gizmodo 뉴스


4.2. 아카이빙 관련[편집]


  • 유튜브를 포함한 동영상은 소수의 케이스로 보관이 된 경우도 있지만 대체로 보관되지않고 영상도 재생되지 않는다.
  • 트위터의 많은 트윗이 보관중이기 때문에 트윗을 보관하는 데 시간이 오래 걸린다. 그러나 저장이 되면 이미지도 같이 저장된다.
  • 인스타그램 게시물은 저장이 되지 않는다.
  • Tumblr는 게시물에 글만 있을 때 저장이 되며 사진과 동영상은 저장이 안 된다.
  • 나무위키 문서들은 예전에는 저장이 됐으나 현재는 아이피가 데이터센터 대역이라며 차단되어서 저장이 되지 않는다.


5. 사건사고[편집]



5.1. 인터넷 아카이브 저작권 소송사건[편집]




2020년 코로나19가 강타했을 때 미국 전역에 있는 도서관들이 문을 닫는 일이 생기자, 인터넷 아카이브는 동년 3월 24일부터 6월 16일까지 대출 시간을 1시간에서 2주로 늘리는 National Emergency Library을 운영하였다.[2] 그러다 동년 7월 1일에 Hachette Book Group, Inc외 3사에서 인터넷 아카이브 측에 공정사용이 아니라는 이유로 소송을 제기했다.[3]

약 3년 뒤인 2023년 3월 24일에 법원이 인터넷 아카이브가 Hachette사 외 3사의 저작권을 침했다는 판결을 내렸다.[4] 현재 인터넷 아카이브 측은 항소를 진행하고 있다.

샌프란시스코 시청 계단에서 집회를 하였다. 이유는 디지털 대출을 찬성해라는 집회였다.

소송 타임라인


6. 여담[편집]




  • 위키백과에 InternetArchiveBot 이라는 봇이 있다. 이 봇의 역할은 깨진 링크를 웨이백 머신 링크로 대체하는 것이다.

  • 인터넷 아카이브에서 운영하는 Wayforward Machine이라는 사이트도 있다. 말 그대로 웹사이트들의 미래를 볼수 있는 곳이다. 인터넷에 여러 제한사항이 생겨 자유로운 이용이 불가능해질 것을 경고하며 이를 막기 위한 캠페인을 홍보하는 사이트이다.

  • 파일:Internet Archive servers.jpg
파일:wayback machine server.jpg
웨이백 머신의 서버는 이렇게 생겼다. 랙 캐비넷의 이름은 페타박스(Petabox)이고, 위쪽이 신형 버전, 아래쪽이 구형 버전이다. 서버 옆에 있는 사람이 바로 창립자 브루스터 케일이다.


7. 관련 문서[편집]




파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-11-05 10:43:09에 나무위키 Wayback Machine 문서에서 가져왔습니다.

[예시] https://web.archive.org/web/20180101010338fw_/http://www.example.com:80/[원본] https://web.archive.org/web/20180101010338(비움)/http://www.example.com:80/[1] 대부분이 있다는 것은 꽤 신기한 내용인데, 없을 것 같으면서도 있는 경우가 꽤 있다. 나온 지가 엄청 오래되어 공식 홈페이지가 폐쇄되어 더 이상 패치를 받을 수 없게 된 수많은 고전게임들도 웨이백머신을 사용하면 웬만한 패치를 받을 수 있을 정도.[2] #[3] 뉴욕타임즈[4] 판결문 타임즈 보도