문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 Wayback Machine (문서 편집) ||<-2> '''{{{+1 {{{#AB2E33 웨이백}}} 머신}}}[br]{{{#AB2E33 Wayback}}} Machine''' || ||<-2> [[파일:Wayback Machine 로고.svg|width=100%]] || || '''설립''' ||1996년 5월 10일|| || '''공개''' ||2001년 10월 24일|| || '''소유''' ||[[인터넷 아카이브|Internet Archive]]|| || '''유형''' ||저장, [[미러 사이트|미러]]|| || '''상태''' ||사용 가능|| || '''광고''' ||없음|| || '''회원가입''' ||선택|| || '''작성 언어''' ||[[C언어]], [[Perl]]|| || '''링크''' ||[[https://archive.org/]][br][[https://archive.org/web]]|| [목차] [clearfix] == 개요 == [[브루스터 케일]]이 창립한 미국의 비영리재단인 [[인터넷 아카이브]](Internet Archive)에서 제작한 디지털 타임캡슐이다. 2023년 7월 29일 기준 현재 8150억 개의 페이지가 [[아카이브]] 되어있다. [[알렉사(인공지능)#s-2|알렉사 인터넷]]의 컨텐츠와 함께 유지되고 있다. 웨이백 머신에서 자체적으로 보존한 웹 페이지는 저장하고 6~12개월 후에 공개된다. 저장하는 주기가 다르기 때문에 업데이트 때마다 추적, 기록하는 건 아니다. 하지만 어떤 웹사이트는 몇 주 간격이나 또는 하루도 안되어 공개되는 경우도 있다. 게다가 해당 시간대의 들어간 사이트는 검색도 아예 못하게 되어 있다. 특정 웹 페이지의 아카이브를 원하는 경우 [[https://web.archive.org]]나 [[https://archive.org/web/]]으로 들어가서 자신이 아카이브 하기 원하는 페이지의 주소를 넣으면 된다. [[robots.txt]]로 [[크롤링]]을 막아놓으면 크롤링하지 않는다. archive.is와 달리 자동화된 로봇으로 크롤링을 하여 아카이빙을 하기 때문이다. PC 버전 웹페이지 주소를 입력했는데 자동으로 모바일 버전 웹페이지로 저장하는 경우가 있다. URL의 날짜부분 끝에 '''fw_''' 를 붙이면 툴바가 삭제된다.[*예시 [[https://web.archive.org/web/20180101010338fw_/http://www.example.com:80/|https://web.archive.org/web/20180101010338'''fw_'''/http://www.example.com:80/]]][*원본 [[https://web.archive.org/web/20180101010338/http://www.example.com:80/|https://web.archive.org/web/20180101010338'''(비움)'''/http://www.example.com:80/]]] == 기능 == * 웹 페이지의 과거 모습을 볼 수 있다. * API 제공 * 삭제된 파일 다운로드. 없을 것 같으면서도 있는 경우가 꽤 있다. 오래된 [[소프트웨어]]를 찾는 경우에도 도움이 된다. * 만약 인터넷에서 다운로드하고 싶은 파일이 있는데 그게 삭제된 경우에는 한번 웨이백 머신에 가서 그 파일의 주소나 페이지 주소를 넣어보자. 웬만하면 대부분의 파일은 다 저장되어 있다.[* 대부분이 있다는 것은 꽤 신기한 내용인데, 없을 것 같으면서도 있는 경우가 꽤 있다. 나온 지가 엄청 오래되어 공식 홈페이지가 폐쇄되어 더 이상 패치를 받을 수 없게 된 수많은 [[고전게임]]들도 웨이백머신을 사용하면 웬만한 패치를 받을 수 있을 정도.] * [[악성코드]]가 있는 사이트 보기. 실제로 웨이백 머신에는 [[악성코드]]가 있는 저장된 웹사이트도 꽤 있다. 대표적인 예로는 [[You are an idiot|youareanidiot.org]]. * [[https://gizmodo.com/even-the-wayback-machine-is-adding-fact-checking-labels-1845544407|최근에는 일부 사이트의 아카이브 내에 "팩트 체크"와 관련된 안내 문구도 생긴 것으로 보인다.]] [[archive.today]]랑 다르다고 할 수 있는 점. * 최근에는 [[Ruffle]]이 웨이백 머신 내에 내장되어 [[어도비 플래시]]로 쓰여진 페이지도 볼 수 있게 되었다. == 삭제 요청 확인 == 삭제 요청을 한 경우 다음의 방법으로 자신의 요청이 어떤 상황인지 대략적으로 알 수 있다. >1. [[https://archivesupport.zendesk.com/]] 으로 간다. >2. Sign in 을 클릭한 후 나오는 화면에서 Forgot password 를 입력. >3. 다음 화면에서, 삭제요청을 했을 당시의 본인의 이메일 주소를 입력한 후 Submit 를 클릭. >4. 그러면 본인의 이메일로 패스워드를 새로 설정하라는 메일이 archive.org 에서 오게 된다. >5. 링크를 클릭해서 나오는 화면에서 원하는 패스워드를 설정한다. >6. 다시 [[https://archivesupport.zendesk.com/]] 로 가서 Sign in 을 클릭한 후, 본인의 이메일과 방금 설정한 패스워드로 로그인을 한다. >7. 로그인 후 [[https://archivesupport.zendesk.com/hc/en-us/requests]] 로 이동. My requests 항목에 자신의 요청이 있는 것을 확인. 내용을 클릭하면 요청이 제대로 들어간건지 알 수 있다. 만약 보낸 내용이 매우 길 경우 시스템에서 스팸으로 블락 했을수도 있으니 확인하는게 좋다. > >로그아웃은 [[https://archivesupport.zendesk.com/access/logout]] 로 할 수 있다. 참고로 Status 항목에 open 이라고 써 있는것은 요청 처리중이라는 뜻 인데, Last activity 부분의 날짜가 한달을 넘었는데도 그대로면 무시당했다고 보면 된다. 또한 Status 가 solved 라고 나와있으면서 어두운 회색일 때는 처리 완료 되었다는 뜻인데, 그럼에도 불구하도 실제로 아무것도 해결되지 않았을 경우, 마찬가지로 무시당했다고 보면 된다. == 문제점 == === 법률적 문제 === 웨이백 머신, 나아가 인터넷 아카이브 전체가 단순한 [[박제]]를 위한 아카이브는 아니지만, 근본적으로 [[archive.today]]의 문제점 중 일부 문제(특히 저작권)를 공유한다. DMCA 관련 문제는 '받아주는' 편이지만, 어지간한 이유나 법적 근거가 있지 않는 한 전부 받아줘야 한다. DMCA 요청 자체가 정확한 법 조항을 근거로 요청자의 법적 신분을 공개하고 선서를 동봉해서 보내는 것이므로 법적 효력이 있기 때문이다. [[얼티밋 워리어]]의 옛 블로그가 이런 식으로 아카이빙에서 제외된 바 있다. [[https://gizmodo.com/when-the-internet-archive-forgets-1830462131|# Gizmodo 뉴스]] === 아카이빙 관련 === * [[유튜브]]를 포함한 동영상은 소수의 케이스로 보관이 된 경우도 있지만 대체로 보관되지않고 영상도 재생되지 않는다. * [[트위터]]의 많은 트윗이 보관중이기 때문에 트윗을 보관하는 데 시간이 오래 걸린다. 그러나 저장이 되면 이미지도 같이 저장된다. * [[인스타그램]] 게시물은 저장이 되지 않는다. * [[Tumblr]]는 게시물에 글만 있을 때 저장이 되며 사진과 동영상은 저장이 안 된다. * [[나무위키]] 문서들은 예전에는 저장이 됐으나 현재는 아이피가 데이터센터 대역이라며 차단되어서 저장이 되지 않는다. == 사건사고 == === 인터넷 아카이브 저작권 소송사건 === ||[youtube(bp2aowF0jUw)]|| 2020년 [[코로나19]]가 강타했을 때 미국 전역에 있는 도서관들이 문을 닫는 일이 생기자, 인터넷 아카이브는 동년 3월 24일부터 6월 16일까지 대출 시간을 1시간에서 2주로 늘리는 National Emergency Library을 운영하였다.[* [[https://blog.archive.org/national-emergency-library/|#]]] 그러다 동년 7월 1일에 Hachette Book Group, Inc외 3사에서 인터넷 아카이브 측에 공정사용이 아니라는 이유로 소송을 제기했다.[* [[https://www.nytimes.com/2020/06/01/books/internet-archive-emergency-library-coronavirus.html|뉴욕타임즈]]] 약 3년 뒤인 2023년 3월 24일에 법원이 인터넷 아카이브가 Hachette사 외 3사의 저작권을 침했다는 판결을 내렸다.[* [[https://storage.courtlistener.com/recap/gov.uscourts.nysd.537900/gov.uscourts.nysd.537900.188.0.pdf|판결문]] [[https://time.com/6266147/internet-archive-copyright-infringement-books-lawsuit/|타임즈 보도]]] 현재 인터넷 아카이브 측은 항소를 진행하고 있다. 샌프란시스코 시청 계단에서 집회를 하였다. 이유는 디지털 대출을 찬성해라는 집회였다. [[https://www.courtlistener.com/docket/17211300/hachette-book-group-inc-v-internet-archive/|소송 타임라인]] == 여담 == * 이 웹사이트를 운영하는 비영리법인 인터넷 아카이브에서는 웨이백 머신 운영 외에도 여러 아카이브 관련 활동에 힘쓰고 있다. * [[퍼블릭 도메인]]의 책들을 온라인으로 열람할 수 있는 서비스인 [[https://openlibrary.org/|오픈 라이브러리]] * [[퍼블릭 도메인]]의 [[표준시간 음반|78 SP음반]]들을 디지털 아카이브하는 [[https://great78.archive.org/|더 그레이트78 프로젝트]] * [[크리에이티브 커먼즈 라이센스]] 등으로 공개한 음악을 아카이브하는 [[https://archive.org/details/netlabels|넷레이블스(Netlabels)]] * 오래된 [[소프트웨어]]의 아카이브 등 * 웹 상에서 도스 게임을 돌릴 수 있는 [[https://archive.org/details/softwarelibrary_msdos_games/v2|MS-DOS 게임 라이브러리]]. [[DOSBox]] [[에뮬레이터]]를 웹으로 이식한 것이다. * MS-DOS용 소프트웨어 밖에도 Windows, Mac, Linux용 소프트웨어들도 보관되어 있다. [[플래시 게임]]도 있다. * 2021년 10월 1일 기준 [[나무위키:대문]] 페이지는 1,118회 아카이브되었다. * [[위키백과]]에 InternetArchiveBot 이라는 봇이 있다. 이 봇의 역할은 깨진 링크를 웨이백 머신 링크로 대체하는 것이다. * 인터넷 아카이브에서 운영하는 Wayforward Machine이라는 사이트도 있다. 말 그대로 웹사이트들의 미래를 볼수 있는 곳이다. 인터넷에 여러 제한사항이 생겨 자유로운 이용이 불가능해질 것을 경고하며 이를 막기 위한 캠페인을 홍보하는 사이트이다. *[[파일:Internet Archive servers.jpg]] [[파일:wayback machine server.jpg]] 웨이백 머신의 서버는 이렇게 생겼다. 랙 캐비넷의 이름은 페타박스(Petabox)이고, 위쪽이 신형 버전, 아래쪽이 구형 버전이다. 서버 옆에 있는 사람이 바로 창립자 [[브루스터 케일]]이다. == 관련 문서 == * [[인터넷 아카이브]] * [[archive.today]] * [[아카이브]] [[분류:미국의 웹사이트]][[분류:미러 사이트]][[분류:재단법인]][[분류:비영리 단체]]저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기