404-meldingen er en lite kjærkommen side å havne på.
En bruker mye energi på å finne informasjonen en søker og kommer så fram til det som ser ut til å være den hellige gral.
Som lyn fra klar himmel, dukker tallet 404 opp og feilmeldingen «siden finnes ikke».
Det har blitt laget mange kreative varianter av 404-siden. Alt fra henvisninger til søkefelt eller sjarmerende beklagelser. Til syvende og sist er det likevel en blindvei på nettet.
Men det finnes en gruppe mennesker som har satt sin ære på å bekjempe dette problemet en gang for alle.
IT-hoder fra prestisjefylte institusjoner har gått sammen om prosjektet 404-no-more.
Nå vil de vekke døde lenker til live ved å henvise dem til tidligere versjoner.
Les også: Alfakrøll skapte arkiv-trøbbel. Nå dropper man IKT@Politiet
Skarpe hjerner
404-meldingen er en responskode for HTTP-protokollen som betyr at maskinen er i stand til å kommunisere med serveren, men at serveren ikke er i stand til å finne filen du vil ha, av uvisst grunn.
404-no-more har en misjon om å redde hyperlenken fra lenkeråte.
– Vi er en gruppe som ønsker å endre måten hyperlenker fungerer på, skriver 404-no-more på sin prosjektside.
Lenkehelbrederne består av et samarbeidsprosjekt mellom Harvard, Los Alamos National Laboratory og Old Dominion-universitetet i Virginia.
404-no-more er et av 54 gjenværende bidrag til Knight News Challenge, en konkurranse som går ut på å forbedre medieinnovasjon og gjøre internett til et bedre sted.
Vinneren får 5 millioner dollar i støtte for å ferdigstille prosjektet.
Så hvordan har de tenkt til å løse problemet?
Lenker man til en side som tidligere har eksistert, kan en ved hjelp av et nytt HTML-attributt få tilgang til en arkivert kopi. Dermed kan en være sikret en lenke som aldri dør.
Les også: 23 år gamle Mathias sa nei til jobb i Facebook
Død og revisjon
Døde lenker er en ting. Et annet problem er ulempen med dynamiske dokumenter.
Innholdet i en artikkel kan endres uten at lenken endres og dermed kan også en levende lenke være en skivebom dersom innholdet er forandret.
Derfor er det også viktig at det blir lagret daterte kopier av hypertekst-dokumentene.
– Si at du leser et langsiktig referansedokument som er publisert online. Hvis flere permanente arkiver blir tilført for hver lenke, vil sjansen være liten for at lenkeråte vil gjøre siteringene ubrukelige, skriver prosjektet.
Forskning viser nemlig at dette er et reelt problem.
Mer en 70 prosent av URL-ene som blir sitert i blant annet Harvard Law Review viser seg ifølge en forskningsrapport å ikke lenke til den opprinnelig siterte informasjonen.
– Dersom hver hyperlenke var merket med en publiseringsdato, ville du automatisk kunne se en arkivert versjon av innholdet slik forfatteren ønsket at du skulle se det, står det på 404-prosjektets side.
Også den amerikanske høyesteretten skal ha slitt med lenkeråte, der en studie viser at 49 prosent av lenkene i dokumenter fra domsavsigelser ikke fungerer lenger.
Les også: Nå må webutviklere forholde seg til helt nye regler
MSET-attributt
Tiltaket 404-no-more-prosjektet sammen har gått i gang med, er å utvikle et HTML-attributt i -tag-en. A-tag-en er en HTML-kode brukt av webutviklere for å aktivere tekst eller bilder som lenker.
Her er et eksempel på hvordan en lenke med Mset-attributten kan brukes slik prosjektet har skissert:
href="http://www.w3.org/MarkUp/html-spec/html-spec_toc.html mset="2014-03-17"> HTML 2.0 |
Her oppgis Mset-egenskapen med datoen da innholdet ble referert. Mer avansert bruk av attributtet gjør det mulig å bruke tjenester som archive.org og perma.cc til å referere til en mer korrekt versjon av innholdet.
Dette skal gjøre det mulig for arkivet å finne tilbake til versjonen fra denne datoen, dersom siden skulle forsvinne eller innholdet skulle endre seg.
Mer avanserte eksempler kan du se på mset-attributtets utviklerside på Github.
Les også: Slik skal Pirate Bay gjøre det umulig å blokkere nettsider
Mål og fremgang
Partene i 404-no-more-prosjektet har allerede kommet et stykke i å utviklet tjenester og programvare som skal motvirke hull og lenkeråte på internett.
Memento er et nettlesertillegg for Google Chrome som lar deg "reise tilbake i tid" ved å gi tilgang til arkiverte versjoner av nettsider. Det er utviklet av Los Alamos National Laboratory, et av verdens aller største forskningsinstitusjoner, og Old Dominion-universitetet.
Perma.cc er et prosjekt driftet av en rekke biblioteker, deriblant Harvard-universitet sitt. Tjenesten gir permanente perma.cc-lenker som kan brukes til sitering og som aldri vil forandre seg. Bør være nyttig for mange akademikere.
404-no-more bruker flere av disse tjenestene aktivt som en del av Mset-attributtet.
I tillegg driver Harvards Berkman-senter for internett og samfunn et prosjekt som heter Internet Robustness som gjør det mulig for servere å selv mellomlagre innholdet de lenker til.
404-no-more-prosjektet har som mål å bli tatt opp i W3C-samfunnet som en offisiell seksjon for arkivsaker. På lenger sikt, ønsker de å få innført en ny HTML-standard for hyperlenker som aldri råtner.
Les også: