Wikipedia:Wikipediajournalen/Arkiv/oktober 2017/Arkivering af kilder

Fra Wikipedia, den frie encyklopædi
Wikipediajournalen

Guide: Sådan arkiverer du dine kilder

Af InsaneHacker, 28-09-2017
Citat I teorien burde denne forbindelse [mellem læseren og kildematerialet, red.] blive nemmere i takt med at kildeangivelser i større grad henviser til internetsider. I stedet for at skulle tage på biblioteket for at undersøge de kilder en forfatter har henvist til, kan nysgerrige læsere få adgang til materialet med det samme gennem et museklik.

Dog kun i teorien. URL-adressen peger på en ressource der varetages af en tredjepart og vil derfor kun overleve så længe tredjeparten bevarer den. I takt med at websider udvikler sig er det ikke sikkert at alle tredjeparter vil have en tilstrækkelig interesse i at bevare links så dem der er afhængige af dem fortsat kan anvende dem.

Citat
— Problematikken der opstår ved at bruge online-ressourcer som kilder (oversat fra engelsk):

Jonathan Zittrain, Kendra Albert & Lawrence Lessig. "Perma: Scoping and Addressing the Problem of Link and Reference Rot in Legal Citations". Harvard Law Review.{{cite journal}}: CS1-vedligeholdelse: Bruger authors parameter (link)

Wikipedia er et online-opslagsværk hvor både trykte og digitale værker bruges som kilder, i sidstnævnte kategori er internet-sider den mest udbredte form for kilde. Internet-sider er (så længe de er troværdige) nyttige da informationen er nem at tjekke efter eller finde frem til hvis læseren ønsker at få mere information fra kilden. Der er imidlertid en ulempe ved internet-sider: de er ustabile og uforudsigelige. Indholdet på en side kan ændres så den ikke længere understøtter eller har noget at gøre med den påstand den fungerer som kilde for (kildeforrådnelse eller reference rotengelsk), eller siden kan forsvinde helt (linkforrådnelse eller link rot på engelsk). Det siger sig selv at dette er et problem da artikler der anvender siden som kilde derved mister deres troværdighed, eller i hvert fald grundlaget for de påstande de fremsætter. I et studie i Harvard Law Review (citeret til højre) fandt forfatterne frem til at 70% af internet-kilderne i tre af Harvards tidsskrifter led af kildeforrådnelse, altså at 70% af kildehenvisningerne henviste til sider hvor indholdet var blevet ændret siden linket var blevet brugt som kilde. De undersøgte også internet-kilder i domme fra USA's Højesteret og fandt ud af at 50% led af kildeforrådnelse, hvilket er problematisk da de har været med til at danne grundlag for juridiske beslutninger der skaber præcedens.

Selv om undersøgelsen var af publicerede tidsskrifter er problemstillingen også relevant her på Wikipedia. Og her kommer vi til det centrale budskab i denne artikel: arkiver dine kilder. Arkivering betyder i denne sammenhæng at du sørger for at indsætte et link til en kopi af siden som den så ud da du brugte den som kilde. Lad os f.eks. sige at du i 2009 skriver en artikel om de britiske Liberaldemokrater og gerne vil bruge en pressemeddelelse fra deres hjemmeside som kilde til deres politiske ståsted. Politiske partier er berygtede for konstant at rykke rundt på deres hjemmesider, så du sørger for at linke til en arkiveret version der afspejler hvordan siden så ud på daværende tidspunkt. Otte år senere findes siden ikke længere, men da du huskede at arkivere siden er der stadigvæk dokumentation for den påstand du har brugt kilden til. Dette essay vil vise dig forskellige metoder hvorpå du kan arkivere sider, samt hvordan du angiver arkiverede versioner i dine kilder.

Arkiverings-værktøjer

Der findes forskellige tredjeparts-værktøjer som du kan bruge til at arkivere dine kilder. Der er ingen præference for hvilket værktøj du bør anvende, men visse værktøjer optræder mere hyppigt end andre.

The Wayback Machines logo
  • The Wayback Machine er et af de ældste arkiveringsværktøjer på internettet. Den drives af non profit-organisationen Internet Archive og har arkiverede versioner af websider helt tilbage fra slutningen af 1990'erne. The Wayback Machine er (anekdotisk) nok den mest anvendte arkiveringsmetode på Wikipedia. Hvis værktøjet ikke har en arkiveret version af den side du bruger som kilde, eller du ønsker at arkivere en nyere version kan du gå ind på http://www.archive.org/web og indsætte URL-adressen i feltet under "Save page now".
    • Fordele
      • The Wayback Machine fungerer ved at et automatisk computerprogram surfer nettet ved at følge links og arkivere dem (crawling). Det betyder at du ikke blot kan anvende værktøjet til at lave nye arkiveringer, men også at gennemsøge gamle versioner af populære sider til research.
      • Organisationen der vedligeholder the Wayback Machine, Internet Archive, har eksisteret i over 20 år hvilket betyder at man kan forvente en hvis stabilitet. Der er ikke en særlig stor chance for at de pludseligt trækker stikket og lukker for adgangen til arkivet. Derudover er de en non profit-organisation, hvilket passer meget godt med Wikipedia og Wikimedias mission om fri adgang til viden. Læsere der klikker videre til en arkiveret side vil ikke blive bombarderet med reklamer (medmindre de var en del af den arkiverede side).
    • Ulemper
      • The Wayback Machines crawler-program respekterer hvis en side ikke ønsker at blive arkiveret (dette gøres ved hjælp af en fil kaldet robots.txt). Dog gælder det ikke kun crawler-programmet, men også hvis du manuelt vil arkivere en side. Hvis du f.eks. søger efter eller forsøger at arkivere facebook.com vil du blive nægtet adgang da deres robots.txt-fil afviser adgang. Derudover vil the Wayback Machine også retroaktivt skjule sider i arkivet hvis den nyeste version blokerer for arkivering, hvilket betyder at sidens ejer reelt har kontrol over arkivet.
Archive.is' forside
  • Archive.is differentierer sig fra The Wayback Machine idet at den ikke automatisk arkiverer internetsider, men kun gør det når den eksplicit bliver bedt om det af en bruger. For at arkivere en side går du til http://www.archive.is, indsætter webadressen i feltet under My url is alive and I want to archive its content og klikker på save the page.
    • Fordele
      • Da archive.is ikke arkiverer sider gennem en robot tager de heller ikke hensyn til den førnævnte robots.txt-fil. Det betyder at The Wayback Machines problem med at sider skjules i arkivet ikke eksisterer her.
      • Hvis det er muligt tjekker archive.is også hvilket andet materiale den arkiverede side henviser til (billeder, frames etc.), og sørger for at det inkluderes i den arkiverede version. På den måde undgår man at en arkiveret version af en side mangler nogle multimedier fordi det teknisk set ikke var det du arkiverede, blot en side der henviste til dem.
      • Ud over en dynamisk arkiveret version af siden laver archive.is også en PNG-billedfil der viser hvordan siden så ud da den blev arkiveret. Det kan f.eks. være nyttigt i situationer hvor læserens browser kan fortolke indhold en smule forskelligt.
    • Ulemper
      • Archive.is arkiverer ikke Flash-indhold, videoer og PDF-filer. The Wayback Machine har også problemer med de to førstnævnte fra tid til anden, men kan godt arkivere PDF-filer.
      • Værktøjet kan ikke lagre sider der fylder mere end 50 MB
  • WebCite er gearet mere til akademiske udgivelser men er tilgængeligt for alle. For at arkivere en webside går du ind på http://www.webcitation.org/archive og indsætter webadressen i feltet URL to archive [url], indtaster din email-adresse i feltet Your (citing author) E-mail Address [email] og trykker på "Submit".
    • Fordele
      • WebCite har forskellige værktøjer der gør arkiveringsprocessen meget hurtigere, f.eks. kan du tilføje en såkaldt bookmarklet til din bogmærke-værktøjslinje i din browser som automatisk arkiverer den side du befinder dig på. Der er andre genveje du kan læse mere om på en:WP:Using WebCite#How to archive
      • Ud over at arkivere selve websiden kan du også indtaste metadata om den arkiverede side, herunder titel, forfatter, udgiver og dato. Denne metadata kan være med til at styrke kildens verificerbarhed.
    • Ulemper
      • Ligesom de fleste andre arkiveringsservices respekterer WebCite hvis en hjemmeside ikke vil arkiveres, og indehavere af hjemmesider kan anmode om at få deres indhold fjernet fra tjenesten.
  • Perma.cc er ligesom WebCite rettet mod akademikere og lignende personer der har brug for at arkivere kilder. I modsætning til de førnævnte services skal man oprette en brugerkonto for at anvende deres arkiveringsværktøj. Du kan læse mere om anvendelse af værktøjet på http://www.perma.cc.
    • Fordele
      • Perma er et samarbejde mellem mange forskellige biblioteker hvilket sikrer den arkiverede information på længere sigt. Selv hvis hele USA blev udslettet ville biblioteker i Canada og Europa kunne holde tjenesten kørende. Derudover har de en nedskreven procedure for hvad de gør med den arkiverede information i tilfælde af at hjemmesiden lukker ned.
      • Ligesom archive.is laver Perma et screenshot af siden der arkiveres så du får en 100% autentisk kopi af siden.
      • Brugergrænsefladen er mere simpel end hos the Wayback Machine hvilket kan gøre det nemmere for den gennemsnitlige læsere at bruge arkiveret information.
    • Ulemper
      • Perma lader webmastere blokere for arkivering ligesom WebCite og the Wayback Machine, dog kræver de at man specifikt udpeger Perma og nægter deres værktøj adgang. Derudover vil siden stadigvæk blive gemt, men ikke være tilgængelig for den gennemsnitlige internetbruger, hvilket ikke er så meget værd for Wikipedia-læsere og skribenter.
      • Hvis man ikke er tilknyttet et bibliotek eller et tidsskrift som deltager i Perma-samarbejdet kan man kun arkivere 10 sider om måneden.

Angivelse af arkiverede kilder

Der er flere forskellige måder at angive en arkiveret kilde på. Hvis du skriver kilden i ren tekst indsætter du et tekststykke bagefter der linker til den arkiverede side og angiver hvornår den blev arkiveret:

Lange, Peter (27. september 2017) "[http://ugeskriftet.dk/videnskab/selv-i-meget-smaa-maengder-er-luftforurening-skadelig-helbredet Selv i meget små mængder er luftforurening skadelig for helbredet]" ''[[Ugeskrift for Læger]]''. [https://web.archive.org/web/20170928090841/http://ugeskriftet.dk/videnskab/selv-i-meget-smaa-maengder-er-luftforurening-skadelig-helbredet Arkiveret] 28. september 2017
Lange, Peter (27. september 2017) "Selv i meget små mængder er luftforurening skadelig for helbredet" Ugeskrift for Læger. Arkiveret 28. september 2017

Hvis den oprindelige side ikke længere er tilgængelig kan du bytte om på arkivlinket og "hovedlinket" for at gøre det nemmere for den gennemsnitlige læser at få adgang til indholdet:

Lange, Peter (27. september 2017) "[https://web.archive.org/web/20170928090841/http://ugeskriftet.dk/videnskab/selv-i-meget-smaa-maengder-er-luftforurening-skadelig-helbredet Selv i meget små mængder er luftforurening skadelig for helbredet]" ''[[Ugeskrift for Læger]]''. Arkiveret fra [http://ugeskriftet.dk/videnskab/selv-i-meget-smaa-maengder-er-luftforurening-skadelig-helbredet originalen] 28. september 2017
Lange, Peter (27. september 2017) "Selv i meget små mængder er luftforurening skadelig for helbredet" Ugeskrift for Læger. Arkiveret fra originalen 28. september 2017

Hvis du anvender en kildeskabelon til dine kilder vil disse typisk have parametre til at arkiverede versioner af kilder. Her ses et eksempel med skabelonen {{cite web}} hvor parametrene |archiveurl= og |archivedate= angiver den arkiverede version og hvornår den er arkiveret.

{{cite web|first=Peter|last=Lange|title=Selv i meget små mængder er luftforurening skadelig for helbredet|date=27. september 2017|url=http://ugeskriftet.dk/videnskab/selv-i-meget-smaa-maengder-er-luftforurening-skadelig-helbredet|work=[[Ugeskrift for Læger]]|archivedate=28. september 2017|archiveurl=https://web.archive.org/web/20170928090841/http://ugeskriftet.dk/videnskab/selv-i-meget-smaa-maengder-er-luftforurening-skadelig-helbredet}}
Lange, Peter (27. september 2017). "Selv i meget små mængder er luftforurening skadelig for helbredet". Ugeskrift for Læger. Arkiveret fra originalen 28. september 2017.

Nogen kildeskabeloner, f.eks. {{cite news}}, indsætter arkivlinket som hovedlink uanset hvad. Dette er dog ikke muligt med alle skabeloner. Hvis du er i tvivl om hvilke muligheder en skabelon tilbyder kan du prøve at læse dens dokumentation eller at spørge efter hjælp på Hjælp:Teknisk forum.

NB: Nogle arkivtjenester tilbyder både et kort og et langt link for deres arkiver (f.eks. http://archive.is/YIg0N og http://archive.is/2017.09.28-093033/http://ugeskriftet.dk/videnskab/selv-i-meget-smaa-maengder-er-luftforurening-skadelig-helbredet). Korte links bruges ofte af spamrobotter og til andre svigagtige formål, derfor bedes du bruge den lange version hvilket også har den fordel at man kan se den fulde oprindelige URL-adresse.

Jeg håber at artiklen har hjulpet med at give dig et overblik over de forskellige måder at sikre at dine kilder vil holde langt ud i fremtiden.