Wikipedia:Landsbybrønden/Brug archive.org: Forskelle mellem versioner

Fra Wikipedia, den frie encyklopædi
Content deleted Content added
→‎Brug archive.org: indstillinger som de er lige nu
Linje 122: Linje 122:
:Hvis botten kunne nøjes med de døde links, så tror jeg, at det vil hjælpe en del. Det vil for eksempel løse Kort til kirkens problem ovenfor, hvor arkivlinks reelt blot fungerer som dubletter for fuldt aktive links. På sider med mange links vil det også gøre det nemmere at overskue og håndtere, hvis det kun er de døde links, der eventuelt skal tages hånd om. I nogle tilfælde ønskes arkivlinket måske placeret et andet sted i henvisningen, og i andre tilfælde dækker linket måske over en side, der bare er flyttet. --[[Bruger:Dannebrog Spy|Dannebrog Spy]] ([[Brugerdiskussion:Dannebrog Spy|diskussion]]) 22. jan 2021, 22:45 (CET)
:Hvis botten kunne nøjes med de døde links, så tror jeg, at det vil hjælpe en del. Det vil for eksempel løse Kort til kirkens problem ovenfor, hvor arkivlinks reelt blot fungerer som dubletter for fuldt aktive links. På sider med mange links vil det også gøre det nemmere at overskue og håndtere, hvis det kun er de døde links, der eventuelt skal tages hånd om. I nogle tilfælde ønskes arkivlinket måske placeret et andet sted i henvisningen, og i andre tilfælde dækker linket måske over en side, der bare er flyttet. --[[Bruger:Dannebrog Spy|Dannebrog Spy]] ([[Brugerdiskussion:Dannebrog Spy|diskussion]]) 22. jan 2021, 22:45 (CET)
::Ja, nu hvor vi ser hvor hurtig [[bruger:InternetArchiveBot|botten]] er og at det ser ud til, at den kan gennemgå alle dansk wikipedias artikler på under en måned, så synes jeg også det vil være bedst at den koncentrerer sig om de døde links (og først sætter arkivlinks ved de øvrige eksterne links efterhånden som de dør i årene der kommer). For øvrigt spørger en af personerne bag botten, Harej, om der er noget de kan hjælpe med, da de kan se at botten er blevet stoppet, se [[brugerdiskussion:Weblars#InternetArchiveBot issue]].--[[Bruger:Weblars|Weblars]] ([[Brugerdiskussion:Weblars|diskussion]]) 23. jan 2021, 22:31 (CET)
::Ja, nu hvor vi ser hvor hurtig [[bruger:InternetArchiveBot|botten]] er og at det ser ud til, at den kan gennemgå alle dansk wikipedias artikler på under en måned, så synes jeg også det vil være bedst at den koncentrerer sig om de døde links (og først sætter arkivlinks ved de øvrige eksterne links efterhånden som de dør i årene der kommer). For øvrigt spørger en af personerne bag botten, Harej, om der er noget de kan hjælpe med, da de kan se at botten er blevet stoppet, se [[brugerdiskussion:Weblars#InternetArchiveBot issue]].--[[Bruger:Weblars|Weblars]] ([[Brugerdiskussion:Weblars|diskussion]]) 23. jan 2021, 22:31 (CET)
* {{Kommentar}} Først en KÆMPE ROS til dem der har arbejdet med at få det til at virke. Især [[Bruger:Weblars|Weblars]]!!!!
: Jeg har selv været lidt indaktiv et stykke tid. For det første fordi botten ikke virkede og for det andet fordi jeg ikke kunne finde ud af konfigureringen (jeg har nu fundet ud af, at det med konfigureringen ikke er blevet bedre af, at jeg ikke har rettigheder til at se konfigureringen).
: Jeg synes, at det giver god mening først at koncentrere sig om at tilføje henvisninger til døde links. Botten må selvfølgelig meget gerne bede Internet Archive om at arkivere de sider, der stadigvæk er levende, men den skal ikke indsætte et link på Wikipedia så længe siden virker.
: Mht. placeringen af skabelonen, så ved jeg ikke om vi kan få en bot til at forsøge at flytte skabelonen. Man kan jo godt søge på "<nowiki>{{webarcive-skabelonen}}<en eller anden tekst>.</nowiki>" og så rette det til "<nowiki><en eller anden tekst>{{webarcive-skabelonen}}.</nowiki>" men det er ikke garanteret, at det så bliver korrekt. Jeg vil dog hellere have en henvisning placeret forkert end ingen henvisning. Men andre kan sagtens have det omvendt. Jeg synes i øvrigt, at teksten i () virker ok. Den del bør vi i alt fald kunne få en bot til at ordne (altså til at sætte parantes om skabelonen hvis det ikke kan inkluderes i selve skabelonen). --[[Bruger:MGA73|MGA73]] ([[Brugerdiskussion:MGA73|diskussion]]) 25. jan 2021, 17:24 (CET)


===Indstillinger for botten ===
===Indstillinger for botten ===

Versionen fra 25. jan. 2021, 18:24

Brug archive.org

Vi kender det alle: Man har brug for et link og så virker det ikke. Øv. Derfor vil jeg gerne opfordre til, at man kopiere linket og går ind på https://archive.org/web/ og indsætter linket og vælger "Save page".

På Commons er der tale om at have en bot til at gå ind og gemme alle eksterne henvisninger og botter kan også lede efter gemte versioner af links. Kunne vi få det her på Wikipedia, så er det skønt, men det kræver, at nogen kan finde ud af det og har tid til det.

Så indtil da kan man gemme links manuelt. Det er desværre lidt tungt, men jeg tænker, at når man tilføjer et link til en artikel, så kunne man gøre det til en vane også lige at gemme det. --MGA73 (diskussion) 6. mar 2020, 11:59 (CET)

I sig selv en god idé, men tror desværre det bliver lidt tungt. I forvejen har vi svært ved bare at få kilder på vores artikler. Måske Dipsacus fullonum eller Steenth ved noget om en bot, for det ville være en knaldgod idé. Tøndemageren 6. mar 2020, 14:29 (CET)
Jeg troede egentlig der kørte en sådan bot, men hvis det ikke er tilfældet bør det om muligt etableres. Forøvrigt findes der browsertilføjelser både til Firefox og Crome der gemmer på archive.org med et enkelt klik. - Nico (diskussion) 6. mar 2020, 15:01 (CET)
@MGA73, Tøndemageren og Nico: Der er en bot, som kan rette url'er til archive.org. Det er diskuteret i Wikipedia:Landsbybrønden/Automatisk bot-kildearkivering, hvor User:InternetArchiveBot tager sig af opgaven med både at tjekke links og ændre til arkivudgaven. Det er et spørgsmål om en optager sig opgaven med at kontakte brugeren bag den bot. Da det blev diskuteret sidste gang, var der opbakning til det. Dog bør vi sikre os det stadig er. --Steen Th (diskussion) 6. mar 2020, 15:16 (CET)

Jeg testede lige på enwiki. Det er ret let på en enkelt side. Men skal det gøres meget så skal vi nok have det automatiseret.

Hvordan slår man det til på dawiki? --MGA73 (diskussion) 6. mar 2020, 16:59 (CET)

Jeg har spurgt på :en:User_talk:Cyberpower678#IABot_in_da.wiki om hvordan vi kommer i gang. Når vi ved det, så kan vi nok hurtigt få tjekket om der stadig er tilslutning. --MGA73 (diskussion) 6. mar 2020, 21:48 (CET)
Det lyder som en rigtig god ide, hvis sådan en automatisk genereret arkivering kan etableres. Økonom (diskussion) 10. mar 2020, 08:15 (CET)
Så har jeg spurgt igen på en:User_talk:Cyberpower678#How_do_we_get_IABot_in_da.wiki?. Må se om det virker denne gang. --MGA73 (diskussion) 22. mar 2020, 14:32 (CET)
@Ysangkok: Tak for rettelsen af linket. Jeg havde ikke set at den var blevet arkiveret allerede. --MGA73 (diskussion) 22. mar 2020, 14:33 (CET)

Så er der kommet svar. Botten er så godt som klar! Den skal bare have et botflag! --MGA73 (diskussion) 24. mar 2020, 23:10 (CET)

Se Wikipedia:Anmodning_om_botstatus#InternetArchiveBot. --MGA73 (diskussion) 24. mar 2020, 23:24 (CET)
@Metalindustrien, Zoizit, Amjaabc, Toxophilus, EileenSanda, Tøndemageren, Nico, Steenth, Økonom og Ysangkok: Blot et ping til de stadigt aktive brugere, som har kommenteret på det foregående og dette opslag. Håber det er ok. Tænkte, at hvis I har input så er det rart at få inden botten går i gang for alvor. --MGA73 (diskussion) 24. mar 2020, 23:35 (CET)
Herligt :-) - Nico (diskussion) 24. mar 2020, 23:46 (CET)
Glimrende tiltalg. Jeg synes dog ikke, at alle URL'er skal erstattes med et arkiv-link. Derimod at lave et ekstra link til den arkiverede url'er på archive.org. Det er også indbygget i kildeskabelonen. Se f.eks., hvad jeg har gjort på Middelaldercentret. Nogle gange synes jeg archive.org kan have en lang loadetid og layoutet er lidt anderledes en "den rigtige side", så for at tilbyde flest muligheder for folk mener jeg, at vi skal have begge dele; original url og arkiv-url. Mvh. Toxophilus (diskussion) 25. mar 2020, 08:06 (CET)
Det kan være at InternetArchiveBot skal lære nogle af de danske skabeloner at kende. De relevante skabeloner bruger allerede den samme kodebase. Arkiv-link er kun relevant, når den originale link er væk. Så som udgangspunkt skal arkiv-linket ikke være der før det er nødvendig. --Steen Th (diskussion) 25. mar 2020, 08:25 (CET)
Jeg er enig i, at vi skal have de oprindelige links, hvis de er i live. Men måske man også burde have linket til en arkiveret version (altså begge links)? Jeg tænker på de tilfælde, hvor linket er i live men hvor de oprindelige informationer er overskrevet og erstattet af noget helt andet. --MGA73 (diskussion) 25. mar 2020, 11:34 (CET)

Vi er vist kørt parallelt med hinanden for det er kun få dage siden jeg oprettede en ticket til at få IAB til dawiki, siden det var det jeg kunne se man havde gjort i nowiki. Så længe den kommer og den virker så er jeg bare glad, da linkråd var en af grundene til at jeg mistede lysten til at redigere Wikipedia da alle mine gamle Children of Bodom-artikler i dag er fulde af døde links :-( --Metalindustrien A/S (tidligere Lhademmor) 25. mar 2020, 11:39 (CET)

Hey Metalindustrien A/S min gamle ven! Det er super ærgerligt med dine gamle artikler, at de nu (ligesom andre artikler) har døde links. Jeg håber at botten kan forhindre det fremadrettet og muligvis finde arkiverede versioner af de gamle link.
Jeg aner ikke om jeg gjorde det rigtige. Jeg forsøgte mig bare frem. Jeg forestiller mig, at botten laver nogle testændringer og så kontrollerer vi om det virker og ellers retter vi skabelonerne eller botten.
Jeg glæder mig i alt fald til at det kommer til at virke! --MGA73 (diskussion) 25. mar 2020, 15:27 (CET)
Jeg fandt et link til en konfiguration her https://iabot.toolforge.org/index.php?page=wikiconfig&wiki=arwiki så jeg tænker at dawiki må have linket https://iabot.toolforge.org/index.php?page=wikiconfig&wiki=dawiki så vi kan jo følge lidt med der (hvis vi har et login). --MGA73 (diskussion) 20. jun 2020, 11:27 (CEST)

Så sker der noget

Jeg har lige fået besked på Wikipedia:Anmodning_om_botstatus#InternetArchiveBot om at botten er startet op. P.t. kan jeg ikke se nogle redigeringer, men jeg tænker, at den lige skal tygge sig igennem forskellige oplysninger før den begynder at gøre noget. Derudover er en del af dens arbejde jo at bede internet archive om at arkivere sider og det er jo ikke synligt her på Wikipedia.

Men I må alle gerne hjælpe med at tage godt imod botten. Der opstår sikkert nogle spørgsmål og der sker nok også lidt fejl i starten. Men botten er her for at hjælpe os så håber vi alle kan leve med det hvis der er lidt ekstra arbejde i starten. --MGA73 (diskussion) 11. sep 2020, 07:36 (CEST)

Okay der sker ikke så meget endnu. Status var deaktiveret da jeg tjekkede. Jeg bad botten om at tjekke et par sider og den lavede denne rettelse: af artiklen Danmark. Det giver en fejl "Ugyldig |url-status=live" == UrlStatus or "ok" .
Er der nogen der ved hvad problemet er? Skal vi rette skabelonen? --MGA73 (diskussion) 13. sep 2020, 10:45 (CEST)
Jeg kan se at Kategori:CS1-fejl: Ugyldig parameterværdi sættes og når man se på den engelske kategori: en:Category:CS1 errors: invalid parameter value, at det er en parameter værdi, som ikke i den tilladt sæt af værdier. Det er bot'ten som sætter den værdi. --Steen Th (diskussion) 13. sep 2020, 12:07 (CEST)
Tak Steen Th! Men der er jo så 2 muligheder 1) man får botten til ikke at sætte den værdi, eller 2) man retter skabelonen så værdien bliver tilladt. --MGA73 (diskussion) 13. sep 2020, 12:15 (CEST)
Det ligner at bot-software i det aktuelle tilfælge ikke kan sætte den rigtige. Prøv at rettet nogle andre url'er og sider. Selve de værdier, som sætte der, er nogle bestemte værdier, som er dokumentere. Men den danske dokumentation er nok ikke 100% ajour, men det er den engelske. --Steen Th (diskussion) 13. sep 2020, 18:19 (CEST)

Hvordan går det? --Santac (diskussion) 9. okt 2020, 17:28 (CEST)

@Steenth og Santac: I dag lavede botten en række redigeringer jeg anmodede om for ca. 1 måned siden. Der er et problem med syntaksen. Om det er botten der er dårlig til det eller om det er de danske skabeloner, der er opbygget atypisk ved jeg ikke. --MGA73 (diskussion) 27. okt 2020, 07:54 (CET)
@MGA73: Skabelonerne og modulerne blev frisket for et år siden af Bruger:Weblars og de bruger alle et standard-modul, som er hentet fra enwiki, som let at tilpasse via Modul:Citation/CS1/Configuration. De datoformater, som bruges, er både danske og engelske. De bliver ændret fra archivedate=23. marts 2008 til archivedate=2008-03-23. Dvs har bot-software ikke noget problem med. Så det er relativ let at håndtere. Det er stadig url-status, som status med en værdi, som ikke ser rigtig ud. --Steen Th (diskussion) 27. okt 2020, 11:05 (CET)
@Steenth: Ja det ser lidt skidt ud. Det må være en fejl i opsætningen af botten så, hvis vores skabeloner mv. er en kopi fra en.wiki. --MGA73 (diskussion) 27. okt 2020, 11:57 (CET)
Et af problemerne er vist løst nu, for jeg har tilføjet mulighed for at skrive deadurl=dead i denne redigering.--Weblars (diskussion) 27. okt 2020, 14:41 (CET)
Med hensyn til det andet problem, hvor botten indsætter |url-status=live" == UrlStatus or "ok, så har jeg prøvet at lede i kildekoden og har fundet filen CiteMap.php i mappen Core. Her er en funktion, der hedder "getDeadValues", hvor jeg kan genkende de to lighedstegn som indsættes. Måske hænger fejlen sammen med den forskel der er på vores Modul:Citation/CS1/Configuration og en:Module:Citation/CS1/Configuration. Jg vil forsøge at forstå, hvad der sker. Måske er det bare en lille ting der skal ændres i vores modul.--Weblars (diskussion) 28. okt 2020, 10:55 (CET)
@Weblars: Kodningen af et modul kan ikke direkte have indflydelse på hvordan en bot opfører sig. Det er kun selve wikiteksten som botten har at forholde sig til, og ikke hvordan den færdige HTML-side bliver vist. Jeg forstår derfor ikke meningen med ændringen i Modul:Citation/CS1. Modulets opførsel ændres ikke af at du kalder en funktion i stedet for at lave sammenligningen direkte, men selv hvis noget var ændret, ville en bot ikke se det. --Kartebolle (Dipsacus fullonum) (diskussion) 5. nov 2020, 05:51 (CET)
Jeg har netop afprøvet botten i menupunktet "Kør robot" på IABot-håndteringsgrænseflade vha min sandkasse. Modsat hvad jeg havde forventet ser det ikke ud til at min ændring i Modul:Citation/CS1 har haft nogen effekt (endnu?). Ligesom dig troede jeg ellers heller ikke umiddelbart at en bot kunne påvirkes af indholdet af vores moduler, men efter at have nærlæst koden (nævnt ovenfor) og afprøvet en modificeret version på min egen pc (vha en wamp-server), så troede jeg altså at problemet var løst. Som jeg læser koden, hentes kildekoden til netop dette modul af botten (hvis siden er blevet ændret siden sidst og derefter har været stabil i mindst 15 min). Herefter forsøger man at matche et regulært udtryk som netop er afpasset den engelske version af modulet. I det regulære udtryk er der taget højde for brug af in_array()-funktionen. Derfor ændrede jeg i modulet, og jeg havde som sagt afprøvet det regulære udtryk på min egen pc. Se evt også hvad jeg mener er årsagen til bottens problem i Moduldiskussion:Citation/CS1#Opdatering af modul.--Weblars (diskussion) 5. nov 2020, 09:16 (CET)
OK, tak for svar. De lyder meget underligt, men virkeligheden er nogle gange underlig. --Kartebolle (Dipsacus fullonum) (diskussion) 5. nov 2020, 09:42 (CET)

Fint forslag med archive.org – især for artikler, hvor myndigheder kan fordre offentligjort materiale fjernet – så jeg har prøvet funktionen idag, efter jeg havde fundet et gammel "The Nation (Thailand)"-reflink som var helt væk, men heldigvis arkiveret af den oprindelige skribent, eller kopieret fra enWiki, og med funktionen |deadurl=yes kom fint frem i referencelisten som link. Koderne, fra angiveligt enWiki – |archiveurl= |archivedate= |deadurl= – fungerer fint. Men hvis man har mange referencer i en tekst, er det ret møjsommeligt, grænsende til uoverkommeligt, manuelt at arkivere et link og vente på en arkivadresse. Vil være skønt med en robot-funktion.--Per Meistrup (diskussion) 23. nov 2020, 09:08 (CET)

Overblik og spørgsmål

Jeg har stillet nogle spørgsmål til ejeren af InternetArchiveBot. Desuden har jeg prøvet at få overblik over, hvordan botten virker og styres.

  • Der findes en slags dokumentation og en FAQ på Meta-Wiki. Den styres vha. IABot-interfacet, hvor man kan logge ind med med samme brugernavn som på wikipedia. Det kræver dog at man er medlem af en særlig admin-gruppe, for at kunne konfigurere botten. Som udgangspunkt er det kun administatorer fra dawiki, der er i denne admin-gruppe, har bot-ejeren allerede svaret mig.
  • Problemer der ikke kan rapporteres gennem interfacet, kan rapporteres på bot-ejerens diskussionsside en:User talk:cyberpower678.
  • Botten har også sin egen brugerkonto på dansk wikipedia, bruger:InternetArchiveBot, hvor man kan se dens bidrag.
  • Man kan slå botten til eller fra gennem interfacet her (tjek først at der står "dawiki - Danish Wikipedia" oppe til højre ved siden af ens brugernavn). Den er slået fra i øjeblikket. Den skal vel først sættes i gang, når den ikke længere laver unoder.

Der ser i de test vi har lavet ikke ud til at blive repareret døde links vha archive.org, hvilket er hovedformålet med botten. Det regner jeg med kan konfigureres i interfacet. Kun en tredjedel af interfacet er oversat til dansk (interface hedder lige nu "håndteringsgrænseflade" selv om jeg har ændret det på TranslateWiki, men der går noget tid inden det slår igennem). I interfacemenuen "Kør robot" er det bedst at vælge "Ret en enkel side", fordi der er lang ventetid, hvis man vælger at sætte flere sider i kø.--Weblars (diskussion) 13. nov 2020, 20:47 (CET)

Jeg er ikke teknik-specialist og det kan være det har været nævnt tidligere. Min opfattelse har været at alle link, både aktive og døde, blev konverteret til internet-archive, men nu skrives der: "Der ser i de test vi har lavet ikke ud til at blive repareret døde links vha archive.org, hvilket er hovedformålet med botten." Er hovedformålet at reparere døde link eller er hovedformålet at få levende link sikret mod at blive døde? --Santac (diskussion) 23. nov 2020, 11:25 (CET)
Jeg synes det vil være bedst med begge dele. Jeg har netop fået adgang til konfigurationen og vil prøve at teste de forskellige indstillinger i min sandkasse i den næste tid.--Weblars (diskussion) 23. nov 2020, 20:39 (CET)
Super :-) Vi ser hvad der er muligt. --Santac (diskussion) 24. nov 2020, 09:54 (CET)
Status kort sagt
  • Status er at botten stadig har fejl og derfor ikke er sat i gang på dansk wiki. Men i øvrigt kører den heller ikke på andre wikier som fx engelsk wiki. Den kan dog testes på enkelte sider (fx er den afprøvet på en sandkasseside).
  • Jeg har ændret i bottens indstillinger, så den nu forsøger at finde arkiverede sider til alle links som nævnt af bruger:Santac ovenfor.
  • For interesserede er bottens konfiguration i øjeblikket synlig i en sandkasse. Den kan ellers kun ses af brugere i "admin group" eller andre brugere tildelt særlige rettigheder.
Uddybning

Status er lige nu at botten er inaktiv på alle wikier, hvilket den ifølge dens globale bidrag har været siden slutningen af oktober. Det gør ikke så meget for dansk wikipedia (hvor den i forvejen er slået fra), for den indsætter stadig forkert status for de links, der er "live" (ikke døde), se seneste test. Årsagen til at botten er inaktiv er muligvis de mange (>50) tasks, der kan ses i "Phabricator" og måske mere specifikt at den lader til at rapportere et stort antal falske positive, dvs den tror at et link er dødt selv om det faktisk virker (eksempel fra nowiki, der af samme grund har slået botten fra). Ejeren af botten lader i øvrigt ikke til at have foretaget ændringer ("commits") i bottens software på github.com siden slutningen af oktober (min kommentar til hans sidste commit).

Jeg har nu fået adgang til at konfigurere botten vha. rettigheden "configurewiki" takket være bruger:Steenth og har foretaget et par ændringer, der gør at botten nu forsøger at finde arkivsider til alle eksterne links og bruger dansk datoformat. Jeg har kopieret konfigurationen til en sandkasse så alle kan se den. Alt i "interfacet" er efterhånden oversat til dansk bortset fra de dele, der kun er synlige for brugere med særlige rettigheder. Jeg har tænkt mig at "oversætte" resten (347 af i alt 796) ved at lade dem forblive på engelsk, især for derved på en nem måde at slippe af med den orange bjælke øverst, der konstant fortæller at oversættelsen af interfacet er ufuldstændig.

Måske ville det være godt hvis botten blev testet bedre (gennem interfacet) inden den fik lov til at køre på de i øjeblikket 45 aktiverede wikier, der hver især er lidt forskellige hvad angår kildeskabelonerne (fx er dansk {{cite web}} lidt anderledes fra den engelske). Det ville også være praktisk hvis man kunne teste den på test.wikipedia.org og hvis det i højere grad blev de enkelte wikiers ansvar. Det virker som en for stor opgave for en enkelt person som det er nu. Man kan indrapportere fejl vha. interfacet, hvillet jeg har gjort med en enkelt ting, der faktisk allerede nu er blevet rettet med en "commit", en "pull request" og et "merge" på github.com, men der er vist generelt behov for mere hjælp til at løse de mange åbne "tasks".--Weblars (diskussion) 29. nov 2020, 19:36 (CET)

InternetArchiveBot virker tilsyneladende nu

InternetArchiveBot, også kaldet IABot, lader til at virke nu, i hvert fald hvis man skal tro den første test, der kan ses her. I denne testartikel findes et referenceafsnit med 101 referencer, hvor botten i testen foretog ændringer i 78 af dem. I mange referencer med eksterne henvisninger tilføjede den et link til en arkivside som fx denne. Jeg har gennemgået alle disse 78 referencer i en tabel og kun fundet to (ref. nr 18 og 24), der nok bør rettes manuelt af en person efter bottes kørsel. Botten kører i øvrigt igen på de andre wikier, og der skete en opdatering af dens software midt i december som måske er grunden til den nu også lader til at virke i testen den 16/12. Hvis man kigger på tabellen nævnt ovenfor, kan man se at der endnu er ting som ikke virker optimalt, og botten bør også testes på artikler som fx USA, inden den slippes løs.--Weblars (diskussion) 21. dec 2020, 22:32 (CET)

Godt nytår! Jeg har netop sat botten i gang som en test. Dens bidrag kan allerede ses.--Weblars (diskussion) 1. jan 2021, 10:45 (CET)
Godt Nytår herfra også, fedt med bottet, der er bare et problem med at dens arbejde (ligesom Listeriagbot) vises i Seneste ændringer, selv om botter er slået fra. Er det mon noget Du kan gøre noget ved? -Nico (diskussion) 1. jan 2021, 10:55 (CET)
I dette tilfælde er det fordi den ikke har bot-flag.
- Sarrus (db) d. 1. jan 2021, 10:57 (CET)
Jeg har stoppet den igen, da den efter 15 min. havde ændret i mere end 130 artikler og oprettet et tilsvarende antal diskussionssider. Dem vil jeg kontrollere, inden den sættes i gang igen.--Weblars (diskussion) 1. jan 2021, 10:58 (CET)
Hvis ellers testen er forløbet tilfredsstillende, kunne man så ikke overveje kun at lade den køre om natten, ind til botflaget er i orden? - Nico (diskussion) 1. jan 2021, 11:02 (CET)
Jo, og det er vel også et spørgsmål om den stadig skal oprette diskussionssider. Teksten skal i hvert fald oversættes til dansk. --Weblars (diskussion) 1. jan 2021, 11:19 (CET)
Vær venlig helt at stoppe notifikationerne. Hvis det her fortsætter, vil tusindvis af diskussionssider lynhurtigt blive spammet til med standardmeddelelser, som ingen tager sig af, og ingen har brug for. Hvad der rettes af links kan ses i artiklernes historik og behøver ikke yderligere bemærkninger. --Dannebrog Spy (diskussion) 1. jan 2021, 12:51 (CET)
Nu er der ændret i de to indstillinger, der hedder "Leave talk page messages" og "Leave archiving errors on talk pages", så de begge er sat til "Nej". Jeg har kigget på nogle af bottens ændringer i bl.a. Simested Å og kan se, at bottens indsættelse af skabelonen {{Webarchive}} medfører, at der ofte kommer et punktum for meget. Hvis ingen protesterer, vil jeg fjerne punktummet i Modul:Webarchive inden næste prøvekørsel af botten. Punktummet bruges i øvrigt ikke af den tilsvarende skabelon {{Wayback}}.--Weblars (diskussion) 3. jan 2021, 14:49 (CET)
Lyder fantastisk godt, mange artikler mister værdi når kilderne dør. Jeg er enig med Dannebrog Spy i at det ikke er godt med botmeddelelser på diskussionssiderne, men fejlmeddelelser er nok vigtige, - kunne man evt sende dem til en skjult kategori? er der noget nyt om botgodkendelse (er det bruger:Kaare vi skal have fat på her?), så den kan skjules i Seneste ændringer? - Nico (diskussion) 3. jan 2021, 15:58 (CET)
@Weblars: Det vil stadig se mærkeligt ud hvor {{Webarchive}}-skabeloner er indsat i eksterne henvisninger hvis punktummet fjernes i fx teksten "Om naturplanen Arkiveret 9. januar 2012 hos Wayback Machine. på naturstyrelsens portal, med henvisninger til kort og dokumenter." (citat fra artiklen Simested Å). Jeg tror det er bedre indsætte hele teksten i parentes og begynde med lille bogstav: "Om naturplanen (arkiveret 9. januar 2012 hos Wayback Machine) på naturstyrelsens portal, med henvisninger til kort og dokumenter." --Kartebolle (Dipsacus fullonum) (diskussion) 5. jan 2021, 10:35 (CET)
Nico: Jeg har prøvet at kigge på de mulige indstillinger af botten (kan i øjeblikket ses her), men der står ikke noget om skjulte kategorier. Man kan måske tilføje lidt ekstra information til redigeringsopsummeringen med de magiske ord {linksarchived} og {linksanalayzed}, der er nævnt som nr 6 og 7 på denne meta-hjælpeside samt anden forklarende tekst, men så bliver opsummeringen måske for lang?
Kartebolle (Dipsacus fullonum): Ja, i tilfældet Simested Å ser det ikke så godt ud (især fordi de efterfølges af ordet "på"), men mange andre steder går det bedre, selv om {{Webarchive}}-skabelonerne altid bliver indsat umiddelbart efter det eksterne link. Nogle gange er det eksterne link ellers del af en større manuelt formateret reference, hvor skabelonen kommer ind før et citat, en besøgsdato eller navnet på et forlag. Meget ofte er problemet dog at to punktummer vises i træk, se fx de mange indsættelser i USA, første del og USA, anden del (USA-artiklen var for stor til det værktøj der findes i IABot-interfacet).--Weblars (diskussion) 5. jan 2021, 23:14 (CET)
Nu er alle bottens 131 redigeringer fra prøvekørslen den 1. januar kigget efter. De fleste af dem var OK og der skulle ikke gøres noget ved dem. De gange hvor jeg efterfølgende har rettet bottens redigering (23 gange), skyldes det oftest, at den som beskrevet ovenfor indsætter {{Webarchive}} midt i en ekstern henvisning, hvis den er manuelt formateret. Jeg har af den grund ofte ændret ordet "på" til et komma, fordi det ser lidt bedre ud (som her). Her er andre typer fejl fra bottens side: Silvia Federici, Silvia af Sverige, Silkevejen og Silkeborg Kommune. Jeg lagde mærke til, at Bruger:Kort til kirken ikke syntes, at der skulle være arkivlink til hjemmesiden KortTilKirken.dk. For at undgå at botten kommer tilbage og genindsætter linket, kan man indsætte skabelon:cbignore som det ses af denne diff.
IABot er i øvrigt et temmelig kompliceret stykke software. Det består af mere end 450 filer, der i alt fylder over 30 MB. Filen ændret i december var på knap 5000 programlinjer (200 kB). Der kigges fx i artiklens historik for at se, hvornår et link blev indsat, når et af flere arkivlink fra archive.org skal udvælges (det ovenfor omtalte arkivlink (nu igen fjernet) for Simested Kirke er det ældst mulige hos archive.org i forhold til indsættelsen i artiklen i sep. 2010). I IABot-interfacet er den indstillet til "Use archives closest to the access date", se min kopi.--Weblars (diskussion) 9. jan 2021, 22:49 (CET)
Er der én herinde der vil forklare mig grunden til, at InternetArchiveBoot er ved at ændre alle links til en altid opdateret hjemmeside "korttilkirken.dk" til links til Wayback Machine, links tilbage til 2015, som om hjemmesiden ikke eksisterer længere. Jeg har skrevet til Steenth om at indsætte en blokering på mine hjemmesidelinks for at hindre en ændring af links. Hvis det er en overordnet beslutning, at links SKAL ændres, er der ingen grund til at jeg fortsætter mit arbejde med kirkeopdateringer på Wikipedia. Med venlig hilsen Preben Gøssing Kort til kirken (diskussion) 20. jan 2021, 18:33 (CET)
Har fået svar fra stenth på mit spørgsmål. Havde overset, at der er to links i samme "sætning"Kort til kirken (diskussion) 20. jan 2021, 19:51 (CET)
Det er ikke særlig smart, at arkivlinket bliver indsat lige efter det originale link. Mange manuelt indsatte kildeangivelser bliver ulogiske på den måde eller direkte misvisende. For eksempel:
Her vil det være væsentligt bedre at indsætte arkivlinket efter den originale kildeangivelse. Det vil også mindske risikoen for forvekslinger mellem de originale links og arkivlinks. --Dannebrog Spy (diskussion) 21. jan 2021, 15:52 (CET)
Jeg er enig med Dannebrog Spy. Jeg tvivler på at en bot kan finde det bedste sted at indsætte {{Webarchive}}. Det var derfor jeg ovenfor foreslog at anbringe skabelontekst i en parentes – så man kan se den oprindelige sætning ved at springe parentesen over når skabelon er placeret midt i en sammenhængende tekst. --Kartebolle (Dipsacus fullonum) (diskussion) 21. jan 2021, 16:37 (CET)

[redigeringskonflikt

Nej, det synes jeg heller ikke er smart, men botten blev sat igang af programmøren harej, da den havde fået botflag. Jeg har netop stoppet botten, så vi får tid til at diskutere det. Nogen kan måske finde en løsning på problemet. Jeg har ikke kunnet, men nævnte det igen overfor bruger harej, da botflaget skulle gives. Botten har på knap 2 døgn redigeret omkring 18.000 artikler. Her er dens Brugerbidrag. Jeg har lavet en søgning, der finder de sider med aller flest indsættelser af skabelon:webarchive i de manuelt indsatte kildeangivelser (altså uden kildeskabeloner).--Weblars (diskussion) 21. jan 2021, 16:49 (CET)

Kartebolle (Dipsacus fullonum), jeg synes parentesen lyder som en god ide. Jeg har helt overset dit forslag, da du kom med det 5. januar ovenfor.--Weblars (diskussion) 21. jan 2021, 17:25 (CET)

Jeg synes nu stadig, at arkivlinket skal placeres til sidst, så det bliver ordenligt adskilt fra det originale link, og kildeangivelserne fortsat kan læses som tiltænkt. Men under alle omstændigheder skal der gøres noget ved de artikler, hvor botten allerede har indsat arkivlinks midt i manuelle kildeangivelser, før den slippes løs igen. For med den hastighed botten arbejder med, kommer problemet meget hurtigt til at berøre mange tusinde artikler. --Dannebrog Spy (diskussion) 21. jan 2021, 23:22 (CET)
Kan man bede om at botten foreløbig kun indsætter arkivlinks i kildeskabeloner og ikke i eksterne links direkte i teksten (kilder og eksterne henvisninger uden brug af skabelon)? Jeg tror at det er uproblematisk og vil være meget nyttigt. Imens kan vi snakke om hvad vi skal gøre med de andre links. Jeg vil foretrække at de flyttes til kildeskabeloner i videst muligt omfang, da linkene så netop vil være nemmere at finde og behandle af botter, lave statistik for og anden maskinel behandling. --Kartebolle (Dipsacus fullonum) (diskussion) 21. jan 2021, 23:44 (CET)
Undertegnede bruger kun kildeskabeloner, når de følger med i oversættelser. Ellers bruger jeg kun manuelle kildeangivelser, fordi det er det nemmeste og hurtigste. Jeg behøver ikke at skulle indkopiere en længere række parametre fra en anden side, sørge for at de relevante parametre udfyldes på den eneste måde kildeskabelonen er indrettet til og fjerne de overflødige parametre, der ellers bare vil stå og fylde op. Andre må da gerne bruge dem til deres egne angivelser, men for mig er det vigtigere, at der er kilder, end at de lige er angivet på en bestemt måde. Dertil kommer så de begyndere vi løbende har, for hvem både kildeangivelser og skabeloner er fremmed land. De skulle nødigt skræmmes væk med endnu flere komplicerede ting. --Dannebrog Spy (diskussion) 22. jan 2021, 00:08 (CET)

Her er Dannebrog Spys eksempler, men hvor Webarchive-skabelonen bruger parentes (Kartebolles forslag) og en forkortet tekst (mit forslag):

Det er desværre heller ikke sikkert for botten at indsætte webarcive-skabelonen til slut, hvis der findes flere eksterne links i samme reference (se eksempel i refence nr 283 i USA). Jeg har tidligere eksperimenteret med bottens indstillinger, men kunne ikke få den til kun at indsætte arkivlinks i kildeskabeloner og ikke i eksterne links direkte i teksten (som Kartebolle spørger om). Problemet findes i øvrigt også på engelsk wiki, se denne diff fra marts 2020. Hvad siger I til dette forslag?--Weblars (diskussion) 22. jan 2021, 22:25 (CET)

Hvis botten kunne nøjes med de døde links, så tror jeg, at det vil hjælpe en del. Det vil for eksempel løse Kort til kirkens problem ovenfor, hvor arkivlinks reelt blot fungerer som dubletter for fuldt aktive links. På sider med mange links vil det også gøre det nemmere at overskue og håndtere, hvis det kun er de døde links, der eventuelt skal tages hånd om. I nogle tilfælde ønskes arkivlinket måske placeret et andet sted i henvisningen, og i andre tilfælde dækker linket måske over en side, der bare er flyttet. --Dannebrog Spy (diskussion) 22. jan 2021, 22:45 (CET)
Ja, nu hvor vi ser hvor hurtig botten er og at det ser ud til, at den kan gennemgå alle dansk wikipedias artikler på under en måned, så synes jeg også det vil være bedst at den koncentrerer sig om de døde links (og først sætter arkivlinks ved de øvrige eksterne links efterhånden som de dør i årene der kommer). For øvrigt spørger en af personerne bag botten, Harej, om der er noget de kan hjælpe med, da de kan se at botten er blevet stoppet, se brugerdiskussion:Weblars#InternetArchiveBot issue.--Weblars (diskussion) 23. jan 2021, 22:31 (CET)
  •  Kommentar Først en KÆMPE ROS til dem der har arbejdet med at få det til at virke. Især Weblars!!!!
Jeg har selv været lidt indaktiv et stykke tid. For det første fordi botten ikke virkede og for det andet fordi jeg ikke kunne finde ud af konfigureringen (jeg har nu fundet ud af, at det med konfigureringen ikke er blevet bedre af, at jeg ikke har rettigheder til at se konfigureringen).
Jeg synes, at det giver god mening først at koncentrere sig om at tilføje henvisninger til døde links. Botten må selvfølgelig meget gerne bede Internet Archive om at arkivere de sider, der stadigvæk er levende, men den skal ikke indsætte et link på Wikipedia så længe siden virker.
Mht. placeringen af skabelonen, så ved jeg ikke om vi kan få en bot til at forsøge at flytte skabelonen. Man kan jo godt søge på "{{webarcive-skabelonen}}<en eller anden tekst>." og så rette det til "<en eller anden tekst>{{webarcive-skabelonen}}." men det er ikke garanteret, at det så bliver korrekt. Jeg vil dog hellere have en henvisning placeret forkert end ingen henvisning. Men andre kan sagtens have det omvendt. Jeg synes i øvrigt, at teksten i () virker ok. Den del bør vi i alt fald kunne få en bot til at ordne (altså til at sætte parantes om skabelonen hvis det ikke kan inkluderes i selve skabelonen). --MGA73 (diskussion) 25. jan 2021, 17:24 (CET)

Indstillinger for botten

Neden for vises de væsentligste indstillinger for InternetArchiveBot som de er per 24. jan. 2021. De er kopieret fra IABot-interfacet ved at vælge "Konfigurer bot" under menupunktet "Start/stop af bot m.m.":

Links to scan:

All external links on an article
  • Only links within references

Scanned links to modify:

All links
Only tagged dead links
  • All dead links

Pages to scan:

  • Scan all mainspace pages
Scan only pages containing dead link tags

Archive versions:

Use newest archives (applies to newly searched archives)
  • Use archives closest to the access date (applies to newly searched archives)

Modify existing archives:

  • Nej
Ja

Leave talk page messages:

  • Nej
Ja

Default used date formats:

@default: %e. %B %Y

Opt-out tags:

{{Cbignore}}


Scan for dead links:

Nej
  • Ja

Submit live links to the Wayback Machine:

Nej
  • Ja

Convert archives to long-form format:

Nej
  • Ja

Normalize archive URL encoding:

  • Nej
Ja

Convert plain links to cite templates:

Nej
  • Ja

Edit rate limit

20 per day

Edit summary:

Oprettede eller redigerede {linksrescued} arkivlinks ud af {linksanalyzed} analyserede, se hjælp

For dem der ikke har adgang til dette interface (man logger ind med det samme brugernavn som her på wikipedia, men skal normalt være Administrator her for at se indstillingerne), kan alle indstillinger ses her. Udgangspunktet var indstillingerne den 24. nov. 2020. Senest er det blevet muligt at indstille bottens maksimale antal redigeringer per dag. Dette tal er sat til kun 20, så der er en chance for st kontrollere botten her i starten. Måske har andre wikipedianere, fx nogle af de oprindelige initiativtagere MGA73, Metalindustrien A/S og Santac, lyst til at tage over nu.--Weblars (diskussion) 25. jan 2021, 16:26 (CET)