Wikipedia:Landsbybrønden/Tjek indhold af Wikidata imod FD

Fra Wikipedia, den frie encyklopædi
Spring til navigation Spring til søgning

Tjek indhold af Wikidata imod FD[redigér wikikode]

Jeg har fået lavet en SPARQL forespørgsel, som kan tjekke om alle artikler er med i en Født i år eller Døde i år kategori, som linkes til i alle de berørte kategorier, som er efter "år 0". I de berørt kategorier er der et link Tjek sync med wikidata, som kalder forespørgslen. Der er både link til Wikidata og den danske Wikipedia i uddata.

Baggrunden er kategorier for født- og evt. dødsår ikke altid bliver sat korrekt. Jeg har holdt øje med det med denne rapport, som har opdelt i 2 for fødsels- og dødsår. Det har været svært at følge med de rapporter, da det er også er svært at opdatere dem så hyppigt som ønsket og specielt database-dump fra Wikidata er meget tung pga. størrelse, som medfører både lang tid til download og håndtering af data. Med de SPARQL forespørgsler så er output stort set nu og her data.

Jeg har været igennem de fleste år fra 1800 og derefter for Døde i år. Der har jeg observeret er der fejl i data i både på danske Wikipedia og Wikidata. På Wikipedia er det fra at skabelon {{FD}} ikke er blevet forsynet med rette årstal til at de kilder, som har været brugt til artiklen, har et andet bud på datoer end nyere oplysninger og til at oplysninger er meget usikker. Så det er en god ide at tjekke grundig hvad for nogle år/datoer man skal bruge. Og i Salmonsen har jeg fundet en del fejl... Lad være at rettet noget, hvis du er i tvivl. Og Wikidata er alene ikke kilde til oplysninger!

På Wikidata er det fra hærværk (nemt at ændre tilbage igen) til diverse fejloplysninger. Det er altid en god ide at tjekke referencerne. Og hvis det er fejl i referencer, så nedgradere udsavnet i stedet for at slette. Hvis man sletter, så sker det regelmæssigt at en bot genindsætter den fejlagtige oplysning. Og specielt data fra LOC har en del fejl, som skal rettes op på. De har været ramt af de brugte data med fejl fra Wikidata, som senere er blevet rettet. Og de kan finde de oplysninger, som de skal have rettet, ved at de søger på de nedgraderet oplysninger. Ellers sletter jeg kun udsagn med født/død-dato, hvis kilden til en oplysning i Wikidata, har rettet det til noget andet. Og hvis der både er dato og årstal, så opgradere jeg dato, så det bliver netop den, som bliver vist i rapport/infobokse. Men for meste er de angivet datoer i Wikidata i orden.

Teknisk er det blevet synlig og tilgængelige i kategorierne ved at {{fødtår}} og {{dødår}} har fået tilføjet hhv. {{Tjk sync wd kategori for født}} og {{Tjk sync wd kategori for døde}}. Her er indlejret en SPARQL som bruger hhv. fødselsdato (P569) og dødsdato (P570) og tjekker om artiklerne er med i den berørt kategori via et API-kald. Det kan ikke bruges til at tjekke om indhold i kategori er Wikidata - det skal en anden forespørgsel til det. Jeg må også give tak til Kartebolle (Dipsacus fullonum), som hjalp med at få forespørgslen på plads.

Jeg har nogle eksempler på problemer:

  • Hans Ingi Hedemark - det er svært han er død i 1930 eller 1940. Det er et problem med kunstnere (skuespillere fx) og sportsfolk, som har været aktiv en kort periode, hvorefter der ikke er registret noget efterfølgende.
  • I Kategori:Døde i 1943 er registret en del, som er faldet i kamp, men hvor artiklerne er blevet sammenskrevet. En løsning kunne være at tilføje kategorier som fx sket med Ida From.
  • Ferdinand von Wrangel er født i 1796 efter den julianske kalender og 1797 efter den gregorianske kalender...

Eller håber jeg at andre hjælpe med, at løbende at tjekke oplysningerne. For der er et løbende arbejde med at tjekke og rette oplysninger. --Steen Th (diskussion) 2. dec 2020, 16:14 (CET)