Brugerdiskussion:Byrial/Offline rapporter

Page contents not supported in other languages.
Fra Wikipedia, den frie encyklopædi

Liste over billeder uden licensskabelon[rediger kildetekst]

Byrial kan du lave en liste over billeder på den danske Wikipedia, der ikke har angivet en licens-skabelon? Mvh Malene Thyssen 1. maj 2005 kl. 20:33 (CEST)

Ja, det kan jeg godt, men listen vil omfatte stort set alle billeder. Der er pr. 21. april:
  • 75 billeder med {{PD}}
  • 424 billeder med {{GFDL}}
  • 3529 billeder uden nogen af de 2 skabeloner (er der andre licensskabeloner i brug?)
Så hvordan bør listen sorteres for at være brugbar. Måske efter dato for redigering eller efter brugeren som lavet den? Byrial 1. maj 2005 kl. 22:51 (CEST)
Jeg har oprettet følgende skabeloner:
* Billede FairUse
* Billede GNU
* Billede IngenKilde
mvh Mark jensen 1. maj 2005 kl. 22:53 (CEST)
Mark, indsæt venligst en reference til dem på Wikipedia:Skabeloner, så de er til at finde. Hvad dækker "GNU" over? GNU-organisationen har lavet mange forskelige licenser, og vi har i forvejen GFDL for GNU Free Documentation License. Byrial 1. maj 2005 kl. 23:32 (CEST)
GNU er bare at det er frit. Men hvis vi har GFDL, redirecter jeg bare til den i stedet. Jeg indsætter skabelonerne dér med det samme. - Mark jensen 1. maj 2005 kl. 23:35 (CEST)
Pyha der ligger godt nok et stort arbejde i at sortere de billeder - men hva vi kan jo ligeså godt komme igang :-) Jeg ville gerne have en liste over de billeder jeg selv har lagt op hvis man kan bestille en sådan hos dig Byrial. Men ellers er det vel sådan set bare om at komme igang med de 3529 billeder 1 for 1. Jeg kan ikke se at det skulle lette arbejdet hvis de er sorteret - hverken efter dato eller bruger. Kan man krydsreferere med Commons og se om der ligger billeder der med en titel der er overensstemende med titlen på et billede her? Det kunne være rart at vide om et billede i forvejen ligger på Commons. Det er muligt, at der ligger billeder under nogen af creative commons-licenserne, men jeg har ikke bemærket at en sådan skabelon er blevet brugt. Mvh Malene Thyssen 1. maj 2005 kl. 23:18 (CEST)
For at se dine egne billeder kan du under "Mine bidrag", i drop-down-listen bare vælge "Billede", og trykke "OK". - Mark jensen 1. maj 2005 kl. 23:35 (CEST)
Ha! man skal lære så længe man lever :-) Det anede jeg ikke - tak for tippet Mark. Mvh Malene Thyssen 1. maj 2005 kl. 23:57 (CEST)
Man kan sagtens bestille en liste over sine billeder, og jeg kan godt sammenligne filnavnene med navnene på Commons (og håbe på at navnet ikke er ændret for tit ved flytning dertil). Jeg kan også finde ubrugte billeder (de er også på Speciel:Unusedimages) og sætte dem på en særskilt liste. De kan sikkert slettes i de fleste tilfælde. Byrial 1. maj 2005 kl. 23:41 (CEST)
Ja jeg ved jeg selv har været slem til at ændre navn på billeder jeg har fundet andre steder, men måske er vi heldige at finde billeder vi kan slette ved at sammenligne med Commons. Når nu der er sådan en funktion på "mine brugerbidrag", som Mark nævner behøver jeg ikke en liste over mine uploads :-) Ubrugte billeder er til gengæld en god ide at få listet. Mvh Malene Thyssen 1. maj 2005 kl. 23:57 (CEST)
Ææh efter opdateringen til den nye software kan man vist ikke længere filtrere sine billeduploads i brugerbidragene. Byrial vil du lave en liste til mig med mine uploadede billeder? Tidligere har jeg uploadet en del billeder jeg ikke selv har taget - både billeder jeg fandt på andre wikipediaer og billeder min familie har taget. Ingen af dem har vist anført en standardiseret licens. Mvh Malene Thyssen 13. jul 2005 kl. 09:25 (CEST)

Wikipedia:Artikler med flertydige titler som der henvises til[rediger kildetekst]

Næste gang du laver en offline rapport, kan du så på en nem måde frafiltrere henvisninger fra Wikipedia:Links til sider med flertydige titler og Wikipedia:Artikler med flertydige titler som der henvises til? Det "støjer" i listen at en pæn del af de sider der angives som potentielt problematiske, rent faktisk er korrekte for de sidste 2 henvisningers vedkommende. -- Bruger:Wegge 12. maj 2005 kl. 23:06 (CEST)

De er allerede frasorteret hvis jeg har forstået spørgsmålet korrekt. Der er kun brugt henvisninger internt i artikelnavnerummet til rapporterne. Hvis jeg har misforstået dig, må du gerne uddybe spørgsmålet. Byrial 12. maj 2005 kl. 23:18 (CEST)
Tag den nederste henvisning på Wikipedia:Links til sider med flertydige titler, Mol. Den er listet med 2 henvisninger, men de eneste Speciel:Whatlinkshere&target=Mol henvisninger er til ovennævnte sider i Wikipedia-navnerummet. Det opfatter jeg som en smule forvirrende. Det er muligt at lige præcis den henvisning er blevet rettet siden den sidste rapportkørsel, men jeg synes der er voldsomt mange henvisninger til artikler med netop 2 henvisninger. Jeg min forklaring blev forståelig i denne omgang. -- Bruger:Wegge 12. maj 2005 kl. 23:23 (CEST)
De 2 henvisninger til mol kom fra enzym og kvælstofkredsløb. Da de nu er rettede, vil næste version ikke indeholde mol. Der er som sagt ingen henvisninger fra Wikipedianavnerummet (eller andre navnerum ud over artikelnavnerummet) med i optællingerne. Der er lavet mange ændringer siden 21. april som det senest tilgængelige databasedump stammer fra. Listen vil altid være mest retvisende når dumpet er nyt. Byrial 12. maj 2005 kl. 23:37 (CEST)
Jamen så er der jo ingen grund til panik. Jeg blev bare lidt mistænksom ved at se den lange liste med netop to henvisninger. Det kan forhåbentlig lære mig ikke at stille dumme spørgsmål en anden gang.

Sider uden kategori[rediger kildetekst]

Hvad med at lave en liste over sider uden en kategori tildelt? --Maitch 24. maj 2005 kl. 00:58 (CEST)

Den burde da allerede findes på Speciel:Uncategorizedpages? På den anden side er den ikke helt opdateret og viser kun 1000 sider. --Palnatoke 24. maj 2005 kl. 06:43 (CEST)
Tak fot forslaget. Jeg regner med at lave en sådan liste, og også en liste over artikler som kun har en eller flere DK5-kategorier. Jeg er i øjeblkket ved at omskrive systemet til generering af min analysedatabase fra ren SQL til et C++-program for at gøre det mere fleksibelt og hurtigt. Jeg ved endnu hvornår det er klar til at begynde at lave rapporter igen. Byrial 24. maj 2005 kl. 08:06 (CEST)
Det haster ikke, da der er nok at lave i forvejen. Kunne kategorilisten ikke blive sorteret efter artiklernes størrelse, da jeg finder det vigtigere at kategorisere de store artikler først. --Maitch 25. maj 2005 kl. 00:04 (CEST)
Jeg skal nok sortere efter størrelse ligesom med de forældreløde sider. Byrial 25. maj 2005 kl. 00:54 (CEST)

'Gamle' sider med flertydige titler[rediger kildetekst]

Jeg faldt over en flertydig side (Valnød) med den 'gamle' tekst fra før skabelonen flertydig. Kan man (du?) liste de artikler, der linker til Wikipedia:Links til sider med flertydige titler og som ikke indeholder skabelonen flertydig? Det skulle samle alle de 'gamle' flertydige, så vi kan få ændret dem. Jeg prøvede at lede manuelt, men det er en stor opgave. Mvh --Jørgen 26. maj 2005 kl. 22:58 (CEST)

Pr. 16. maj er der:
  1. 3 artikler uden flertydigskabelon der henviser til Wikipedia:Links til sider med flertydige titler: Kant, Masse, Valnød.
  2. Wikipedia:Links til sider med flertydige titler henviser til følgende artikler uden flertydigskabelon: Sfinks, Væsen, Homonym, Fur_(flertydig), Granat, Kardæsk, ', Engelsk, Græsk, Skive, Kanal, Rune. (Der er også en masse artikler med skabelonen som den ikke henviser, men det er næppe relevant).
  3. Væsen og PLC er indsat i Kategori:Flertydig uden brug af skabelon.
God fornøjelse med oprydningen. Byrial 27. maj 2005 kl. 23:52 (CEST)


Ny flertydig-skabelon[rediger kildetekst]

Hej Byrial, Det er lige blevet oprettet to skabeloner, Skabelon:harflertydig2 og Skabelon:harflertydig3. Links fra disse bør nok sorteres fra ved dannelse af Wikipedia:Artikler_med_flertydige_titler_som_der_henvises_til. De nye skabeloner giver bedre muligheder for at henvise til flerydighedssider, bl.a. uden at denne skal hedde "Navn (flertydig)". --Martin 22. jun 2005 kl. 11:32 (CEST)

Plantenavne[rediger kildetekst]

Hej Byrial!

Når plantenavnsafstemningen er slut, vil jeg meget gerne have en rapport med de berørte artikler. Hvordan man lige finder dem, er jeg ikke ganske sikker på, men det må vi kunne finde ud af. --Palnatoke 13. jul 2005 kl. 07:51 (CEST)

Forslag: En søgning efter taxobox skabelonen vil nok afdække en stor den af dem. --Martin 13. jul 2005 kl. 19:38 (CEST)
Måske, men de kan også være dyreartikler. Jeg kan ikke se en skudsikker metode at finde netop alle berørte planteartikler på, men forslag er velkomne. Det kan dog tidligst blive efter min ferie som snart genoptages. Byrial 31. jul 2005 kl. 09:13 (CEST)

Unødvendige(?) parenteser[rediger kildetekst]

Hej Byrial!

Kunne jeg få dig til at frembringe en liste over artikler med en parentes i navnet, hvor artiklen uden parentes ikke findes? --Palnatoke 16. maj 2007 kl. 13:50 (CEST)

Mener du som Wikipedia:Titler med måske overflødige parenteser? Byrial 16. maj 2007 kl. 15:24 (CEST)

Artikler med lange afsnit[rediger kildetekst]

Hej Byrial!

Kan der fremtrylles en liste over artikler med lange afsnit? Jeg tænker på noget i stil med:

  • L = artikellængde (bytes)
  • H = antal overskrifter (== ==, === === osv.) i artiklen
  • A = antal afsnit i artikler ( = H + 1)

X = L/A må så være et mål for den gennemsnitlige afsnitslængde - og en potentiel indikator for manglende wikificering. --Palnatoke 1. jun 2007, 11:28 (CEST)

Jeg har noteret det på min opgavelise. Byrial 17. jun 2007, 22:42 (CEST)

Interwikikonfluens[rediger kildetekst]

Kan der frembringes (eller har vi allerede) en liste over artikler på dawiki, som har interwiki til samme artikel på udenlandsk - altså tilfælde, hvor to af vores artikler hævder at være den samme udenlandske artikel? --Palnatoke 16. jun 2007, 08:52 (CEST)

Jeg arbejder på et webværktøj på toolserveren til at lave sådanne lister. Byrial 17. jun 2007, 22:44 (CEST)


Sammenhæng mellem artikler[rediger kildetekst]

Artikler fraregnet flertydigsider pr. 4/2 2009 fordelt efter antal indgående links fra andre artikler
Antal links Antal artikler
0 7.438
1 13.470
2 10.644
3 8.244
4 6.264
5 4.881
6 - 10 14.101
11 - 20 12.444
21 - 50 12.409
51 - 100 4.586
101 - 200 2.167
201 - 500 1.428
501 - 1.000 191
1.001 - 2.000 113
2.001 - 5.000 53
5.001 - 10.000 8
over 10.000 1

I Stilmanualen omtales i Wikipedia:Stilmanual#Links_mellem_artikler at man skal prøve at skabe sammenhæng mellem artiklerne. Her tænkes på link mellem artiklerne, både til og fra artikler, mange, tror jeg, glemmer at tænke på link til artiklen de skriver, derfor kunne de være rart med en rapport der viser noget om det.

Jeg tænker mig man kunne lave to lister der belyser det, en der viser antal links fra artikler og en der viser antal link til artikler. Som øvre grænse kunne man sætte 5 link, som nedre 1 (0 link = overforældreløse). Listerne kunne sorteres først efter antal links derefter artiklens størrelse.--Villy Fink Isaksen 21. feb 2009, 15:57 (CET)

Hej Villy. Jeg er enig i at manglende sammenhæng er et stort problem, og et af formålene med mine rapporter er netop at vise dette. Over halvdelen er samtlige artikler har 5 eller færre indgående links fra andre artikler (50.941 ud af 98.482 jf. tabellen til højre). Derfor ville en liste som du foreslår det, blive alt for stor til at være brugbar til noget. Jeg har i forvejen lister over forældreløse artikler sorteret efter størrelse og artikler uden bedsteforældre som jeg synes man skal starte med, da jeg mener at det er de grelleste tilfælde. Hvis du har andre ideer til lister som ikke bliver uoverkommeligt store, er jeg meget modtagelig, men forslaget herover er ikke praktisk. Byrial 22. feb 2009, 00:57 (CET)
Wow - jeg troede ikke problemet var så stort! --Villy Fink Isaksen 22. feb 2009, 09:27 (CET)
Ved eftertanke er jeg kommet frem til at dine undersøgelser med indgående link må kunne bruges. F.eks. en liste over de artikler der har de fleste indgående links, f.eks. 100 artikler med fleste indgående links. Disse må have krav på noget ekstra opmærksomhed med hensyn til kvalitet. --Villy Fink Isaksen 23. feb 2009, 13:45 (CET)
Jeg laver listen. Men det er ikke alle artikler med mange indgående link som er interessante. En del af dem er årstal og lign., og en del af dem bliver hovedsageligt linket fra hyppigt brugte skabeloner og ikke fra den egentlige artikeltekst. Byrial 23. feb 2009, 14:02 (CET)
Hvis du kunne holde alt andet end artikler ude ville det være godt! --Villy Fink Isaksen 23. feb 2009, 14:04 (CET)
Se Wikipedia:Artikler med flest indgående artikellink. Jeg kan i øjeblikket ikke skelne mellem links fra den egentlig artikeltekst og links fra brugte skabeloner, men jeg arbejder på sagen. Byrial 23. feb 2009, 15:02 (CET)
Fint - årstallene er vel bl.a. det arbejder på at undgå? --Villy Fink Isaksen 23. feb 2009, 15:14 (CET)
Kliker af artikler

Måske kunne det være en idé at lave lister over kliker af artikler. Her tænker jeg på en gruppe af artikler der linker til hinanden indbyrdes, men der er kun få eller ingen indgående links til gruppen (kliken) udefra den øvre artikelmasse. Jeg forestiller mig kliker som en gruppe af artikler på mellem 3 til ca. 25 artikler, de få indgående links til kliken skal være afhængig af antallet af artikler i kliken, varierende fra 1-2 indgående links ved kliker på størrrelse 3 - 5 artikler og ca 3-5 indgående links ved ca 20 - 25 artikler pr. klike. --Villy Fink Isaksen 23. feb 2009, 21:35 (CET)

På den engelske wiki fandt jeg denne (som du måske kender) en:Clique problem - i note [1] er der en henvisning til noget som jeg tror måske kan bruges til at skabe en algoritme (eller ovenikøbet måske bare kopierer). - En kommentar: de kliker jeg omtaler i mit forslag behøver ikke at være komplete kliker, altså det gør ikke noget der mangler nogle indbyrdes forbindelser i kliken. --Villy Fink Isaksen 5. mar 2009, 20:02 (CET)
Klikeproblemet drejer sig om at finde kliker i en uorienteret graf. Det er temmelig uinteressant her fordi 1) artikler og deres henvisninger udgør en orienteret graf og 2) en klike i grafteori kan have et ubegrænset antal forbindelser til resten af grafen. Desuden er problemet NP-komplet (hov, den er ikke skrevet endnu. øv), hvilket nok i praksis betyder uløselig med den regnekraft som jeg har til rådighed Wikipedias størrelse taget i betragtning. Det drejer sig her om at finde delgrafer af en vis størrelse med høj indbyrdes sammenhæng i en orienteret graf og med en lille sammenhæng med resten af grafen. Der findes måske brugbare algortimer til det, men jeg kender ikke nogen. Byrial 5. mar 2009, 20:43 (CET)
Dette er jeg enig i: "Det drejer sig her om at finde delgrafer af en vis størrelse med høj indbyrdes sammenhæng i en orienteret graf og med en lille sammenhæng med resten af grafen." - jeg må indrømme jeg kender ikke forskel på en orienteret graf og en uorienteret graf! BTW fandt jeg dette udkast til bog om netværk. http://mit.biology.au.dk/~biojmo/Galathea/NETWORK%20BOOK.pdf her omtales sårbarhed, kliker (klikethed), netværks diameter og meget mere. --Villy Fink Isaksen 5. mar 2009, 21:23 (CET)
Wikipedia udgør en orienteret graf fordi henvisningerne har en retning (fra en artikel til artikel og ikke nødvendigvis omvendt). I en uorienteret graf er der ingen retning på forbindelserne mellem knuderne. Byrial 5. mar 2009, 21:30 (CET)
Netværkets diameter, small world, Six Degrees of Kevin Bacon eller hvad det ellers hedder.

At måle den danske wikipedias “netværks diameter” er nok en uoverkommelig opgave. Men man kunne måske gøre noget andet: Med udgangspunkt fra de populæreste artikler kunne man måle hvor mange klik (knuder) der er til en række tilfældige artikler og ud fra det bestemme en tilnærmet værdi, men hvad skal det bruges til? Jo, de længste af alle de korteste sti-længder, kan bruges til at optimerer wiki med ved at forbedre knudepunkternes forbindelser til og fra andre knudepunkter, på wiki-sprog svarer det til at lave link til og fra de artikler der indgår i disse stier. Måske kunne man være så heldig at kunne udpege nogle artikler som ”flaskehalse”, hvis de optræder i mere en sti. --Villy Fink Isaksen 6. mar 2009, 12:05 (CET)

Så længe der er mange forældreløse artikler er dette med den danske wikis diameter af mindre betydning! --Villy Fink Isaksen 8. mar 2009, 00:25 (CET)
Artikler uden indgående link.

Kan vi få en liste over f.eks. de ældste eller største 500 artikler uden indgående links. Det ville være rart så bliver man fri for at søge via "Tilfældig artikel". (alternativt til mit første forslag) --Villy Fink Isaksen 10. apr 2009, 16:34 (CEST)

Villy, du kan se de største forældreløse artikler (dvs. artikler uden indgående link) på Wikipedia:Forældreløse artikler sorteret efter størrelse. Der er omkring 1500 ud af lidt 4000 artikler på listen. Byrial 10. apr 2009, 22:00 (CEST)
En Tanketorsk fra min side - ved ikke hvordan man laver sådanne - så dem kommer der nok flere af ;-) --Villy Fink Isaksen 10. apr 2009, 22:07 (CEST)

Commons-link, men intet billede[rediger kildetekst]

Kunne du lokkes til at generere en liste over artikler, der har et Commons-link, men ikke har noget billede (og der skal billedet i Commons-skabelonen naturligvis ikke tælle med)? --Palnatoke 13. mar 2009, 14:34 (CET)

Forskelle mellem iw for da og en[rediger kildetekst]

Hej Byrial! Hvis det ikke findes allerede, har du så mulighed for at lave en liste over artikler, hvor en dansk artikel eller kategori henviser til en engelsk, og hvor den engelske ikke henviser tilbage til den samme danske? --MGA73 27. mar 2009, 10:20 (CET)

Ja, det kan jeg godt lave. Det vil være oplagt at fordre en interwikibot med sådan en liste, ikke? Byrial 27. mar 2009, 11:14 (CET)
Lige præcis :-) --MGA73 27. mar 2009, 12:12 (CET)
Prøv at kigge på "http://toolserver.org/~byrial/iw.php?sub=en&domain=wiki&from=da". Listen er ikke komplet idet kun de første 5000 fundne interwiki-henvisninger undersøges. Jeg kan lave en komplet liste hvis du er tilfreds med udseendet. Byrial 27. mar 2009, 13:35 (CET)
Det ser umiddelbart ok ud. Vil lige prøve at lokke en med en iw-bot til at køre de første for at se om den kan rette dem. Hvis den kan det, så kan listen jo hurtigt blive kortere :-) --MGA73 27. mar 2009, 13:57 (CET)
Nogle af dem er nemme at udrydde, mens andre er udtryk for interwikikonflikter som skal løses manuelt (men dog bot-assisteret). Det kan være et svært og langsommeligt arbejde, specielt når konflikterne involveret sprog man overhovedet ikke forstår. Byrial 27. mar 2009, 14:07 (CET)
Det bør måske diskuteres ved brønden - rent principielt er der fx spørgsmålet om interwiki *skal* være en-til-en. --Palnatoke 27. mar 2009, 14:20 (CET)
Det skal nok snarere til meta: (hvor interwikiproblemer jævnligt diskuteres) da det ikke er en lokal dansk ting. Byrial 27. mar 2009, 14:36 (CET)
Jeg synen man skal starte med at pudse en bot på listen og lade den tage alle de ukomplicerede. Så kan vi altid se hvor meget, der er tilbage. Hvis vi smider det på brønden nu er der måske nogen, der går i gang med at rette manuelt og det er lidt spildte kræfter hvis en bot kan klare det. Det er nok også lettere at diskutere ud fra konkrete eksempler. Men bortset fra det så er jeg ret begejstret for listen. Hvis alle wikier bruger denne teknik så bør vi hurtigt kunne få iw'et hovedparten af artiklerne korrekt. Hurra! :-)
Jeg har lokket Laaknor til at kigge på det og det ser ud til at virke fint. Der er selvfølgelig problemer når det ikke er en-til-en. Du må gerne gøre listen længere. --MGA73 27. mar 2009, 23:33 (CET)

Skabeloner med forkerte parametre[rediger kildetekst]

Hej Byrial!

I artiklen Ungarsk (sprog) havde sprogboksen tidligere parameteren officielt, som var sat til værdien Ungarn - det rigtige parameter-navn er imidlertid nation, hvad jeg så ændrede til. Så er mit spørgsmål til dig: Kan man generere en liste over artikler, hvor der benyttes forkerte/uvirksomme parametre i skabeloner? Det vil naturligvis først kræve en liste over skabelonernes korrekte parametre, hvad jeg gætter på at man nogenlunde let kan skabe. --Palnatoke 28. mar 2009, 09:42 (CET)

Det er ikke noget jeg kan lave i øjeblikket fordi jeg pt. ikke har adgang til indholdet på de enkelte sider. Det vil jeg sikkert få på et tidspunkt (når jeg får taget mig sammen til at lave en parser til XML-filerne i databasedumpene), men indtil da må du finde andre metoder til at finde den type fejl. Byrial 28. mar 2009, 13:02 (CET)