Wikipedia:Landsbybrønden/De fleste artikler er inden for 3-4. led fra Danmark

Fra Wikipedia, den frie encyklopædi

De fleste artikler er inden for 3-4. led fra Danmark[rediger kildetekst]

Jeg har kigget, hvor godt vores artikler er forbundet. Så jeg har taget udgangspunkt i artikel Danmark og set på hvor mange artikler, der linkes til i de forskellige led:

  • 1. led - 741
  • 2. led - 29348
  • 3. led - 90547
  • 4. led - 39494
  • 5. led - 6639
  • 6. led - 943
  • 7. led - 186
  • 8. led - 46
  • 9. led - 18
  • 10. led - 7
  • 11. led - 4
  • 12. led - 3

De artikler, som ikke har forbindelse fra artikel Danmark, kan deles i:

  • Forældreløse artikler - 14576 stk. - rapport
  • Artikler uden eller kun en bedsteforældre - 2718 stk. - rapport
  • Artikler uden oldeforældre - 163 stk.
  • Flere led - 11. stk.

I antallet er artikler med en bedsteforældre, som er forbundet, ikke tal med - det er de fleste af dem. Og det er kun de større i antal tegn, som er med i de rapporter, som linkes til.

Flertydig artikler er fjernet fra opgørelsen og tæller ikke på nogen måde.

Der er størrelsen af rapporterne er begrænset. Så jeg har overvejet på længere sigt, at vi også burde indsætte skabeloner, når der ikke er links til en artikel a.la en:Template:Orphan. Det kunne få alle forældreløse artikler frem i lyset, gøre det er lettere at rydde op ved enten at give linkes eller afgør om artiklen stadig er relevant. For artikler uden artikler uden bedsteforældre er det en gruppe af artikler, som kun i bedst fald kun referer til hinanden. Rapportten med artikler uden bedsteforældre er blevet opdateret i dag, da jeg fandt et par cases, som ikke blev håndteret. --Steen Th (diskussion) 15. jan 2015, 17:09 (CET)

For en del forældreløse artikler er der det problem, at de artikler der naturligt bør linke til dem simpelthen ikke eksisterer. F.eks. en artikel om en roman, hvor der ikke er nogen artikel om forfatteren. Den vil selvfølgelig ofte kunne oprettes, men det vil nemt bare ende som en stub, i eksemplet dog nok suppleret med en liste over udgivelser. Til gengæld har en del af de forældreløse artikler interwiki-henvisninger og er således ikke helt uden familie (man kunne måske sige, at de har fætre og kusiner?). --Dannebrog Spy (diskussion) 15. jan 2015, 22:38 (CET)
For cirka fem år siden var der i en måneds tid konsensus om ikke at have en {{Forældreløs}}: Wikipedia:Anmodning om botassistance/Arkiv. Kaares spørgsmål fra den gang giver stadig mening: "Kan man ikke bare kigge på listen over Speciel:Forældreløse sider?". --Palnatoke (diskussion) 15. jan 2015, 23:31 (CET)
En anden ting: Mon ikke billedet var blevet cirka det samme, hvis du havde valgt en anden artikel at tage udgangspunkt i? --Palnatoke (diskussion) 15. jan 2015, 23:31 (CET)
Speciel:Forældreløse_sider er ubrugelig. Den viser d.d. kun 2.597 stk. ud af 14.576 stk. - den automatiske liste fanger kun 17.8 %! Bare der er et link fra en side uanset namespace, forsvinder den fra den automatiske dannet liste.. Det interessante er kun linkes imellem artikler (som her mangler) og ikke fra diskussioner, ønske- og arbejdslister mv. Men tak for linket til den gammel diskussion - den var jeg ikke opmærksom på.
Jeg kan se der er forskel imellem med interwiki (9.656 stk.) og uden (4.921 stk.) - de flest forældreløse er med interwiki-links - jeg har lagt lister op, sammen med artikler uden bedsteforældre, så i selv kan kigge med.
Man kan godt et andet startpunkt. Landeartikler er gode startpunkter og artiklen om Danmark linker til mange store artikler, og man får hurtig fat i mange. Andre artikler vil vel for de fleste forskyde det tyngdepunktet vel 1-2 led.
Min inspiration til at danne rapporten er dette post på facebook, som omtaler wikigraph.erikaarnold.com. Desværre er værktøjet ikke for den danske Wikipedia. --Steen Th (diskussion) 16. jan 2015, 09:54 (CET)
Vil bare henvise til denne mere aktuelle Wikipedia:Forældreløse artikler sorteret efter størrelse. Var det ikke en ide at vi tog et kig der og hjalp de "forældreløse" med link til dem. --Villy Fink Isaksen (diskussion) 16. jan 2015, 17:19 (CET)
Det er da ganske interessant, og umiddelbart synes jeg, at det virker positivt, at så stor en andel af vores artikler er linket så godt sammen. Kan man få lister over dem som er i 10. led eller derover? Så kunne man måske førsøge at nedbringe disse antal. Mvh. Toxophilus (diskussion) 18. jan 2015, 21:22 (CET)
Her er listen med artikler:
Lidt at arbejde med.
Noget som skal ændres er antal, som jeg har publisere i den normale rapport med forældre løse skal sættes fra 1000 og et mål er alle de artikler skal være synlig. For det vil være en evig opgave at holde den mængde nede. --Steen Th (diskussion) 18. jan 2015, 22:43 (CET)
Forstår ikke at 87. sydlige breddekreds, 88. sydlige breddekreds og 89. sydlige breddekreds er på listen de linker til Antarktis der er fuld link er der her tale om en fejl? --Villy Fink Isaksen (diskussion) 19. jan 2015, 04:30 (CET)
Åh - det er jo nok fra Danmark og ud til artiklerne og ikke omvendt som jeg lige troede. Det kunne også være interessant at kigge den anden vej. --Villy Fink Isaksen (diskussion) 19. jan 2015, 04:36 (CET)

Den omvendte rapport[rediger kildetekst]

Efter en tænkepause fandt jeg en løsning af den opgave, som Villy stillede - antal led til artikel Danmark:

Disse sider lander i en blindgyde (røds links, flertydig) - udover blinderapporten Wikipedia:Blindgydesider - rapporten er fuldstædig:

Så det var den omvendte rapport. Og nogle artikler som kan udbygges og wikificeres. --Steen Th (diskussion) 19. jan 2015, 23:06 (CET)

Dansk wikipedias diameter[rediger kildetekst]

Med ovenstående metoder (rapporter) kan dansk wikipedias diameter reduceres. (Læs om et netværks diameter her)

Jeg forestiller mig at man (Steen Th ) med jævne mellemrum laver to rapporter om forbindelse mellem en artikel og resten af dansk wikipedia. Udgangsartiklen bør være en tilfældig artikel, og det skal være forskellige artikler fra gang til gang. Evt. kan der laves flere kørsler pr. gang med forskellige tilfældige artikler, og resultatet med flest led offentliggøres. Ved rapportens offentliggørelse lægges der vægt på de længste veje fra udgangsartiklen (som ovenfor), idet vejene artikel for artikel skrives ud, fra udgangspunkt til enden. På den måde har vi mulighed for at formindske vejlængden ved at gennemgå artiklerne en for en med hensyn til ind- og udgående link.

På den måde kan vi også forbedre sammenhængen af artiklerne på dansk wikipedia, jeg skriver "også" fordi dette bare er en metode, andre metoder er at forhindre blindgyder og forældreløse artikler. --Villy Fink Isaksen (diskussion) 21. jan 2015, 16:28 (CET)

For at illustrere det er her et eksempel fra artikler der viser frem til Danmark over 6. led (uden at kende de mellemliggende artikler) : Krydstabulering -> artikel 1 -> artikel 2 -> artikel 3 -> artikel 4 -> Danmark. --Villy Fink Isaksen (diskussion) 21. jan 2015, 21:02 (CET)
Det lyder som en god ide, at bruge en tilfældig artikel som udgangspunkt, da antallet af led nok vil være meget afhængig af artiklen, og Danmark er nok en ret central artikel. Jeg har dog intet begreb om, hvor besværligt det er at generere disse lister, men det må Steenth vel kunne løfte sløret for. Toxophilus (diskussion) 22. jan 2015, 10:32 (CET)
Findes der et værktøj der viser artiklerne mellem to forbundne artikler f.eks. mellem Krydstabulering og Danmark? Peter Brodersens værktøj gør ikke. --Villy Fink Isaksen (diskussion) 22. jan 2015, 13:51 (CET)
Jeg har valgt Danmark, som udgangspunkt, da den ligger højt på listen over artikler med flest indgående artikellink. Jeg vil nok til senere kørsel frasorter artikler, som bruges i meget brugte skabeloner. Valg af en anden artikle, vil for de flest bare forskyde antal i hvert led.. da jeg ikke har automatiseret processen af rapport, tage det ca. time pr. udgangspunkt.
Alle artikler, som ikke er en del af en blindgyde eller eller en gruppe som ingen forbindelse ind i gruppen, er i den samme store mængde.
Antal led den ene eller den anden vej har ikke nogen praktisk betydning. Kunne være sjov at finde. Men at finde den længste sti i artiklerne er en stor opgave. Jeg har ikke udviklet noget til at understøtte det. Hvis man ikke har optimeringer, så ender man skal igennem alle links imellem artikler for alle artikler - det tager meget langt tid. At finde sti imellem 2 artikler, kan også være en stor udfordring - den påtager jeg mig ikke. Jeg kendte ikke Peters værktøj. Men den kan hellere ikke tage ret mange led..
Rapport dette indlæg var kun ment som information og ikke noget som skulle arbejdes meget med. Der andre ting som står på min todo-liste... --Steen Th (diskussion) 24. jan 2015, 23:51 (CET)
At måle wikipedias diameter er en langsommelig proces: Fra hver eneste artikel skal der findes den længste af de korteste veje til alle andre artikler (og diameteren er den længste af disse veje), det bliver meget tidskrævende. Men man kunne måske lave en approksimation på følgende måde fra nogle (ca. 10) tilfældige artikler måler man den længste af de korteste veje til for eksempel 1000 eller 5000 (måske er 100 nok) artikler. Dette kunne man med jævne mellemrum gøre og efterfølgende liste de længste veje op på en projekt-side, på samme måde som http://wikipedia.ter.dk/sixdegrees gør det. Ved derefter at gennemgår artikler for ind- og udgående links og tilføje de manglende links, kan wikipedias diameter gøres mindre og der skabes samtidigt en større sammenhæng mellem wikipedias artikler. --Villy Fink Isaksen (diskussion) 27. jan 2015, 13:43 (CET)

Resultat ved det nye databasedump[rediger kildetekst]

Der er kommet en ny databaserapport - det giver for antal led til artikel Danmark:

Antal af blindgydeartikler er 112. Blindgyder i 2. niveau er helt væk...

Antal led fra artikel Danmark:

  • Forældreløse artikler - 14618 stk. - rapport
  • Artikler uden bedsteforældre - 2606 stk. - rapport
  • Artikler uden oldeforældre - 151 stk.
  • Flere led - 14. stk.

Der sker positiv lidt på de fleste, men antal med forældreløse stadig går op ad.. --Steen Th (diskussion) 20. feb 2015, 15:56 (CET)

Tak, for rapporterne. Vi må opfordre alle til at tage et nap med, for at skabe link til forældreløse artikler, nok det største problem pt. hvad sammenhæng på den danske wikipedia angår. --Villy Fink Isaksen (diskussion) 2. mar 2015, 12:42 (CET)
Jeg har de seneste dage forsøgt at linke til et par forældreløse artikler hver dag, men hvis det tager noget tid, hvis ikke det bare skal være under "se også". Ikke desto mindre, er det en rigtig god ide at f styr på dem. Der er adskillige artikler sportsarrangementer, som man burde kunne binde sammen med nogle relevante info/navigation-bokse. Toxophilus (diskussion) 2. mar 2015, 13:12 (CET)
Ja, det er ikke altid let, "se også" er den nemme løsning, men kan da være relevant hvis emnerne er beslægtede. --Villy Fink Isaksen (diskussion) 2. mar 2015, 13:26 (CET)
Jeg har lagt en totalliste op på Bruger:Steenth/Forældreløse artikler fra sidste databasedump - det er url'er for ikke at påvirke Speciel:Forældreløse sider. Og der er alle kategorier med, som ikke er skjulte. Og det kunne være ide at finde flere administrative kategorier, som skal være skjulte. --Steen Th (diskussion) 3. mar 2015, 09:46 (CET)