Dá que pensar…

Andei a fazer umas consultas aos DUMP de Wikipédia e dá que pensar…

Percentagem dos artigos pelo numero de bytes


* 15% artigos tem menos de 500 bytes
* 36% artigos tem menos de 1000 bytes
* O intervalo com maior percentagem é o 1000 a 2000 bytes com cerca de 40% dos artigos totais
* Apesar de 3% com mais 10.000 bytes parece um bom resultados, mas não, porque a maior partes destes artigos são simples e enormes listas, são muito poucos os verdadeiros artigos


Segundo as estatísticas da wikimedia a nossa média por artigo é de 2216 bytes . 76,5% dos artigo da wikipedia tem bytes inferiores à média, menos de 2216 bytes.

Neste tablela da estatísticas da wikimedia , das 10 maior wikipedia, apenas a suéca e a polaca tem uma média de bytes inferior ànossa. Nós estamos actualmente estamos ao mesmo nível de 2004 das wiki:en de wiki:de, estamos com um atraso de 3 anos.

Apesar de tudo, do mês de Fevereiro para o de Março houve uma pequeníssima melhora, temos que pensar num processo que acelere o crescimento da qualidade dos artigos. Um das medidas será reduzir o máximo a criação de micro-artigos e desenvolver os existentes.

No último dias eu tenho estado a trabalhar nas [[Special:shortpages]], esta lista está cheia de artigos com VDA, suspeita, Pseudos-redirect, Movedic, prevenir-recriação e entre eles alguns artigos minúsculos.

Entretanto eu já resolvi o problema dos artigos com o {{prevenir-recriação}}, implementei o sistema utilizado na wiki:en do bloqueio em cascata. Assim só se deve utilizar a {{prevenir-recriação}} em imagens, para todos os outros domínios, basta colocar o artigo aqui, com este processo, mesmo com o artigo eliminado, ninguém consegue editar/criar esse artigo.

Em relação ao Pseudos-redirect, eu coloquei uma proposta para alteração do sistema, pode ser consultada aqui.

E uma coisa que ainda não consegui perceber qual a razão porque os artigo que são provado que existia VDA ficam 30 dias em quarentena, porque não eliminar logo (eliminação rápida). Outro processo complicado de resolver são as movedic e movidodic, o que fazer com estes artigos, muito deles permanecem anos, o artigo com apenas uma predef.

Ficam aqui algum pontos para reflexão…

Wikipedia bloqueia página sobre Sócrates

o artigo no Publico:

Licenciatura de José Sócrates gera polémica na Wikipédia

O artigo sobre José Sócrates da Wikipédia, a maior enciclopédia online do Mundo, teve mais de 70 versões diferentes nas últimas duas semanas. As alterações sucessivas ao perfil do primeiro-ministro dispararam após o PÚBLICO ter publicado uma investigação sobre o currículo académico do chefe do Governo, no passado dia 22 de Março.

O motivo principal para tantas versões divergentes tem que ver com o facto de, no entender de alguns editores, o primeiro-ministro dever ser apresentado como “licenciado”, enquanto outros preferem apresentá-lo apenas como “detentor de um diploma de licenciatura”.

A confusão poderia ser ainda maior se os administradores do site não tivessem entretanto decidido ordenar uma protecção excepcional daquela página, invocando a existência de “vandalismos recorrentes”. A opção tomada impede que possam participar na produção daquele artigo utilizadores anónimos.

Esta medida não foi usada nos perfis da Wikipédia de nenhum outro primeiro-ministro português.

De acordo com as estatísticas da enciclopédia on-line, existem perto de 250 mil artigos na Wikipédia portuguesa, sendo que, entre estes, apenas cerca de 450 estão protegidos.

A Wikipédia considera atitudes de “vandalismo” a “criação de artigos sem lógica ou vazios”, a “publicação de informações erradas”, “apagar dados, distorcer dados correctos ou eliminar artigos ou textos válidos”.

Discussão entre editores

A última versão do artigo sobre José Sócrates disponível ontem, ao fim do dia, na parte curricular – a que mais controvérsia tem causado -, recupera a versão de que José Sócrates é “licenciado em Engenharia Civil pela Universidade Independente”, remetendo, todavia, para três notas de rodapé.

A primeira dessas notas salienta que, “segundo o jornal PÚBLICO, há falhas no processo relativo à licenciatura de José Sócrates”; sublinha-se depois que as “dúvidas acumulam-se” com o trabalho publicado na semana seguinte pelo Expresso; e a terceira nota indica que o diploma foi “assinado num domingo”.

É ainda referido que o actual primeiro-ministro “possui um MBA em Gestão de Empresas pelo ISCTE, Lisboa, e o curso de Engenharia Sanitária para engenheiros municipais da Escola Nacional de Saúde Pública”.

No fórum de discussão sobre o perfil de José Sócrates, para além de alguns administradores justificarem os bloqueios com a divulgação de informação “difamatória”, defendeu-se que não se deveria colocar em dúvida a conclusão da licenciatura do primeiro-ministro enquanto não houver provas em contrário.

Em sentido contrário, outros ripostaram que o único dado factual, neste momento, é a posse de um diploma e não o grau de licenciado, reclamando que o primeiro-ministro, perante as notícias da comunicação social, prove que completou o curso de forma regular.

A primeira entrada sobre José Sócrates na Wikipédia portuguesa foi colocada no dia 1 de Dezembro de 2004. Desde então, até ontem, foram feitas mais de 300 alterações.

o artigo publicado na exame informática

Wikipedia bloqueia página sobre Sócrates

«Licenciado» ou «detentor de diploma de licenciatura»? As habilitações de José Sócrates estão a gerar polémica na Wikipedia, que acaba de bloquear a página do governante português.
A “entrada” relativa à biografia do primeiro-ministro português tem sido alvo de várias alterações na enciclopédia on-line, depois de conhecido o caso sobre a conclusão da licenciatura de engenharia civil na Universidade Independente.

De acordo com o Público, o artigo correspondente a José Sócrates teve 70 versões durante as últimas duas semanas.

Apesar da proliferação de versões, não foi possível chegar a um consenso: há quem advogue que o primeiro-ministro é «detentor de diploma de licenciatura» e outros que afirmam que é «licenciado». Esta última versão acabou por vingar, remetendo para notas de rodapé o imbróglio em torno de uma licenciatura obtida numa instituição onde recaem suspeitas de actos ilícitos (Universidade Independente).

Para evitar mais polémicas, os editores da Wikipedia decidiram bloquear a página de José Sócrates, impedindo qualquer alteração. Justificaram esta decisão com o facto de a página ser alvo frequente de actos de “vandalismo” e inserção de “dados incorrectos”.

Actualmente, a versão portuguesa da Wikipedia contém mais de 250 mil artigos. Cerca de 450 estão bloqueados e não podem ser alterados pela comunidade virtual.

e não duas sem três, também saiu no Diário Digital

Estatística sobre o vandalismo

Os wikipedista da Wikipédia em inglês fizeram um estudo sobre o vandalismo, pode ser consultado aqui. Ele chegaram à conclusão que 97% do vandalismo é feito por editores anónimos. ,

Obvious vandalism…83.87% (26 out of 31 cases)
Deletion vandalism…9.68% (3 out of 31)
Linkspam…6.45% (2 out of 31 cases)

Todas as conclusões foram publicadas aqui

Nós por cá, ontem acabei de bloquear todos as open proxies que estão bloquedas na wiki:en, foi uma semana dedicado em pleno nesta tarefa, onde foram mais de 10 mil proxies bloquedas. Esta foi a segunda etapa, a primeira foi em dezembro de 2006, onde tinha sido bloqueadas todas as proxies que estavam já bloqueadas no meta (foram 500 open proxies). Depois de terminar esta segunda fase eu fiz uma pequena estatística das proxy bloqueadas no wiki:pt:

Actualmente estão bloqueadas 12619 open proxies. Agora entramos de 3 fase, agora o processo é mais complicados temos de descobrir e bloquear openproxies que estão disponível e espalhadas pela internet.

8º maior

Actualmente o português é a 8º língua com mais entradas no projecto OmegaWiki, com 57%. Curiosamente é o mesmo posto que ocupa o Wikipedia lusófona no universo das Wikipedias.

Outra curiosidade é que 75% users activos na Omega são de Portugal, o contrário deve acontecer na Wikipedia…

…ahhh é verdade ia-me esquecendo, 75% corresponde a: 3 users de Portugal e 1 do Brasil. é verdade somos muito poucos.

+sysop

29 : Ozalid é eleito administrador
29 : Porantim é eleito administrador
29 : Nuno Tavares é reeleito administrador
28 : Jo Lorib é eleito administrador

isto dá que pensar, 2 dias, 4 novos sysops…

…mas o que ainda dá mais que pensar é que no mesmo espaço de tempo foram rejeitadas as candidaturas a outros 4 usuários.