Wikisource Discussão:Modernização
Dicionários
editarEu sei que eu tenho dado mais palpite que ajudado, mas aqui vai alguma sugestões:
- Talvez fosse interessante um dicionário de modernização comum as versões brasileiras e portuguesas;
Tenha a impressão que no fr.ws o modernization.js usa regex; se for verdade, isso ajudaria em muito para diminuir os tamanhos dos dicionários.Regez seria legal... diminuiria consideravelmente os dicionários...
Giro720 msg 19h47min de 1 de Novembro de 2010 (UTC)
- Concordo. A maior parte das formas modernas são iguais nas duas versões.
- Que é Regez?
- -- Leoadec 20h56min de 1 de Novembro de 2010 (UTC)
- Regex* (eu escrevi errado). Dai com uma regra do tipo "\b.*orios*\b: \1ório\2" trocaria todos os provisorio, compulsorio, mandatorio por provisório, compulsório, mandatório, que são a maioria dos casos a serem corrigidos (aqueles relativos a acentuação). —o comentário precedente não foi assinado da forma habitual em wikis. Ele foi escrito por Giro720 (discussão • contrib.)
- Coloquei a sugestão dos regexes, e do dicionário comum entre as sugestões de aprimoramentos para o script.
- Nem o script original e nem o do MediaWiki oferecem suporte a regex. No caso de se conseguir oferecer suporte, pode ser preciso restringir o acesso a este tipo de regras, de modo que sejam editáveis apenas por admins, para evitar "regexes maliciosos", já que o conteúdo seria executado para todos os usuários que acessassem as páginas onde a conversão estivesse habilitada. Entre as opções estão: bloquear as páginas dos dicionários (indesejável), usar uma página do MediaWiki para guardar estas regras (seria preciso obter uma página a mais através da API do MediaWiki, talvez tornando o script levemente(?) mais lento), ou ainda incluir tais regexes de um jeito similar ao que está sendo feito para "correções tipográficas" na variável "ws_typo" do script (já que ele só é editável por admins).
- A ideia do dicionário comum é implementada no conversor do MediaWiki por meio das fallbacks: cada variante pode ter uma ou mais fallbacks que são usadas para complementar o dicionário daquela variante. Deve ser possível fazer o mesmo no script. Helder 11h54min de 3 de Novembro de 2010 (UTC)
- Feito: A versão 2.2 já permite o uso de dicionários secundários.
- Por hora, o dicionário "pt-BR" foi colocado como secundário em relação ao "pt-PT", de modo que a maior parte das regras ficará apenas neste último. Talvez alguém ache estranho que o dicionário de uma das variantes seja "principal", apesar de que não há qualquer intensão de considerar uma das variantes como mais importante do que a outra. Se acharem que isso é um problema, existe opção de manter três dicionários: um dicionário "para a ortografia comum", um "para a ortografia do Brasil" e outro "para a ortografia de Portugal". Neste caso, o dicionário comum não deveria incluir qualquer regra de conversão cujo resultado (o lado direito da regra) tenha ortografias distintas entre as variantes. Tais regras deveriam ser colocadas nos outros dois dicionários, uma com a ortografia portuguesa (no /pt-PT) e outra com a ortografia brasileira (no /pt-BR). Assim, cada variante teria o seu próprio dicionário complementar ao dicionário comum.
- Se quiserem optar por este esquema, bastará atualizar a variável
global_dic_page
onde foram definidos os nomes das páginas usadas como dicionários aqui no Wikisource. O que preferem? Helder 16h52min de 28 de Novembro de 2010 (UTC) - A título de exemplo, coloco abaixo uma tabela ilustrando a diferença entre as duas abordagens:
- Regex* (eu escrevi errado). Dai com uma regra do tipo "\b.*orios*\b: \1ório\2" trocaria todos os provisorio, compulsorio, mandatorio por provisório, compulsório, mandatório, que são a maioria dos casos a serem corrigidos (aqueles relativos a acentuação). —o comentário precedente não foi assinado da forma habitual em wikis. Ele foi escrito por Giro720 (discussão • contrib.)
Configuração atual O que será colocado nos dicionários O que o script usará efetivamente pt-PT
(principal)Específico para pt-BR
(secundário)pt-PT pt-BR actual: atual actual: atual bibliotheca: biblioteca bibliotheca: biblioteca bibliotheca: biblioteca colonias: colónias colonias: colônias colonias: colónias colonias: colônias exemplo: exemplo2 exemplo: exemplo exemplo: exemplo2 exemplo: exemplo
Configuração alternativa O que será colocado nos dicionários O que o script usará efetivamente Comum
(principal)Específico para pt-PT
(secundário)Específico para pt-BR
(secundário)pt-PT pt-BR actual: atual actual: atual bibliotheca: biblioteca bibliotheca: biblioteca bibliotheca: biblioteca colonias: colónias colonias: colônias colonias: colónias colonias: colônias exemplo: exemplo2 exemplo: exemplo2
- Cada linha ilustra um tipo de situação possível:
- Uma expressão que só precise ser modernizada para pt-BR;
- Uma expressão que seja modernizada da mesma maneira para ambas as variantes pt-BR e pt-PT (a grande maioria!);
- Uma expressão que seja modernizada de formas diferentes para pt-BR e pt-PT;
- PS: Coloquei "exemplo: exemplo2" porque não lembrei de um exemplo de "expressão que só precise ser modernizada para pt-PT". Alguem sugere algum?
- Nas duas abordagens (isto é, no uso de dois ou de três dicionários), é o script quem se encarrega de copiar "bibliotheca: biblioteca" (e demais expressões que se modernizam do mesmo jeito emtodas as variantes) do dicionário principal para o(s) dicionário(s) secundário(s). Helder 23h33min de 10 de Dezembro de 2010 (UTC)
- Também não me recordo de palavras que seriam atualizadas pela PT-1973 mas não pelo BR-1990... nessas condições, a configuração atual parece intuitiva e adequada; mas a partir do momento que se teriam que teríamos que adicionar ao dicionário, palavras que não deveriam ser alteradas no dicionário BR, a segunda opção seria mais conveniente. Giro720 msg 19h45min de 11 de Dezembro de 2010 (UTC)
- Cada linha ilustra um tipo de situação possível:
Falta de espaço
editarNo Wikisource basta habilitar o Gadget «Permite visualizar os textos com a ortografia atualizada.» e começaram a aparecer as bandeirinhas. Por sinal o texto está comprido de mais e se sobrepõe às abas «Ler» e já não consigo ver se mais alguma. Será que a resolução da tela (ecrã?) é pequena? O problema é que tenho que usar letras gordas que as muito pequenininhas custam muito a ler, mesmo com os óculos postos por cima do nariz. Cabe «Ortigrafia original» mais triângulo, Bandeira e «Ortografia brasileira (pt-BR» e Bandeira e «Ortografia portuguesa (pt-PT» (mesmo à tangente). A resolução actual é 1024 x 768, em monitores de 17 polegadas. Usando 1280x1024, sobra espaço para mais menus se fossem necessários. Experimentei esta última resolução e cabe tudo. O problema é que a letra fica tão pequena que para mim já não dá. Suponho que para ver o que acontece comigo basta experimentar no seu monitor com 1024 x 768. Sendo assim, parece-me aconselhável tentar saber para que resolução deve optimizar a apresentação das páginas, ou assegurar que tudo muda proporcionalmente. As opções que consigo imaginar são:
- Encontrar textos mais curtos (sugestões?)
- Deixar no topo do menu apenas a seta [V], em vez de mostrar também o texto e a bandeira do item actualmente seleccionado
- Deixar no topo do menu apenas a bandeira e a seta, em vez de mostrar também o texto do item actualmente seleccionado
- Mover os itens novamente para a lateral como no wikisource francês
As três últimas exigirão mais tempo para pensar em questões de compatibilidade entre as configurações que estão em uso no source e na pédia actualmente. (por isso tem sido adiada a tentativa de colocar um delas em prática...) Então é tentar a minha sugestão inicial para ver se fica bem:
- Encontrar textos mais curtos (sugestões?) Que tal retirar o «portuguesa» e o «brasileira»? A bandeira já distingue. Outra coisa, os códigos correctos são pt-PT-x-1973 e pt-BR-x-2009 (1990? Pensei que fosse a data em que se começou a escrever dessa maneira). Está nas normas dos códigos. Ficaria, então, assim, depois das bandeiras:
Ortografia pt-BR-x-2009
Ortografia pt-PT-x-1973
Creio que assim já vai caber tudo.
- Deixar no topo do menu apenas a seta [V], em vez de mostrar também o texto e a bandeira do item actualmente seleccionado não parece boa ideia. Fica-se sem saber onde se está. :-)
- Deixar no topo do menu apenas a bandeira e a seta, em vez de mostrar também o texto do item actualmente seleccionado não ficaria mal. Mais simples. Acho uma boa alternativa. A minha preferida.
- Mover os itens novamente para a lateral como no wikisource francês. Já vi como fica em Francês, mas acho a «coisa» lá no cimo, muito bem situada.
Atenciosamente,
Virgílio A. P. Machado
Vapmachado 05h38min de 30 de Novembro de 2010 (UTC)
- Tenho mais alguns comentários:
- Em termos de acessibilidade, não é boa ideia depender das bandeiras para diferenciar os itens pois leitores de tela não indicarão a diferença.
- Agora que há no menu um link para abrir a página de ajuda sobre modernização, talvez fosse preferível indicar os códigos apenas na página de documentação e deixar nos menus apenas o que é parece ser mais simples para os leitores: "Ortografia brasileira" e "Ortografia portuguesa". Ou os códigos são mais simples de entender?
- Recentemente vi que há também a opção de adotar a estratégia da commons:Template:Ls colocando uma caixa de seleção logo abaixo do título das páginas em que o script for habilitado (talvez com a bandeira do lado de fora, entre o texto da esquerda e a caixa de seleção). Helder 11h08min de 30 de Novembro de 2010 (UTC)
- Sobre os códigos: Não há acordo quanto ao que é, actualmente, ortografia portuguesa. Há quem ache que é como ainda hoje se ensina a escrever português em Portugal, Angola, Moçambique e outros (pt-PT-x-1973) e quem ache que é como se escreve nos títulos dos artigos da chamada Wikipédia em língua portuguesa (pt-BR-x-2009), mas que estão todos escritos em língua portuguesa com a ortografia brasileira (pt-BR-x-2009), desmentindo, na prática, tudo que por lá é apregoado, em contrário. Essas pessoas pretenderão talvez que ortografia portuguesa é pt-PT-x-2009 ou 2010, uma coisa que só existe na imaginação de alguns e na prática de ainda menos. O que há mais por aí é gente a defender o pt-PT-x-2009 ou 2010 escrevendo em pt-PT-x-1973. A alternativa é: «Ortografia portuguesa 1973» ou semelhante. Vapmachado 00h31min de 4 de Dezembro de 2010 (UTC)