Wikisource:Café dos novatos: diferenças entre revisões

Conteúdo apagado Conteúdo adicionado
Ozymandias (discussão | contribs)
Linha 87:
 
::{{ping|Ozymandias}} Muito obrigado pela resposta! Você poderia elaborar um pouquinho sobre a camada OCR? O Archive.org [https://archive.org/stream/nheengatu/stradelli_1929_vocabularios_djvu.txt tem uma seção com o livro] em ''plaintext'', é disso que se refere? Ou é algo "dentro" do pdf? --[[Utilizador:Luk3|Luk3]] ([[Utilizador Discussão:Luk3|discussão]]) 19h05min de 1 de julho de 2020 (UTC)
 
:::{{ping|Luk3}}: a camada OCR é uma camada de texto embarcado em arquivos pdf e afins, permitindo a busca por texto e também, ao disponibilizar na Wikisource nas galerias, baixar automaticamente o texto (sem precisar redigitar tudo). Por exemplo, se clicar em [[Página:Fausto Traduzido por Agostinho Dornellas 1867.djvu/287]] verá que é uma página que não foi criada ainda, mas já tem o texto OCR para editar. Em geral os arquivos do Archive.org já possuem esta camada, mas em alguns casos pode ser necessário tratar um arquivo PDF para obter o OCR. Alguns editores aqui ainda preferem que, ao invés de subir o pdf ao commons, [[c:Help:Converting PDF to DjVu|se converta o pdf para djvu]] para facilitar alguns trabalhos de edição. Existem algumas ferramentas para tudo isto, pagas e não-pagas, como por exemplo o [http://www.djvu.org/any2djvu/ Any2Djvu]. Qualquer dúvida estou ao dispor. [[Utilizador:Ozymandias|Ozymandias]] ([[Utilizador Discussão:Ozymandias|discussão]]) 19h19min de 1 de julho de 2020 (UTC)