Em um artigo anterior, cobri o procedimento para converter converter um lote de arquivos de Markdown para HTML usando Pandoc. Nesse artigo, vários arquivos HTML foram criados, mas Pandoc pode fazer muito mais. Foi chamado de "Canivete Suíço" da conversão de documentos - e com bons motivos. Não há muito que não possa fazer.
Pandoc pode converter .docx, .odt, .html, .epub, látex, docbook, etc. para estes e outros formatos, como JATS, TEI Simples, AsciiDoc e muito mais.
Sim, isso significa que o Pandoc pode converter arquivos .docx para .pdf e .html, mas você pode estar pensando: "O Word pode exportar arquivos para .pdf e .html também. Por que eu preciso de Pandoc?"
Esse é um bom ponto, mas já que o Pandoc pode converter tantos formatos, pode se tornar sua ferramenta para todas as suas tarefas de conversão. Por exemplo, muitos de nós sabem que editores de Markdown podem exportar seus arquivos de Markdown para .html. Com Pandoc, os arquivos de Markdown podem ser convertidos em outros formatos também.
Eu raramente exporto do Markdown para HTML; Eu normalmente deixo o Pandoc fazê-lo.
Convertendo formatos de arquivo com Pandoc
Aqui, vou converter arquivos de Markdown em alguns formatos diferentes. Eu faço quase toda a minha escrita usando a sintaxe de marcação, mas muitas vezes tenho que converter para outro formato: .docx arquivos são geralmente necessários para o trabalho escolar, .html para páginas da Web que eu crio - .epub para o trabalho e .pdf para panfletos e folhetos, e até mesmo um arquivo simples ocasional TEI para um projeto de humanidades digitais da universidade. Pandoc pode lidar com tudo isso e mais, facilmente.
Primeiro, você precisa instalar o Pandoc. Além disso, para criar arquivos .pdf, o látex também será necessário. O pacote que eu prefiro é Tex Live.
Nota: Se você gostaria de experimentar o Pandoc antes de instalá-lo, há uma página de try-out on-line em: [http://pandoc.org/try/]/http://pandoc.org/try/)
Instalando Pandoc e Texlive
Os usuários do Ubuntu e outras distros Debian podem digitar os seguintes comandos no terminal:
sudo apt-get update
sudo apt-get install pandoc texlive
Observe na segunda linha, você está instalando Pandoc e Texlive em um comando só. O comando apt-get não terá nenhum problema com isso, mas vá pegar um café; isso pode levar alguns minutos.
Fazendo a conversão
Uma vez que Pandoc e Texlive estão instalados, você pode começar a trabalhar!
O documento de amostra para este projeto será um artigo que foi publicado pela primeira vez na North American Review em dezembro de 1894, e é intitulado: "Como repelir ladrões de trem". O arquivo de marcação que eu estarei usando foi criado há algum tempo como parte de um projeto de restauração.
O arquivo: how_to_repel_train_robbers.md
está localizado no diretório do meu documento, em um sub-diretório chamado amostras. Aqui está o que parece em ghostwriter.
Arquivo de Markdown em GhostWriter
Eu quero criar versões .docx, .pdf e .html deste arquivo.
A primeira conversão
Vou começar a fazer uma cópia .PDF primeiro, já que passei pelo problema de instalar um pacote de látex.
No ~/Documentos/amostras/diretório
, digitei o seguinte para criar um arquivo .pdf:
pandoc -o htrtr.pdf how_to_repel_train_robbers.md
O comando acima criará um arquivo chamado htrtr.pdf
do arquivo how_to_repel_train_robbers.md
. A razão pela qual eu usei o htrtr
como um nome era que é menor que how_to_repel_train_robbers
- htrtr
é a primeira letra de cada palavra no título longo.
Aqui está um instantâneo do arquivo .pdf depois de ser feito:
*Arquivo PDF convertido visto no Ocular
A segunda conversão
Em seguida, quero criar um arquivo .docx. O comando é quase idêntico ao que eu usei para criar o .pdf e é:
pandoc -o htrtr.docx how_to_repel_train_robbers.md
Na hora, um arquivo .docx é criado. Aqui está o que parece no Libre Writer:
Arquivo docx convertido sendo visualizado no Libre Writer
A terceira conversão
Eu posso desejar postar isso na web, então uma página da Web seria legal. Vou criar um arquivo .html com este comando:
pandoc -o htrtr.html how_to_repel_train_robbers.md
Mais uma vez, o comando para criá-lo é muito parecido com as duas últimas conversões. Aqui está como o arquivo .html aparece em um navegador:
Arquivo HTML convertido sendo visualizado no Firefox
Ficou faltando algo?
Vamos olhar para os comandos anteriores novamente. Eles eram:
pandoc -o htrtr.pdf how_to_repel_train_robbers.md pandoc -o htrtr.docx how_to_repel_train_robbers.md pandoc -o htrtr.html how_to_repel_train_robbers.md
A única coisa diferente sobre esses três comandos é a extensão ao lado de htrtr
. Isso lhe dá uma sugestão de que Pandoc depende da extensão do nome do arquivo de saída que você fornece.
Conclusão
Pandoc pode fazer muito mais do que as três pequenas conversões feitas aqui. Se você escrever com um formato preferido, mas precisa converter o arquivo para outro formato, as chances são grandes de o Pandoc poder fazer isso por você.
O que você pode fazer com isso? Você automatizaria isso? E se você tivesse um site com artigos para seus leitores baixar? Você pode modificar esses pequenos comandos para funcionar como um script e seus leitores podem decidir qual formato eles gostariam. Você poderia oferecer .docx, .pdf, .odt, .epub ou mais. Seus leitores escolhem, o script de conversão adequado é executado e seus leitores baixam o arquivo. Pode ser feito.
Via itsfoss.com. Você pode conferir o post original em inglês:
How to Convert File Formats With Pandoc in Linux [Quick Guide]Última atualização deste artigo: 26 de june de 2021