Como converter formatos de arquivo com Pandoc no Linux [Guia rápido]

26 de junho de 2021

Em um artigo anterior, cobri o procedimento para converter converter um lote de arquivos de Markdown para HTML usando Pandoc. Nesse artigo, vários arquivos HTML foram criados, mas Pandoc pode fazer muito mais. Foi chamado de "Canivete Suíço" da conversão de documentos - e com bons motivos. Não há muito que não possa fazer.

Pandoc pode converter .docx, .odt, .html, .epub, látex, docbook, etc. para estes e outros formatos, como JATS, TEI Simples, AsciiDoc e muito mais.

Sim, isso significa que o Pandoc pode converter arquivos .docx para .pdf e .html, mas você pode estar pensando: "O Word pode exportar arquivos para .pdf e .html também. Por que eu preciso de Pandoc?"

Esse é um bom ponto, mas já que o Pandoc pode converter tantos formatos, pode se tornar sua ferramenta para todas as suas tarefas de conversão. Por exemplo, muitos de nós sabem que editores de Markdown podem exportar seus arquivos de Markdown para .html. Com Pandoc, os arquivos de Markdown podem ser convertidos em outros formatos também.

Eu raramente exporto do Markdown para HTML; Eu normalmente deixo o Pandoc fazê-lo.

Convertendo formatos de arquivo com Pandoc

Pandoc Quick Guide

Aqui, vou converter arquivos de Markdown em alguns formatos diferentes. Eu faço quase toda a minha escrita usando a sintaxe de marcação, mas muitas vezes tenho que converter para outro formato: .docx arquivos são geralmente necessários para o trabalho escolar, .html para páginas da Web que eu crio - .epub para o trabalho e .pdf para panfletos e folhetos, e até mesmo um arquivo simples ocasional TEI para um projeto de humanidades digitais da universidade. Pandoc pode lidar com tudo isso e mais, facilmente.

Primeiro, você precisa instalar o Pandoc. Além disso, para criar arquivos .pdf, o látex também será necessário. O pacote que eu prefiro é Tex Live.

Nota: Se você gostaria de experimentar o Pandoc antes de instalá-lo, há uma página de try-out on-line em: [http://pandoc.org/try/]/http://pandoc.org/try/)

Instalando Pandoc e Texlive

Os usuários do Ubuntu e outras distros Debian podem digitar os seguintes comandos no terminal:

Comandos para usar no terminal

sudo apt-get update

sudo apt-get install pandoc texlive

Observe na segunda linha, você está instalando Pandoc e Texlive em um comando só. O comando apt-get não terá nenhum problema com isso, mas vá pegar um café; isso pode levar alguns minutos.

Fazendo a conversão

Uma vez que Pandoc e Texlive estão instalados, você pode começar a trabalhar!

O documento de amostra para este projeto será um artigo que foi publicado pela primeira vez na North American Review em dezembro de 1894, e é intitulado: "Como repelir ladrões de trem". O arquivo de marcação que eu estarei usando foi criado há algum tempo como parte de um projeto de restauração.

O arquivo: how_to_repel_train_robbers.md está localizado no diretório do meu documento, em um sub-diretório chamado amostras. Aqui está o que parece em ghostwriter.

Converta com Pandoc Ghostwriter

Arquivo de Markdown em GhostWriter

Eu quero criar versões .docx, .pdf e .html deste arquivo.

A primeira conversão

Vou começar a fazer uma cópia .PDF primeiro, já que passei pelo problema de instalar um pacote de látex.

No ~/Documentos/amostras/diretório, digitei o seguinte para criar um arquivo .pdf:

Comandos para usar no terminal

pandoc -o htrtr.pdf how_to_repel_train_robbers.md

O comando acima criará um arquivo chamado htrtr.pdf do arquivo how_to_repel_train_robbers.md. A razão pela qual eu usei o htrtr como um nome era que é menor que how_to_repel_train_robbers - htrtr é a primeira letra de cada palavra no título longo.

Aqui está um instantâneo do arquivo .pdf depois de ser feito:

Converta com Pandoc Ocular

*Arquivo PDF convertido visto no Ocular

A segunda conversão

Em seguida, quero criar um arquivo .docx. O comando é quase idêntico ao que eu usei para criar o .pdf e é:

Comandos para usar no terminal

pandoc -o htrtr.docx how_to_repel_train_robbers.md

Na hora, um arquivo .docx é criado. Aqui está o que parece no Libre Writer:

Converta com o Pandoc Libre Escritor

Arquivo docx convertido sendo visualizado no Libre Writer

A terceira conversão

Eu posso desejar postar isso na web, então uma página da Web seria legal. Vou criar um arquivo .html com este comando:

Comandos para usar no terminal

pandoc -o htrtr.html how_to_repel_train_robbers.md

Mais uma vez, o comando para criá-lo é muito parecido com as duas últimas conversões. Aqui está como o arquivo .html aparece em um navegador:

Converta com o Pandoc Firefox

Arquivo HTML convertido sendo visualizado no Firefox

Ficou faltando algo?

Vamos olhar para os comandos anteriores novamente. Eles eram:

Comandos para usar no terminal

pandoc -o htrtr.pdf how_to_repel_train_robbers.md pandoc -o htrtr.docx how_to_repel_train_robbers.md pandoc -o htrtr.html how_to_repel_train_robbers.md

A única coisa diferente sobre esses três comandos é a extensão ao lado de htrtr. Isso lhe dá uma sugestão de que Pandoc depende da extensão do nome do arquivo de saída que você fornece.

Conclusão

Pandoc pode fazer muito mais do que as três pequenas conversões feitas aqui. Se você escrever com um formato preferido, mas precisa converter o arquivo para outro formato, as chances são grandes de o Pandoc poder fazer isso por você.

O que você pode fazer com isso? Você automatizaria isso? E se você tivesse um site com artigos para seus leitores baixar? Você pode modificar esses pequenos comandos para funcionar como um script e seus leitores podem decidir qual formato eles gostariam. Você poderia oferecer .docx, .pdf, .odt, .epub ou mais. Seus leitores escolhem, o script de conversão adequado é executado e seus leitores baixam o arquivo. Pode ser feito.

Confira também a versão original desse post em inglês
Esse post foi originalmente publicado no site itsfoss.com. Traduzido pela rtland.team

How to Convert File Formats With Pandoc in Linux [Quick Guide]

Propaganda
Blog Comments powered by Disqus.
Propaganda