HTML para PDF
Converta arquivos HTML (.html, .htm) — páginas web salvas, templates de e-mail, prévias de design, exportações de dashboard — em um documento PDF. Escolha se quer incluir fundos. Os arquivos são processados no seu navegador.
HTML para PDF converte arquivos .html e .htm em um documento PDF. Sanitizamos o HTML (removendo tags <script> e handlers de eventos inline), renderizamos em um contêiner oculto, capturamos o resultado com html2canvas a 2× DPI e embutimos as páginas em um PDF usando pdf-lib. O toggle Incluir fundos espelha a convenção do diálogo de impressão do seu navegador — desligado por padrão para uma saída mais limpa e amigável ao papel.
O que é HTML para PDF?
HTML — HyperText Markup Language — é a fundação de toda página web. Navegadores renderizam HTML combinando a marcação com CSS para estilização e (geralmente) JavaScript para interatividade. Quando você salva uma página web do seu navegador, obtém um arquivo .html que captura a marcação; quando você recebe um template de e-mail HTML de um designer, isso também é um arquivo .html. Arquivos HTML também são produzidos por exportações de e-mail Mailchimp / SendGrid, por dashboards de aplicações web (Tableau, Looker), por geradores de sites estáticos e por qualquer pessoa escrevendo templates de e-mail ou landing pages de marketing.
Converter HTML para PDF é comum quando você precisa compartilhar a saída renderizada — uma prova de e-mail, um snapshot de dashboard, um artigo salvo, um mockup de landing page — com alguém que não vai abri-lo em um navegador. PDFs são o formato universal de impressão/compartilhamento. A maioria das ferramentas online de HTML para PDF envia seu arquivo para um servidor remoto, o que é desconfortável quando o HTML contém endereços de e-mail, links internos ou designs não lançados. Esta ferramenta renderiza inteiramente no seu navegador; o HTML nunca cruza a rede.
Como funciona a conversão HTML no navegador?
O Pikowl lê cada arquivo HTML via API Blob.text(), analisa a marcação com DOMParser, sanitiza-a (removendo elementos <script> e handlers de eventos inline on* — JavaScript nunca é executado), e renderiza dentro de um contêiner estilizado oculto. O html2canvas captura o DOM renderizado como uma imagem 2× DPI, fatiada em pedaços do tamanho de página e embutida em um PDF usando pdf-lib. CSS inline — tags <style> e atributos style="..." — é preservado. Recursos externos (imagens hospedadas em CDN, fontes web) só carregam se forem da mesma origem ou usarem cabeçalhos CORS habilitados.
É seguro converter arquivos HTML não confiáveis aqui?
Sim. Removemos tags <script> e handlers de eventos inline (onclick, onload, etc.) antes de renderizar, então JavaScript dentro do HTML nunca executa — mesmo se você arrastar um arquivo malicioso. URLs javascript: em atributos href também são removidas. CSS padrão, incluindo folhas de estilo externas e fontes web, é preservado (essas carregam de suas origens originais, mas nenhum JS inline roda). O HTML é lido localmente via File API, processado no seu navegador, e o PDF existe apenas na memória até o download. Fechar a aba descarta tudo.
E quanto a "Incluir fundos"?
Por padrão, cores de fundo de página e imagens de fundo não são renderizadas no PDF — a saída usa um fundo branco limpo. Isso espelha a convenção em diálogos de impressão de navegador (toggle "Background graphics" do Chrome, "Print backgrounds" do Firefox) onde o padrão é desligado porque fundos consomem tinta de impressora e obscurecem texto em temas escuros. Habilite Incluir fundos se o design do seu HTML usa fundos intencionalmente — templates de e-mail, landing pages de marketing, dashboards com cards temáticos. O toggle controla apenas o fundo em nível de página; background-color e background-image em nível de elemento em divs individuais são sempre renderizados.
Quais são os limites e por quê?
Até 30 arquivos HTML por conversão, 10 MB por arquivo, com aviso suave em 100 MB combinados e teto rígido em 150 MB. A contagem de arquivos é menor que para TXT ou Markdown (50) porque a renderização HTML é o passo mais pesado neste lote — o html2canvas pode levar vários segundos por documento longo, e a rasterização produz canvases grandes na memória. Para arquivos únicos muito longos (acima de ~50 páginas PDF), espere uma espera perceptível.
Como o Pikowl se compara ao Smallpdf e iLovePDF para HTML?
As diferenças substanciais são o local de processamento, o tratamento de JavaScript, os limites de uso diário e o preço. Os números abaixo refletem as ofertas do nível gratuito de cada serviço em abril de 2026.
| Recurso | Pikowl | Smallpdf | iLovePDF |
|---|---|---|---|
| Onde os arquivos são processados | Seu navegador | Servidor remoto | Servidor remoto |
| Cadastro necessário | Não | Opcional | Opcional |
| Opções de saída | Toggle de fundos · 3 tamanhos de página · números de página | Apenas URL (sem arquivos .html) | URL ou .html, renderizado no servidor |
| Tamanho máx. (grátis) | 10 MB | 5 MB | 200 MB (combinado) |
| Preço | Grátis | $9/mês para ilimitado | $7/mês para premium |
Fontes: smallpdf.com/pricing e ilovepdf.com/pricing, consultadas em abril de 2026.
Usos comuns
- Páginas web salvas: Converta arquivos .html salvos pelo navegador de artigos ou pesquisa em um PDF paginado de arquivo para leitura offline.
- Provas de template de e-mail: Designers e profissionais de marketing podem exportar um template de e-mail HTML como uma prova PDF para revisão de cliente sem encaminhar o e-mail real.
- Exportações de dashboard: Ferramentas de BI (Tableau, Looker, Metabase) frequentemente oferecem exportações HTML de dashboard — converta isso para PDF para inclusão em apresentações de board.
- Mockups de landing page: Converta uma landing page de site estático em um PDF para revisão de stakeholders ou rodadas de feedback.
- Recibos e confirmações de formulário: Confirmações de pedido em HTML e recibos salvos de formulários web se tornam PDFs prontos para anexos contábeis.
- Snapshots de documentação online: Salve uma página de documentação (Stripe API docs, referência do console AWS) como PDF para referência offline.
FAQ
JavaScript no HTML rodará durante a conversão?
Não. Removemos tags <script> e handlers de eventos inline (onclick, onload, etc.) antes de renderizar, então qualquer JavaScript no arquivo é eliminado. URLs <a href="javascript:..."> também são removidas. Isso significa que conteúdo dinâmico que depende de JS (ex.: gráficos que renderizam via Chart.js, imagens com lazy load) não aparecerá no PDF. Para conteúdo renderizado por JS, renderize a página no seu navegador primeiro e use uma ferramenta de captura de tela, ou use a opção de exportação estática da página se disponível.
Imagens externas e fontes carregarão?
Apenas se os recursos forem da mesma origem ou servidos com cabeçalhos CORS habilitados. A maioria das fontes web hospedadas em CDN (Google Fonts, Adobe Fonts) e imagens definem CORS, então tipicamente carregam corretamente. Recursos do mesmo domínio funcionam bem. Recursos cross-origin sem cabeçalhos CORS falharão ao carregar e aparecerão em branco no PDF. Para garantir que tudo carregue, embuta imagens como data URIs (data:image/png;base64,...) antes de converter.
Devo ligar "Incluir fundos"?
Padrão é desligado, combinando com diálogos de impressão de navegador. Ligue quando o design do HTML usa fundos em nível de página intencionalmente — templates de e-mail temáticos, landing pages de marketing, dashboards em modo escuro. Deixe desligado para conteúdo onde fundos apenas consumiriam tinta de impressora (artigos, documentação, listagens de código).
O texto no PDF resultante é selecionável?
Não — o pipeline html2canvas rasteriza o HTML renderizado, então as páginas PDF resultantes são imagens. O texto não é selecionável, pesquisável ou acessível a leitores de tela. Esta é a contrapartida pela fidelidade total de estilo. Para texto selecionável de documentos, use TXT para PDF (entrada de texto puro) ou salve o conteúdo de texto do HTML separadamente e converta isso.
Como funciona a saída em várias páginas?
Conteúdo HTML longo é renderizado como um único canvas alto, depois fatiado em pedaços do tamanho de página. Cada pedaço se torna uma página PDF. O fatiamento acontece no limite de pixel do canvas, o que significa que conteúdo pode ser dividido no meio de um parágrafo ou imagem na quebra de página. Regras CSS @page e page-break-inside: avoid não são respeitadas — esse é um recurso do motor de impressão do navegador que precisaríamos de uma biblioteca de renderização diferente para suportar.
Os arquivos HTML são enviados para um servidor?
Não. A conversão roda inteiramente no seu navegador — abra a aba de rede do DevTools e você verá o chunk html2canvas baixado uma vez no primeiro uso, mais quaisquer recursos externos (imagens, fontes) que o próprio HTML referencia. O conteúdo do arquivo HTML nunca é enviado a um servidor Pikowl.
Por que o limite de contagem de arquivos é menor que TXT ou Markdown?
A renderização HTML é o passo mais pesado. O html2canvas percorre todo o DOM, calcula estilos para cada elemento, baixa recursos externos e rasteriza tudo em um único canvas. Para páginas complexas isso leva vários segundos por arquivo e consome memória significativa durante o processo. O limite de 30 arquivos (vs. 50 para TXT/MD) mantém as conversões em lote gerenciáveis em dispositivos móveis.
Em números
- HTML5 tornou-se uma Recomendação do W3C em outubro de 2014, marcando a era moderna do formato; o HTML Living Standard do WHATWG é agora a versão oficial, evoluindo continuamente.
- html2canvas (a biblioteca de renderização que esta ferramenta usa) é baixada mais de 5 milhões de vezes por semana do npm, tornando-se a escolha de fato para conversão DOM-para-imagem no navegador em todo o ecossistema web.
- Diálogos de impressão de navegador têm "Background graphics" desligado por padrão porque fundos de página consomem tinta de impressora e obscurecem texto — o HTML para PDF do Pikowl espelha essa convenção, com o toggle disponível quando você precisar de fidelidade total de design.