HTML a PDF
Convierte archivos HTML (.html, .htm) — páginas web guardadas, plantillas de correo, vistas previas de diseño, exportaciones de dashboards — en un documento PDF. Elige si incluir los fondos. Los archivos se procesan en tu navegador.
HTML a PDF convierte archivos .html y .htm en un documento PDF. Saneamos el HTML (eliminando etiquetas <script> y manejadores de eventos en línea), lo renderizamos en un contenedor oculto, capturamos el resultado con html2canvas a 2× DPI, e incrustamos las páginas en un PDF usando pdf-lib. El interruptor Incluir fondos imita la convención del diálogo de impresión de tu navegador — desactivado por defecto para una salida más limpia y apta para papel.
¿Qué es HTML a PDF?
HTML — HyperText Markup Language — es la base de toda página web. Los navegadores renderizan HTML combinando el marcado con CSS para los estilos y (normalmente) JavaScript para la interactividad. Cuando guardas una página web desde tu navegador, obtienes un archivo .html que captura el marcado; cuando recibes una plantilla de correo HTML de un diseñador, eso también es un archivo .html. Los archivos HTML también los producen las exportaciones de correo de Mailchimp / SendGrid, los dashboards de aplicaciones web (Tableau, Looker), los generadores de sitios estáticos y cualquiera que escriba plantillas de correo o landings de marketing.
Convertir HTML a PDF es habitual cuando necesitas compartir la salida renderizada — una prueba de correo, una captura de dashboard, un artículo guardado, una maqueta de landing — con alguien que no va a abrirla en un navegador. Los PDFs son el formato universal para imprimir/compartir. La mayoría de las herramientas online de HTML a PDF suben tu archivo a un servidor remoto, lo cual es incómodo cuando el HTML contiene direcciones de correo, enlaces internos o diseños sin lanzar. Esta herramienta renderiza enteramente en tu navegador; el HTML nunca cruza la red.
¿Cómo funciona la conversión de HTML en el navegador?
Pikowl lee cada archivo HTML mediante la API Blob.text(), parsea el marcado con DOMParser, lo sanea (eliminando elementos <script> y manejadores de eventos en línea on* — el JavaScript nunca se ejecuta), y lo renderiza dentro de un contenedor oculto con estilos. html2canvas captura el DOM renderizado como una imagen a 2× DPI, troceada en fragmentos del alto de página e incrustada en un PDF usando pdf-lib. El CSS en línea — etiquetas <style> y atributos style="..." — se preserva. Los recursos externos (imágenes alojadas en CDN, fuentes web) solo cargan si son del mismo origen o usan cabeceras CORS habilitadas.
¿Es seguro convertir archivos HTML no confiables aquí?
Sí. Eliminamos las etiquetas <script> y los manejadores de eventos en línea (onclick, onload, etc.) antes de renderizar, así que el JavaScript dentro del HTML nunca se ejecuta — incluso si arrastras un archivo malicioso. Las URLs javascript: en atributos href también se eliminan. El CSS estándar, incluyendo hojas de estilos externas y fuentes web, se preserva (esos cargan desde sus orígenes originales, pero no se ejecuta JS en línea). El HTML se lee localmente mediante la File API, se procesa en tu navegador y el PDF vive solo en memoria hasta la descarga. Cerrar la pestaña descarta todo.
¿Y "Incluir fondos"?
Por defecto, los colores e imágenes de fondo de página no se renderizan en el PDF — la salida usa un fondo blanco limpio. Esto imita la convención de los diálogos de impresión del navegador (el toggle "Background graphics" de Chrome, "Print backgrounds" de Firefox) donde la opción por defecto está desactivada porque los fondos consumen tinta de impresora y oscurecen el texto en temas oscuros. Activa Incluir fondos si el diseño de tu HTML usa fondos intencionadamente — plantillas de correo, landings de marketing, dashboards con tarjetas temáticas. El toggle controla solo el fondo a nivel de página; background-color y background-image a nivel de elemento en divs individuales se renderizan siempre.
¿Cuáles son los límites y por qué?
Hasta 30 archivos HTML por conversión, 10 MB por archivo, con un aviso suave a 100 MB combinados y un tope duro a 150 MB. El número de archivos es menor que para TXT o Markdown (50) porque el renderizado de HTML es el paso más pesado de este lote — html2canvas puede tardar varios segundos por documento largo, y la rasterización produce canvas grandes en memoria. Para archivos individuales muy largos (más de ~50 páginas PDF), espera una espera notable.
¿Cómo se compara Pikowl con Smallpdf y iLovePDF para HTML?
Las diferencias sustantivas son la ubicación del procesamiento, el manejo de JavaScript, los límites de uso diario y el precio. Los números de abajo reflejan las ofertas del nivel gratuito de cada servicio en abril de 2026.
| Característica | Pikowl | Smallpdf | iLovePDF |
|---|---|---|---|
| Dónde se procesan los archivos | Tu navegador | Servidor remoto | Servidor remoto |
| Requiere registro | No | Opcional | Opcional |
| Opciones de salida | Toggle de fondos · 3 tamaños · numeración | Solo URL (sin archivos .html) | URL o .html, renderizado en servidor |
| Tamaño máx. (gratis) | 10 MB | 5 MB | 200 MB (combinado) |
| Precio | Gratis | $9/mes para ilimitado | $7/mes para premium |
Fuentes: smallpdf.com/pricing y ilovepdf.com/pricing, consultadas en abril de 2026.
Usos comunes
- Páginas web guardadas: Convierte archivos .html guardados desde el navegador de artículos o investigación en un PDF paginado y de archivo para lectura offline.
- Pruebas de plantillas de correo: Diseñadores y marketers pueden exportar una plantilla de correo HTML como prueba PDF para revisión del cliente sin reenviar el correo real.
- Exportaciones de dashboards: Las herramientas BI (Tableau, Looker, Metabase) a menudo ofrecen exportaciones HTML de dashboards — conviértelas a PDF para incluir en presentaciones de directorio.
- Maquetas de landings: Convierte la landing page de un sitio estático en un PDF para revisión de stakeholders o rondas de feedback.
- Recibos y confirmaciones de formulario: Las confirmaciones de pedido y recibos HTML guardados de formularios web se convierten en PDFs listos para adjuntos contables.
- Capturas de documentación online: Guarda una página de documentación (Stripe API docs, referencia de la consola de AWS) como PDF para referencia offline.
FAQ
¿El JavaScript del HTML se ejecuta durante la conversión?
No. Eliminamos las etiquetas <script> y los manejadores de eventos en línea (onclick, onload, etc.) antes de renderizar, así que cualquier JavaScript del archivo se elimina. Las URLs <a href="javascript:..."> también se eliminan. Esto significa que el contenido dinámico que depende de JS (por ejemplo, gráficos que se renderizan mediante Chart.js, imágenes con carga diferida) no aparecerá en el PDF. Para contenido renderizado por JS, renderiza primero la página en tu navegador y usa una herramienta de captura, o usa la opción de exportación estática de la página si está disponible.
¿Las imágenes y fuentes externas se cargarán?
Solo si los recursos son del mismo origen o se sirven con cabeceras CORS habilitadas. La mayoría de las fuentes web alojadas en CDNs (Google Fonts, Adobe Fonts) e imágenes establecen CORS, así que normalmente cargan correctamente. Los recursos del mismo dominio funcionan bien. Los recursos cross-origin sin cabeceras CORS no podrán cargarse y aparecerán en blanco en el PDF. Para garantizar que todo se cargue, incrusta las imágenes como data URIs (data:image/png;base64,...) antes de convertir.
¿Debería activar "Incluir fondos"?
Por defecto está desactivado, igual que los diálogos de impresión del navegador. Actívalo cuando el diseño del HTML use fondos a nivel de página intencionadamente — plantillas de correo temáticas, landings de marketing, dashboards en modo oscuro. Déjalo desactivado para contenido donde los fondos solo consumirían tinta de impresora (artículos, documentación, listados de código).
¿El texto en el PDF resultante es seleccionable?
No — el pipeline de html2canvas rasteriza el HTML renderizado, así que las páginas PDF resultantes son imágenes. El texto no es seleccionable, buscable ni accesible para lectores de pantalla. Este es el compromiso por la fidelidad completa de estilos. Para texto seleccionable a partir de documentos, usa TXT a PDF (entrada de texto plano) o guarda el contenido de texto del HTML por separado y conviértelo.
¿Cómo funciona la salida multipágina?
El contenido HTML largo se renderiza como un único canvas alto, y luego se trocea en fragmentos del alto de página. Cada fragmento se convierte en una página PDF. El troceo ocurre en el borde del píxel del canvas, lo que significa que el contenido puede partirse a mitad de párrafo o de imagen en el salto de página. Las reglas CSS @page y page-break-inside: avoid no se respetan — esa es una característica del motor de impresión del navegador para la que necesitaríamos una librería de renderizado distinta.
¿Los archivos HTML se suben a un servidor?
No. La conversión se ejecuta enteramente en tu navegador — abre la pestaña de red en DevTools y verás la descarga del trozo de html2canvas una vez en el primer uso, más cualquier recurso externo (imágenes, fuentes) al que el propio HTML haga referencia. El contenido del archivo HTML nunca se envía a un servidor de Pikowl.
¿Por qué el límite de número de archivos es menor que para TXT o Markdown?
El renderizado de HTML es el paso más pesado. html2canvas recorre todo el DOM, calcula los estilos de cada elemento, descarga los recursos externos y rasteriza todo en un único canvas. Para páginas complejas esto tarda varios segundos por archivo y consume memoria significativa durante el proceso. El límite de 30 archivos (frente a 50 para TXT/MD) mantiene las conversiones por lotes manejables en dispositivos móviles.
En cifras
- HTML5 se convirtió en W3C Recommendation en octubre de 2014, marcando la era moderna del formato; el HTML Living Standard de WHATWG es ahora la versión autoritativa, evolucionando continuamente.
- html2canvas (la librería de renderizado que esta herramienta usa) se descarga más de 5 millones de veces por semana desde npm, lo que la convierte en la elección de facto para conversión de DOM a imagen en el navegador en todo el ecosistema web.
- Los diálogos de impresión del navegador tienen "Gráficos de fondo" desactivado por defecto porque los fondos de página consumen tinta de impresora y oscurecen el texto — el HTML a PDF de Pikowl imita esta convención, con el toggle disponible cuando necesitas fidelidad completa de diseño.