HTML vers PDF
Convertissez des fichiers HTML (.html, .htm) — pages web enregistrées, modèles d'email, aperçus de design, exports de tableaux de bord — en un document PDF. Choisissez d'inclure ou non les arrière-plans. Les fichiers sont traités dans votre navigateur.
HTML vers PDF convertit les fichiers .html et .htm en un document PDF. Nous assainissons le HTML (suppression des balises <script> et des gestionnaires d'événements en ligne), le rendons dans un conteneur caché, capturons le résultat avec html2canvas à 2× DPI, et intégrons les pages dans un PDF avec pdf-lib. La bascule Inclure les arrière-plans reflète la convention de la boîte de dialogue d'impression de votre navigateur — désactivée par défaut pour une sortie plus propre et adaptée au papier.
Qu'est-ce que HTML vers PDF ?
HTML — HyperText Markup Language — est la fondation de chaque page web. Les navigateurs rendent HTML en combinant le balisage avec CSS pour la stylisation et (généralement) JavaScript pour l'interactivité. Quand vous enregistrez une page web depuis votre navigateur, vous obtenez un fichier .html qui capture le balisage ; quand vous recevez un modèle d'email HTML d'un designer, c'est aussi un fichier .html. Les fichiers HTML sont aussi produits par les exports d'email Mailchimp / SendGrid, par les tableaux de bord d'applications web (Tableau, Looker), par les générateurs de sites statiques et par toute personne qui écrit des modèles d'email ou des landing pages marketing.
Convertir HTML en PDF est courant quand vous devez partager une sortie rendue — une épreuve d'email, un instantané de tableau de bord, un article enregistré, une maquette de landing page — avec quelqu'un qui ne va pas l'ouvrir dans un navigateur. Les PDFs sont le format universel d'impression/partage. La plupart des outils HTML-vers-PDF en ligne téléversent votre fichier vers un serveur distant, ce qui est gênant quand le HTML contient des adresses email, des liens internes ou des designs non publiés. Cet outil rend entièrement dans votre navigateur ; le HTML ne traverse jamais le réseau.
Comment fonctionne la conversion HTML dans le navigateur ?
Pikowl lit chaque fichier HTML via l'API Blob.text(), analyse le balisage avec DOMParser, l'assainit (suppression des éléments <script> et des gestionnaires d'événements en ligne on* — JavaScript n'est jamais exécuté), et le rend à l'intérieur d'un conteneur stylisé caché. html2canvas capture le DOM rendu comme une image à 2× DPI, découpée en morceaux de hauteur de page et intégrée dans un PDF avec pdf-lib. Le CSS en ligne — balises <style> et attributs style="..." — est préservé. Les ressources externes (images hébergées sur CDN, polices web) ne se chargent que si elles sont de même origine ou utilisent des en-têtes CORS activés.
Est-il sûr de convertir des fichiers HTML non fiables ici ?
Oui. Nous supprimons les balises <script> et les gestionnaires d'événements en ligne (onclick, onload, etc.) avant le rendu, donc le JavaScript à l'intérieur du HTML ne s'exécute jamais — même si vous glissez un fichier malveillant. Les URLs javascript: dans les attributs href sont aussi supprimées. Le CSS standard, y compris les feuilles de style externes et les polices web, est préservé (celles-ci se chargent depuis leurs origines d'origine, mais aucun JS en ligne ne s'exécute). Le HTML est lu localement via la File API, traité dans votre navigateur, et le PDF ne vit qu'en mémoire jusqu'au téléchargement. Fermer l'onglet jette tout.
Qu'en est-il de « Inclure les arrière-plans » ?
Par défaut, les couleurs d'arrière-plan de page et les images d'arrière-plan ne sont pas rendues dans le PDF — la sortie utilise un fond blanc propre. Cela reflète la convention des boîtes de dialogue d'impression du navigateur (la bascule « Graphiques d'arrière-plan » de Chrome, « Imprimer les arrière-plans » de Firefox) où le défaut est désactivé parce que les arrière-plans consomment de l'encre d'imprimante et masquent le texte sur les thèmes sombres. Activez Inclure les arrière-plans si le design de votre HTML utilise les arrière-plans intentionnellement — modèles d'email, landing pages marketing, tableaux de bord avec cartes à thème. La bascule contrôle uniquement l'arrière-plan au niveau de la page ; background-color et background-image au niveau d'un élément sur des divs individuelles sont toujours rendus.
Quelles sont les limites et pourquoi ?
Jusqu'à 30 fichiers HTML par conversion, 10 MB par fichier, avec un avertissement souple à 100 MB combinés et un plafond ferme à 150 MB. Le nombre de fichiers est plus bas que pour TXT ou Markdown (50) parce que le rendu HTML est l'étape la plus lourde de ce lot — html2canvas peut prendre plusieurs secondes par document long, et la rasterisation produit de gros canvas en mémoire. Pour de très longs fichiers uniques (plus d'environ 50 pages PDF), attendez-vous à une attente notable.
Comment Pikowl se compare-t-il à Smallpdf et iLovePDF pour HTML ?
Les différences substantielles sont l'emplacement du traitement, la gestion de JavaScript, les limites d'usage quotidien et le prix. Les chiffres ci-dessous reflètent les offres du niveau gratuit de chaque service en avril 2026.
| Caractéristique | Pikowl | Smallpdf | iLovePDF |
|---|---|---|---|
| Où les fichiers sont traités | Votre navigateur | Serveur distant | Serveur distant |
| Inscription requise | Non | Optionnel | Optionnel |
| Options de sortie | Bascule arrière-plans · 3 tailles de page · numéros de page | URL uniquement (pas de fichiers .html) | URL ou .html, rendu serveur |
| Taille max (gratuit) | 10 MB | 5 MB | 200 MB (combiné) |
| Prix | Gratuit | $9/mois pour illimité | $7/mois pour premium |
Sources : smallpdf.com/pricing et ilovepdf.com/pricing, consultés en avril 2026.
Utilisations courantes
- Pages web enregistrées : Convertissez les fichiers .html enregistrés par le navigateur d'articles ou de recherche en un PDF paginé d'archive pour la lecture hors ligne.
- Épreuves de modèles d'email : Designers et marketeurs peuvent exporter un modèle d'email HTML comme épreuve PDF pour révision client sans transférer l'email réel.
- Exports de tableaux de bord : Les outils BI (Tableau, Looker, Metabase) offrent souvent des exports de tableaux de bord HTML — convertissez-les en PDF pour inclusion dans des présentations de conseil d'administration.
- Maquettes de landing page : Convertissez une landing page de site statique en PDF pour révision des parties prenantes ou cycles de feedback.
- Reçus et confirmations de formulaire : Les confirmations de commande HTML et reçus enregistrés depuis des formulaires web deviennent des PDFs prêts pour les pièces jointes comptables.
- Instantanés de documentation en ligne : Enregistrez une page de documentation (docs API Stripe, référence console AWS) en PDF pour référence hors ligne.
FAQ
Le JavaScript du HTML s'exécutera-t-il pendant la conversion ?
Non. Nous supprimons les balises <script> et les gestionnaires d'événements en ligne (onclick, onload, etc.) avant le rendu, donc tout JavaScript dans le fichier est retiré. Les URLs <a href="javascript:..."> sont aussi supprimées. Cela signifie que le contenu dynamique qui dépend de JS (par ex. graphiques rendus via Chart.js, images chargées en différé) n'apparaîtra pas dans le PDF. Pour le contenu rendu en JS, rendez d'abord la page dans votre navigateur et utilisez un outil de capture d'écran, ou utilisez l'option d'export statique de la page si disponible.
Les images et polices externes se chargeront-elles ?
Seulement si les ressources sont de même origine ou servies avec des en-têtes CORS activés. La plupart des polices web hébergées sur CDN (Google Fonts, Adobe Fonts) et des images définissent CORS, donc elles se chargent généralement correctement. Les ressources du même domaine fonctionnent bien. Les ressources cross-origin sans en-têtes CORS échoueront au chargement et apparaîtront vides dans le PDF. Pour garantir que tout se charge, intégrez les images comme data URIs (data:image/png;base64,...) avant la conversion.
Dois-je activer « Inclure les arrière-plans » ?
Le défaut est désactivé, correspondant aux boîtes de dialogue d'impression du navigateur. Activez-le quand le design du HTML utilise intentionnellement des arrière-plans au niveau de la page — modèles d'email à thème, landing pages marketing, tableaux de bord en mode sombre. Laissez-le désactivé pour le contenu où les arrière-plans ne feraient que consommer de l'encre d'imprimante (articles, documentation, listings de code).
Le texte du PDF résultant est-il sélectionnable ?
Non — le pipeline html2canvas rasterise le HTML rendu, donc les pages PDF résultantes sont des images. Le texte n'est pas sélectionnable, recherchable ou accessible aux lecteurs d'écran. C'est le compromis pour la fidélité de stylisation complète. Pour du texte sélectionnable depuis des documents, utilisez TXT vers PDF (entrée en texte brut) ou enregistrez le contenu textuel du HTML séparément et convertissez-le.
Comment fonctionne la sortie multipage ?
Le contenu HTML long est rendu comme un seul canvas haut, puis découpé en morceaux de hauteur de page. Chaque morceau devient une page PDF. Le découpage se fait à la limite de pixel du canvas, ce qui signifie que le contenu peut se diviser en milieu de paragraphe ou d'image au saut de page. Les règles CSS @page et page-break-inside: avoid ne sont pas respectées — c'est une fonctionnalité du moteur d'impression du navigateur qui nécessiterait une bibliothèque de rendu différente.
Les fichiers HTML sont-ils téléversés vers un serveur ?
Non. La conversion s'exécute entièrement dans votre navigateur — ouvrez l'onglet réseau de DevTools et vous verrez le morceau html2canvas se télécharger une seule fois à la première utilisation, plus toutes les ressources externes (images, polices) que le HTML lui-même référence. Le contenu du fichier HTML n'est jamais envoyé à un serveur Pikowl.
Pourquoi la limite du nombre de fichiers est-elle plus basse que TXT ou Markdown ?
Le rendu HTML est l'étape la plus lourde. html2canvas parcourt le DOM entier, calcule les styles pour chaque élément, télécharge les ressources externes et rasterise le tout sur un seul canvas. Pour des pages complexes cela prend plusieurs secondes par fichier et consomme une mémoire significative pendant le processus. La limite de 30 fichiers (vs 50 pour TXT/MD) maintient les conversions par lot gérables sur les appareils mobiles.
En chiffres
- HTML5 est devenu une recommandation W3C en octobre 2014, marquant l'ère moderne du format ; le HTML Living Standard du WHATWG est désormais la version faisant autorité, évoluant en continu.
- html2canvas (la bibliothèque de rendu que cet outil utilise) est téléchargée plus de 5 millions de fois par semaine depuis npm, en faisant le choix de facto pour la conversion DOM-vers-image dans le navigateur à travers l'écosystème web.
- Les boîtes de dialogue d'impression du navigateur mettent par défaut « Graphiques d'arrière-plan » sur désactivé parce que les arrière-plans de page consomment de l'encre d'imprimante et masquent le texte — le HTML vers PDF de Pikowl reflète cette convention, avec la bascule disponible quand vous avez besoin de la fidélité de design complète.