PDF zu HTML
Genau wie IronPDF pixelgenaue PDF-Dateien aus HTML-Inhalten erzeugen kann, kann es auch verwendet werden, um PDF-Dokumente in HTML zu konvertieren. Durch die Verwendung der Klassen PdfDocument
und HtmlFormatOptions
haben Nutzer Zugriff auf die notwendigen Methoden zur Umwandlung von PDF in HTML und die Kontrolle darüber, wie der endgültige HTML-Inhalt formatiert wird.
5 Schritte zur Umwandlung von PDF in HTML
- PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
- string html = pdf.ToHtmlString();
- pdf.SaveAsHtml("myHtml.html");
- HtmlFormatOptions htmlformat = new HtmlFormatOptions();
-
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
Um mit der Umwandlung einer PDF-Datei in HTML zu beginnen, müssen wir zunächst die PDF-Datei, die wir konvertieren möchten, mit der
FromFile
Methode derPdfDocument
Klasse laden. Diese Methode nimmt den Dateinamen/Dateipfad, den wir ihr übergeben, und lädt ihn in unser neuesPdfDocument
-Objekt, pdf. Nun können wir einfach auf dieses Objekt verweisen, wann immer wir darauf für den Konvertierungsprozess zugreifen möchten.Als nächstes demonstrieren wir die erste Methode zur Umwandlung eines PDF-Dokuments in HTML. Diese Methode nimmt die PDF und wandelt sie in ein einfaches HTML-String-Objekt um, das dann auf der Konsole angezeigt werden kann und je nach den Bedürfnissen des Entwicklers weiter manipuliert werden kann. Die nächste Zeile demonstriert die andere Methode, mit der wir die PDF-Datei in eine HTML-Datei umwandeln, bereit für komplexere Arbeiten oder zum Teilen, im Vergleich zum einfachen HTML-String. Beide Methoden erfordern nur eine einzige Zeile, um den Umwandlungsprozess selbst durchzuführen, wodurch sie einfach und effizient zu verwenden sind.
Nun lassen Sie uns ein fortgeschritteneres Beispiel betrachten, in dem wir die
HtmlFormatOptions
-Klasse nehmen und deren Methoden verwenden, um die endgültige HTML-Ausgabe zu manipulieren und anzupassen. Mit dieser Klasse können Sie verschiedene Aspekte der HTML-Ausgabe anpassen, wie z.B. die Hintergrundfarbe, die Überschriftenfarbe (H1), die Textausrichtung der H1-Überschrift, Seitenränder und mehr. Zuerst müssen wir eine neue Instanz dieser Klasse erstellen, die wir htmlformat genannt haben.Als nächstes ändern wir die Hintergrundfarbe auf Weiß, während wir die H1-Textfarbe auf Blau setzen. Dies wird durch den Zugriff auf die
IronSoftware.Drawing.Color
-Klasse erledigt. Dann werden wir die Schriftgröße des H1 (in Pixeln angegeben) an unsere Bedürfnisse anpassen und auf 25 setzen. Die nächste Anpassung, die wir vornehmen möchten, ist die Ausrichtung des H1-Textes und diese auf zentriert einstellen. Die letzte Anpassung, die wir hier vornehmen werden, ist das Setzen der PDF-Seitenränder im HTML-Dokument (wieder in Pixeln) auf 10.Der letzte Schritt in diesem Prozess besteht darin, wie zuvor die Methode zur Umwandlung von PDF in HTML zu verwenden, wobei wir diesmal mehr Parameter übergeben haben. Der erste Punkt ist der Name und der Speicherort, an dem wir unser neu generiertes HTML-Dokument speichern möchten, genau wie zuvor. Der zweite Schritt besteht darin, ein Boolean, fullContentWidth, auf true zu setzen, wodurch der PDF-Inhalt im HTML auf volle Breite gesetzt wird. Der nächste Parameter ist der Titel für die HTML-Ausgabe, gefolgt von der abschließenden Anwendung der benutzerdefinierten Einstellung, die wir zuvor für die HTML-Ausgabe erstellt haben. Klicken Sie hier, um den Leitfaden anzusehen, einschließlich Beispielen, Beispielcode und Dateien.