PDF轉HTML

就像IronPDF可以處理從HTML內容生成像素完美的PDF文件一樣,它也可以用於將PDF文檔轉換為HTML。 通過使用PdfDocumentHtmlFormatOptions類,使用者可以獲得將 PDF 轉換為 HTML 的必要方法,並能夠控制最終 HTML 內容的格式。

將 PDF 轉換為 HTML 的 5 個步驟

  • PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
  • string html = pdf.ToHtmlString();
  • pdf.SaveAsHtml("myHtml.html");
  • HtmlFormatOptions htmlformat = new HtmlFormatOptions();
  • pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);

    要開始將 PDF 文件轉換為 HTML,我們必須首先通過 PdfDocument 類使用 FromFile 加載我們希望轉換的 PDF。 此方法將接收我們傳遞給它的檔案名稱/檔案位置,並將其加載到我們新的PdfDocument物件pdf中。 現在,我們可以簡單地引用此對象,每當我們想要訪問它以進行轉換過程時。

    接下來,我們將演示將 PDF 文件轉換為 HTML 的第一種方法。 此方法將 PDF 轉換為簡單的 HTML 字串物件,然後可以在控制台上顯示,準備根據開發人員的需求進一步操作。 下一行演示了另一種方式,我們將 PDF 轉換為 HTML 文件,與簡單的 HTML 字串相比,更適合進行更複雜的工作或分享。 這兩種方法僅需一行就能執行轉換過程,使其易於高效使用。

    現在讓我們來看看一個更高級的範例,其中我們將使用 HtmlFormatOptions 類別及其方法來操作和自訂最終的 HTML 輸出。 使用此類別,您可以自訂 HTML 輸出的不同方面,例如背景顏色、標題 (H1) 顏色、H1 文本對齊、頁面邊距等。 首先,我們需要創建這個類的新實例,我們將其命名為htmlformat

    接下來,我們將背景顏色更改為白色,同時將 H1 文本顏色設為藍色。 這是透過訪問IronSoftware.Drawing.Color類來完成的。 然後,我們將調整 H1 的字體大小(以像素指定)以滿足我們的需求,將其設定為 25。接下來的自定義是指定 H1 的文字對齊,並將其設定為居中。 我們在此要進行的最後一項自訂設定是將 HTML 文件中的 PDF 頁面邊距(同樣以像素為單位)設為 10。

    此過程的最後一步是使用與之前相同的方法將 PDF 轉換為 HTML,但這次我們傳遞了更多的參數。 首先是我們希望儲存新生成的 HTML 文件的名稱和位置,就像之前一樣。 第二步是將布林值 fullContentWidth 設置為 true,這將會把 HTML 中的 PDF 內容設置為全寬。 下一個參數是 HTML 輸出的標題,然後最終將我們之前創建的自訂設定應用到 HTML 輸出中。 點擊這裡查看使用指南,包括範例、範例代碼和文件。