PDFファイルに変換する


場合によっては、PDF文書からテーブルを抽出し、WordファイルまたはExcel Worksheetのいずれかでテーブルの日付を保存する必要がある状況にある場合があります.この記事では、全体のPDFドキュメントをExcelまたはWordに変換する方法を示します.
以下は入力ファイルのスクリーンショットです.
Spire.PDF for Java

spireをインストールします。PDFファイル。ジャー


Mavenプロジェクトを作成している場合は、次の設定を使用して、簡単にjarファイルを追加できます.非Mavenプロジェクトについては、 からJARファイルをダウンロードし、アプリケーションの依存関係として追加します.
<repositories>
    <repository>
        <id>com.e-iceblue</id>
        <name>e-iceblue</name>
        <url>http://repo.e-iceblue.com/nexus/content/groups/public/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId> e-iceblue </groupId>
        <artifactId>spire.pdf</artifactId>
        <version>3.8.5</version>
    </dependency>
</dependencies>

このリンク PDFに変換する


public class ConvertPdfToExcel {

    public static void main(String[] args) {

        //Create a PdfDocument instance
        PdfDocument pdf = new PdfDocument();

        //Load a PDF file
        pdf.loadFromFile("C:\\Users\\Administrator\\Desktop\\table.pdf");

        //Save as Excel file
        pdf.saveToFile("ToExcel.xlsx", FileForma.XLSX);
    }
}
出力

PDFをWordに変換します


public class ConvertPdfToWord {

    public static void main(String[] args) {

        //Create a PdfDocument instance
        PdfDocument pdf = new PdfDocument();

        //Load a PDF file
        pdf.loadFromFile("C:\\Users\\Administrator\\Desktop\\table.pdf");

        //Save as Word file
        pdf.saveToFile("ToWord.docx", FileFormat.DOCX);
    }
}
出力