ジャバ/単語文書中の単語数を数える


マイクロソフトWordが自動的に単語やページ、段落や文字の数をカウントするときにスペースを使用するか、空白の場合.この記事では、無料Java APIを使用して既存のWord文書内の単語や文字の数をプログラムでカウントする方法を学びます.

フリーAPIのインポート依存性
方法1 : free API (Free Spire.Doc for Java)をダウンロードして解凍します.その後、尖塔を追加します.doc.Javaファイルに依存するjarファイル.
方法2 : MavenプロジェクトにJAR依存を追加するには、POMに次の構成を追加します.XML
<repositories>
   <repository>
      <id>com.e-iceblue</id>
      <name>e-iceblue</name>
      <url>http://repo.e-iceblue.com/nexus/content/groups/public/</url>
   </repository>
</repositories>
<dependencies>
   <dependency>
      <groupId>e-iceblue</groupId>
      <artifactId>spire.doc.free</artifactId>
      <version>3.9.0</version>
   </dependency>
</dependencies>

サンプルコード
詳細な手順と完全なサンプルコードは次のとおりです.
● ドキュメントインスタンスを作成します.
● ドキュメントを使用してサンプルワードドキュメントを読み込みます.loadFromfile ()メソッド.
● ドキュメントを使用して単語の数をカウントします.getBuiltinDocumentProperties ()も参照ください.getwordcount ()メソッド.
● ドキュメントを使用して空白のない文字数をカウントします.getBuiltinDocumentProperties ()も参照ください.getcharcount ()メソッド.
● ドキュメントを使用してスペースを持つ文字数をカウントします.getBuiltinDocumentProperties ()も参照ください.getcharcount ()メソッド.
import com.spire.doc.*;

public class countWordsNumber {
    public static void main(String[] args) {
        //Create a Document instance
        Document document = new Document();

        //Load a sample Word document
        document.loadFromFile("Input 1.docx");

        //Count the number of words
        System.out.println("WordCount: " + document.getBuiltinDocumentProperties().getWordCount());

        //Count the number of characters without spaces
        System.out.println("CharCount: " + document.getBuiltinDocumentProperties().getCharCount());

        //Count the number of characters with spaces
        System.out.println("CharCountWithSpace: " + document.getBuiltinDocumentProperties().getCharCountWithSpace());
    }
}