Java wordコンテンツ読み込み

2166 ワード

1、依存関係を追加(ネット上の多くの投稿は依存関係を書いていないので、半日探しています)
            org.apache.poi             poi             4.0.0                               org.apache.poi             poi-ooxml             4.0.0                               org.apache.poi             poi-scratchpad             4.0.0    
mavenプロジェクトではありませんここまでJARパッケージを探して、ページの中で“Files”の右側を探して“jar”がクリックしてダウンロードすることができますhttp://mvnrepository.com/artifact/org.apache.poi/poi/4.0.0
http://mvnrepository.com/artifact/org.apache.poi/poi-ooxml/4.0.0
http://mvnrepository.com/artifact/org.apache.poi/poi-scratchpad/4.0.0
2、書くツール類
package com.xxx.util;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;

import org.apache.poi.hwpf.extractor.WordExtractor;

public class DocUtil {
	/**
	 *   doc    
	 * 
	 * @param file
	 *                     
	 * @return       
	 * @throws IOException
	 */
	public static String doc2String(FileInputStream fs) throws IOException {
		StringBuilder result = new StringBuilder();
		WordExtractor re = new WordExtractor(fs);
		result.append(re.getText());
		re.close();
		return result.toString();
	}

	public static String doc2String(File file) throws IOException {
		return doc2String(new FileInputStream(file));
	}

	public static void main(String[] args) {
		File file = new File("C:\\Users\\frank.li\\Desktop\\        1.doc");
		try {
			System.out.println(doc2String(file));
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}

 
3、運行結果
Java word 内容读取_第1张图片
 
5、word内容のスクリーンショット
Java word 内容读取_第2张图片