h 2データファイル解析


h 2データベースを使用すると、データファイルがクエリされません.
しかし、データが役に立つのは、データファイルを見つけるだけです.
name.mv.dbデータファイル
sina.trace.dbログファイル
 
package org.apache.commons.selenium.data;

import java.io.FileInputStream;
import java.util.Set;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.apache.commons.io.IOUtils;
import org.hsqldb.lib.HashSet;

public class Class1 {

	public static void main(String[] args) throws Exception {

		// String pattern = " +(.*)+ ";

		/*
		 * String pattern = " +([^  ]*)+ ";
		 * 
		 * String target = "      ,   22    ,   eei   ";
		 */

		String regex1 = "[a-zA-Z]+[a-zA-Z0-9_]*@[a-zA-Z0-9]+[.][a-zA-Z0-9]+";

		String pattern = "Z+([^Z]*)+VT ";

		String target = "[email protected]    [email protected] ";
		// String target = "adsdsfZ1111VT    asfZ222VT ";
		target = IOUtils.toString(new FileInputStream(
				"E:\\test\\db\\sina.mv.db"));
		// Pattern p = Pattern.compile(pattern);
		Pattern p = Pattern.compile(regex1);
		Matcher m = p.matcher(target);

		Set<String> set = new java.util.HashSet<String>();
		int i = 0;
		while (m.find()) {
			i++;
			String source = m.group();
			source = source.substring(2, source.length());
			if (source.contains("com")) {
				String[] mails = source.split("\\.com");
				if (mails != null && mails.length == 2) {
					String mail = mails[0] + ".com";
					String pwd = mails[1];

					pwd = pwd.substring(1, pwd.length() - 2);
					set.add(mail + "----" + pwd);
					System.out.println(mail + "----" + pwd);
				}

			} else {
				String[] mails = source.split("\\.net");
				if (mails != null && mails.length == 2) {
					String mail = mails[0] + ".net";
					String pwd = mails[1];
					pwd = pwd.substring(1, pwd.length() - 2);
					set.add(mail + "----" + pwd);
					System.out.println(mail + "----" + pwd);
				}

			}
			// set.add(source);
			// set.add(source.substring(1, source.length()));
			// System.out.println(source);

		}

		//System.out.println(i);
		System.out.println(set.size());

		// System.out.println(set);
		// System.out.println("[email protected]".substring(2,
		// "[email protected]".length()));
	}

}