python版小説分割変換器|#python
この間簡単なことを書きました.
TXT 2 HTML小説変換器HTA版、今pythonを持ってもう一度実現して、自動的に章節によって複数のHTMLファイルに分割して、そしてディレクトリを創立して、読みやすいです.
効果図:
スクリプトコード:
その中の
参照
source_path='f:\傭兵天下txt'
TXT小説の経路に修正し、状況に応じて、章のタイトルにマッチする正則を少し修正します.
参照
section_re = re.compile(r'^s*第.+ボリュームs+.*$')
できます.スクリプトは、小説が存在するディレクトリに「ファイル名_html」のフォルダを生成し、切断されたファイルを格納します.
pythonに触れたばかりで、書くコードが簡単ではないような気がします.改善してください.
TXT 2 HTML小説変換器HTA版、今pythonを持ってもう一度実現して、自動的に章節によって複数のHTMLファイルに分割して、そしてディレクトリを創立して、読みやすいです.
効果図:
スクリプトコード:
# encoding: gbk
#
# txt HTML
#
# @author : GreatGhoul
# @email : [email protected]
# @blog : http://greatghoul.iteye.com
import re
import os
# regex for the section title
# sec_re = re.compile(r' .+ \s+.+\s+ .+ \s+.+')
# txt book's path.
source_path = 'f:\\ .txt'
path_pieces = os.path.split(source_path)
novel_title = re.sub(r'(\..*$)|($)', '', path_pieces[1])
target_path = '%s%s_html' % (path_pieces[0], novel_title)
section_re = re.compile(r'^\s* .+ \s+.*$')
section_head = '''
<html>
<head>
<meta http-equiv="Content-Type" content="GBK"/>
<title>%s</title>
</head>
<body style="font-family: , ;font-size:16px; margin:0;
padding: 20px; background:#FAFAD2;color:#2B4B86;text-align:center;">
<h2>%s</h2><a href="#bottom"> </a><hr/>'''
# escape xml/html
def escape_xml(code):
text = code
text = re.sub(r'<', '<', text)
text = re.sub(r'>', '>', text)
text = re.sub(r'&', '&', text)
text = re.sub(r'\t', ' ', text)
text = re.sub(r'\s', ' ', text)
return text
# entry of the script
def main():
# create the output folder
if not os.path.exists(target_path):
os.mkdir(target_path)
# open the source file
input = open(source_path, 'r')
sec_count = 0
sec_cache = []
idx_cache = []
output = open('%s\\%d.html' % (target_path, sec_count), 'w')
preface_title = '%s ' % novel_title
output.writelines([section_head % (preface_title, preface_title)])
idx_cache.append('<li><a href="%d.html">%s</a></li>'
% (sec_count, novel_title))
for line in input:
# is a chapter's title?
if line.strip() == '':
pass
elif re.match(section_re, line):
line = re.sub(r'\s+', ' ', line)
print 'converting %s...' % line
# write the section footer
sec_cache.append('<hr/><p>')
if sec_count == 0:
sec_cache.append('<a href="index.html"> </a> | ')
sec_cache.append('<a href="%d.html"> </a> | '
% (sec_count + 1))
else:
sec_cache.append('<a href="%d.html"> </a> | '
% (sec_count - 1))
sec_cache.append('<a href="index.html"> </a> | ')
sec_cache.append('<a href="%d.html"> </a> | '
% (sec_count + 1))
sec_cache.append('<a name="bottom" href="#"> </a></p>')
sec_cache.append('</body></html>')
output.writelines(sec_cache)
output.flush()
output.close()
sec_cache = []
sec_count += 1
# create a new section
output = open('%s\\%d.html' % (target_path, sec_count), 'w')
output.writelines([section_head % (line, line)])
idx_cache.append('<li><a href="%d.html">%s</a></li>'
% (sec_count, line))
else:
sec_cache.append('<p style="text-align:left;">%s</p>'
% escape_xml(line))
# write rest lines
sec_cache.append('<a href="%d.html"> </a> | '
% (sec_count - 1))
sec_cache.append('<a href="index.html"> </a> | ')
sec_cache.append('<a name="bottom" href="#"> </a></p></body></html>')
output.writelines(sec_cache)
output.flush()
output.close()
sec_cache = []
# write the menu
output = open('%s\\index.html' % (target_path), 'w')
menu_head = '%s ' % novel_title
output.writelines([section_head % (menu_head, menu_head), '<ul style="text-align:left">'])
output.writelines(idx_cache)
output.writelines(['</ul><body></html>'])
output.flush()
output.close()
inx_cache = []
print 'completed. %d chapter(s) in total.' % sec_count
if __name__ == '__main__':
main()
その中の
参照
source_path='f:\傭兵天下txt'
TXT小説の経路に修正し、状況に応じて、章のタイトルにマッチする正則を少し修正します.
参照
section_re = re.compile(r'^s*第.+ボリュームs+.*$')
できます.スクリプトは、小説が存在するディレクトリに「ファイル名_html」のフォルダを生成し、切断されたファイルを格納します.
pythonに触れたばかりで、書くコードが簡単ではないような気がします.改善してください.