python学習の道:複数のexcelファイルをマージし、複数のpdfファイルをマージする

4711 ワード

**キー:
  • pythonのosモジュール
  • pythonのpandasのconcat
  • pythonのPyPDF 2モジュール**
  • 1、複数のExcelファイルをマージする
    import os
    import pandas as pd
    
    file_dir = r'C:\Users\liujunke\Desktop\python_test\9. just_test\many_excel'
    data=pd.DataFrame()
    df = pd.DataFrame()
    for root,dirs,files in os.walk(file_dir): #files     many_excel       excel 
        for name in files:
            df = pd.read_excel(str('many_excel/'+ name),header=5) #  files  excel ,     df
            data = pd.concat([data,df]) #        excel
            df = pd.DataFrame()
    data.to_excel('        excel  .xlsx')
    

    2、複数のpdfファイルをマージする
    import os
    import PyPDF2
    
    file_dir = r'C:\Users\liujunke\Desktop\python_test\9. just_test\many_pdf'
    filenames = []
    for root,dirs,files in os.walk(file_dir): #  man_pdf       pdf   
        pass
    
    filenames = files  
    
    merger = PyPDF2.PdfFileMerger() #         
    for filename in filenames: 
        merger.append(PyPDF2.PdfFileReader(str('many_pdf/' + filename))) #      pdf  
        
    merger.write('         .pdf')  #   pdf