データフレームの処理
4100 ワード
1.2つのデータを接続する
上下にの2つのdfを貼ります. pd.concat([df1,df2]) pandassql を使用 pd.set_option('display.max_rows', None) pd.set_option('display.max_columns', None)
上下に
def first_df():
data = {"match_all":{}}
sort = {"_id":{"order":"asc"}}
body = {'from':0, 'size':10000,"query":data,"sort":sort}
results = es.search(index='datalake_market_category_matching', body=body)
print(len(results['hits']['hits']))
result = results['hits']['hits']
df = json_normalize(result)
return df
df1 = first_df()
df2 = first_df()
df = pd.concat([df1,df2])
df
2.sqlのように使うfrom pandasql import sqldf
pysqldf = lambda q: sqldf(q, globals())
df2 = pysqldf("select product_no, count(*) from df group by product_no order by count(product_no) desc;")
df2
3.すべての行とすべての列を表示Reference
この問題について(データフレームの処理), 我々は、より多くの情報をここで見つけました https://velog.io/@hanovator/dataframe-다루기テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol