データフレームの処理

4100 ワード

テキストリンク

1.2つのデータを接続する
上下に

の2つのdfを貼ります.

pd.concat([df1,df2])

def first_df():
    data = {"match_all":{}}
    sort = {"_id":{"order":"asc"}}
    body = {'from':0, 'size':10000,"query":data,"sort":sort}
    results = es.search(index='datalake_market_category_matching', body=body)
    print(len(results['hits']['hits']))

    result = results['hits']['hits']
    df = json_normalize(result)
    return df
    
df1 = first_df()
df2 = first_df()
df = pd.concat([df1,df2])
df

2.sqlのように使う

pandassql

を使用

from pandasql import sqldf

pysqldf = lambda q: sqldf(q, globals())
df2 = pysqldf("select product_no, count(*) from df group by product_no order by count(product_no) desc;")
df2

3.すべての行とすべての列を表示

pd.set_option('display.max_rows', None)

pd.set_option('display.max_columns', None)

Reference

この問題について(データフレームの処理), 我々は、より多くの情報をここで見つけました https://velog.io/@hanovator/dataframe-다루기

テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。

Collection and Share based on the CC Protocol

ホイスティンについて知りましょう.

LeetCode(178):スコアランキングRank Scores(SQL)