【一瞬の興味】日本人はどこの国の国民性と似ているか


米国の大統領選だったり、日本の総理大臣が新しくなったりする中で、日本人ってどんな特性なのかなっと思ったので、朝ご飯たべる前程度の時間でかるーく見てみました。というノリ

もちろん詳しくは知りませんが、hofstede insightsによる行動様式と価値観などの国民性を数値化したホフステッド指数(data hofstede)を用いて、日本人の「行動様式と価値観」がどの国と似ているのか、その他の国はどうななのか軽く把握。
階層クラスタリング(一般的(だと思っている)な"ward"法, 距離:"euclidean")で図示

データの中身は

  • These are the data as used in our books (version 2015 12 08):
    • Power distance index (PDI)
    • Individualism (IDV) 
    • Masculinity (MAS) 
    • Uncertainty avoidance index (UAI) 
    • Long-term orientation (LTO) 
    • Indulgence versus restraint (IVR) 

ランキングして、高い低いは色々あると思うが、"似ている"度合いについて

データ整備

import warnings
warnings.filterwarnings('ignore')

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from scipy.cluster.hierarchy import dendrogram, linkage

plt.style.use('seaborn-darkgrid')

# 上記webサイトからDL済データ
data_from_web = pd.read_csv('6-dimensions-for-website-2015-08-16.csv', index_col=0)

# 欠損値への処理は行わず、全データ揃っているもののみ抽出
data_from_web_all = data_from_web[data_from_web != '#NULL!'].dropna(0)
data_from_web_all.index = data_from_web_all['country']
data_from_web_all = data_from_web_all.drop('country', 1)

階層クラスタリング作成

fig, ax = plt.subplots(1, 1, figsize=(12, 15))
ax = dendrogram(linkage(data_from_web_all, method="ward", metric="euclidean"),
                labels=data_from_web_all.index, 
                orientation="left", leaf_font_size=15,
                color_threshold=100)
fig.tight_layout()
fig.show()

黒色のクラスタの中にJapan。それっぽいようなそれっぽくないような。