思いつきでやったデータ分析で気づきを得られた話

6705 ワード

データ分析 mecab mecab テキストリンク

突如始まった、いえらぶ Advent Calendar 2019 19日目の記事です。

発売日から愛用しているAirPods ProとマダツボミをARでコラボさせるネタを考えてたらいつの間にか投稿日が過ぎ去っていました。

つい最近、思いつきで簡易的なデータ分析をしてみたらUIUXの改善につながる気づきを得られたので、それについて書いてみようと思います。

いえらぶCLOUDとは

不動産会社をターゲットとしたクラウドサービス。物件管理はもちろん追客支援からホームページ運用、ポータルサイト掲載など、あらゆる不動産業務を効率化することができる。

賃貸管理機能とは

いえらぶCLOUDの一機能で、各種台帳管理から帳票出力、入出金管理など賃貸管理業務をサポートするシステム。

修繕/点検/クレーム対応

そんな賃貸管理機能には、日々の対応内容を記録・管理する機能があります。
管理会社にとってのステークホルダーは、家主や入居者、リフォーム業者など数多く、当然対応内容も様々です。
そこで、選択式の必須項目である「種別」について、どの項目が多く選ばれているのかを分析してみました。

種別	割合
クレーム	10.8%
修繕	25.0%
点検	1.5%
巡回	0.4%
その他	62.3%

結果から

新規登録時に初期選択状態として設定している項目は「クレーム」なのですが、実際に登録される割合としては10%程度に留まる事がわかりました。
つまり、ほとんどの場合、セレクトボックスをクリックし、値を変更するという手間を強いていることになります。
開発当初からさほど気にかけてこなかったことですが、初期選択としている項目が実は不適切（不親切）であったことがわかりました。

また、「その他」が6割以上の割合で選択されており、「点検」や「巡回」は逆にほとんど選択されていません。
必要であるべき項目が用意できていない可能性が高いです。

追加項目の検討

では一体、どんな項目が必要なのでしょうか。
実は、種別に「その他」を選択した場合、その概要を自由入力することができます。
そこで、この入力値データの一部をランダムにピックアップ、MeCabで単語単位に分割し、どんな単語が多く使われているのかを調べてみました。

参考：python 日本語の単語分割と出現頻度をカウントする

python

import csv
import MeCab
from collections import Counter

data = open('claim.csv', 'r')
tagger = MeCab.Tagger('-Ochasen')
counter = Counter()
for text in data:
    nodes = tagger.parseToNode(text)
    while nodes:
        if nodes.feature.split(',')[0] == '名詞':
            word = nodes.surface #.decode('utf-8')
            counter[word] += 1
        nodes = nodes.next

for word, cnt in counter.most_common():
    with open('result.csv', 'a', newline='') as f:
        writer = csv.writer(f)
        writer.writerow([word, cnt])

結果がこちら（上位のみ抜粋）

単語	出現回数
交換	157
清掃	107
日常	75
管理	74
連絡	68
入居	62
解約	53

最も多かったのは「交換」。
エアコンや浴室乾燥機から鍵、扉、雨戸、クロスに消化器などその対象は様々です。
「点検」は管理会社が定期的に行うものですが、家主や入居者からの連絡を受けて行う交換作業は別物としてタグ付けしたいという需要が見て取れます。

20行にも満たないコードですが、追加すべき項目の候補が容易に浮かび上がりました。

最後に

開発側の思い込みや浅はかな予想が、思いがけずユーザビリティを低下させていることもあるので、こういった実データを使った分析は積極的に行っていくべし
PDCAを迅速・フレキシブルに回すことができるのは完全内製サービスの強み

Author And Source

この問題について(思いつきでやったデータ分析で気づきを得られた話), 我々は、より多くの情報をここで見つけました https://qiita.com/suitedJK/items/a53597d180b29b890a29

著者帰属：元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。

Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .

Golang ODBCによるアクセスデータの接続

UVA 10202+HDU 1270小希の数表