[スパルタコード]Pythonデータ分析3週間

2143 ワード

3週目...肝心な点が来た
この間の頼りない基礎が如実に現れた.
今はもうついていけないほどだ.
どうしよう.
#第1節授業の毎週受講データ分析
川全体の駐車中、数週間後に人々は聞かなくなった.
確認できるデータを分析した.
データを読み込んで加工します.
それから棒グラフを描きます.

#2ワードクラウドの作成
2.1必要なものを全部入れておきます.
conda install -c conda-forge wordcloud
2.2過剰なパイを入れて準備する.
import numpy as np
from PIL import Image
from wordcloud import WordCloud
import matplotlib.pyplot as plt
2.3必要なテキストを読む.
text = open('./data/Sequence_01.txt')
text = text.read()
text = text.replace('\n'," ")
text

text2 = open('./data/Sequence_02.txt')
text2 = text2.read()
text2 = text2.replace('\n'," ")
text2
2.4テキストデータを整理する.
result = ""

for number in range(1,15):
    index = '{:02}'.format(number)
    filename = "Sequence_" + index + ".txt"
    text = open('./data/' + filename, 'r', encoding = 'utf-8-sig')
    result += text.read().replace("\n"," ")

import re

pattern = '[^\w\s]'
text = re.sub(pattern=pattern, repl='', string = result)
text
2.5フォントpassを使用します.
font_path = './System/Library/Fonts/Supplemental/AppleGothic.ttf'

wc = WordCloud(font_path = font_path, background_color="white")
wc.generate(text)

plt.figure(figsize=(50,50))
plt.axis("off")
plt.imshow(wc)
plt.show()
2.6テキストクラウドの基本背景画像を加えて実行する
# Generate a word cloud image
mask = np.array(Image.open('./data/sparta.png'))
wc = WordCloud(font_path=font_path, background_color="white", mask=mask)
wc.generate(text)

f = plt.figure(figsize=(50,50))
f.add_subplot(1,2, 1)
plt.imshow(mask, cmap=plt.cm.gray)
plt.title('Original Stencil', size=40)
plt.axis("off")
f.add_subplot(1,2, 2)
plt.imshow(wc, interpolation='bilinear')
plt.title('Sparta Cloud', size=40)
plt.axis("off")
plt.show()