1つのドキュメントで最も頻度の高い10単語(英語ドキュメント)を統計します.

253 ワード

最近rubyを学んで、あるところlinuxのフィルターに言及することを発見して、とても面白いです.例は、英語のテキストに最も多く出現する10個の単語を出力する.
次のコマンドを使用します.

cat hoge.txt | tr -s ' ' '
'| sort | uniq -c |sort -rn |head -n 10

notes:10を他の数字に変更すると、最も出力の多いn単語を実現できます.