統計ソート

1689 ワード

統計的ソートでは主にsortとuniqが用いられる
テキストは次のとおりです.

  
  
  
  
  1. ac 
  2.  
  3. bc 
  4.  
  5.  
  6.  
  7.  
  8. bc 
  9.  
  10. ac 
  11.  
  12.  
  13. bc 

 
shell面接問題では、出現頻度が高い順に50%を超える
 
 
構想
1、先sortソート
2、uniq-cの行前統計出現回数
3、出現回数によって高いから低いまでsort-rを並べ替える
 
 
統計結果
 

  
  
  
  
  1. # cat test.txt |sort |uniq -c |sort -r 
  2.       3 bc 
  3.       2 ac 
  4.       1 f 
  5.       1 d 
  6.       1 c 
  7.       1 a 

 
 
注意しなければならないのは
Uniq統計では同じ文字を一緒にしなければならない.そうしないと単独で統計されるのでsort協力が必要だ.