pythonコンビネーションデータ型(コレクション、シーケンス、辞書)およびjiebaライブラリの紹介


一、集合タイプ及び操作
1、集合タイプ定義
-               
-        ,      ,       
-        ,         

-      {}  ,       
-       {} set()
-       ,    set()

例を挙げる
A = {"python",123,("python",123)}
print(A)
B = set("pypy123")#  set()            
print(B)


しゅつりょく
{'python', 123, ('python', 123)}
{'3', 'y', '2', 'p', '1'}

2、集合間操作
1)集合オペレータ
オペレータとアプリケーション
説明
S|T
集合SとTのすべての要素を含む新しい集合を返す
S-T
集合Sに含まれるがTに含まれない要素を含む新しい集合を返す
S&T
集合SとTの要素を同時に含む新しい集合を返す
S^T
集合SとTの非同一要素を含む新しい集合を返す
S<=TまたはSTrue/Falseを返し、SとTのサブセット関係を判断する
S>=TまたはS>T
True/Falseを返し,SとTの包含関係を判断する.
2)4つの拡張オペレータ:S|=T S-=T S&=T S^=T
例を挙げる
A = {"p","y",123}
B = set("pypy123")
print(A - B)

しゅつりょく
{123}

3、集合処理方法
操作関数またはメソッド
説明
S.add(X)
xが集合Sにない場合、xはSに増加する
S.discard()
S中の要素xを除去し、xが集合S中でなければ、エラーを報告しない
S.remove()
S中の要素xを除去し、xが集合S中にない場合、KeyError異常を発生する
S.clear()
Sのすべての要素を削除
S.pop()
ランダムにSの1つの要素を返して、sを更新して、もしSが空ならば、KeyError異常を生みます
S.copy()
コレクションSのコピーを返す
len(S)
集合Sを返す要素の数
x in S
TrueFalseを返します
x not in S
TrueFalseを返します
set(x)
他のタイプの変数をコレクションタイプに変換
4、集合の応用シーン
-      
-    

データの再例
ls =["p","p","y","y",123]
s = set(ls)  #  
lt = list(s)
print(lt)

しゅつりょく
['y', 123, 'p']

二、シーケンスタイプと操作
1、シーケンスタイプの定義
-         ,        
-        
-        ,             
-           
    -     
    -    
    -    

2、シーケンスタイプ汎用オペレータ
オペレータとアプリケーション
説明
x in s
xがシーケンスSの要素である場合はTrueを返し、そうでない場合はFalseを返す
x not in s
同上類似
S + T
2つのシーケンスSとTを接続する
Sn又はnS
シーケンスSをn回コピー
S[i]
インデックスは、Sのi番目の要素を返し、iはシーケンスのシーケンス番号です.
S[i:j]またはS[i:j:k]
スライスは、シーケンスSのi番目からj番目にkをステップとする要素シーケンスを返す
3、シーケンスタイプ共通関数と方法
関数とメソッド
説明
len(S)
戻りシーケンスSの長さ
min(S)またはmax(S)
シーケンスSの最小または最大の要素を返します.Sの要素を比較する必要があります.
S.index(x)またはS.index(x,i,j)
戻りシーケンスSは、iからjの位置において初めて要素xが現れる位置に戻る
S.count(x)
シーケンスSにおけるx出現の合計回数を返す
4、タプルタイプ定義
-       ,         
-     () tuple()  ,        
-           

たとえば
#       
def func():
    return 1,2

5、リストタイプ定義
-         ,          
-     [] list()  ,       
-            ,     
-  [] list()          ,                        

例表タイプの操作関数と方法:
関数またはメソッド
説明
ls[i] = x
置換リストls第i要素はx
ls[i:j:k] = lt
lsスライスをリストltで置き換えると対応する要素サブリスト
del ls[i]
リストlsのi番目の要素を削除
del ls[i:j:k]
リストのi番目からj番目にkをステップとする要素を削除します.
ls += lt
リストlsを更新し、リストlt要素をリストlsに追加する
ls *= n
リストlsを更新し、その要素はn回繰り返します.
ls.append(x)
リストlsの最後に要素xを追加
ls.clear()
リスト内のすべての要素を削除
ls.copy()
ls内のすべての要素を割り当てる新しいリストを生成します
ls.insert(i,x)
リストlsのi番目の位置にXを追加
ls.pop(i)
リストlsのi番目の位置要素から要素を取り出して削除する
ls.remove(x)
リストlsに表示される最初の要素xを削除する
sorted(ls)
リストls要素をソートする
les.sort(cmp=None, key=None, reverse=False)
cmp–パラメータを指定すると、パラメータのメソッドを使用してソートされます.key–主に比較に使用される要素で、1つのパラメータしかありません.具体的な関数のパラメータは反復可能なオブジェクトから取得され、反復可能なオブジェクトの1つの要素を指定してソートします.reverse–ソート・ルール、reverse=True降順、reverse=False昇順(デフォルト)
5、リスト機能例
1、空リストlt lt = []の定義
2、ltに5つの元素lt += [1,2,3,4,5]を追加する
3、ltの2番目の要素lt[2] = 6を修正する
4.ltの2番目の位置に1つの要素lt.insert(2,7)を追加する
5、ltの1番目の位置から1つの要素del lt[1]を削除する
6、lt中1-3位置要素del lt[1:4]を削除する
7、ltに数字0 0 in ltが含まれているかどうかを判断する
8、ltに0 lt.append(0)を追加
9、数字0のどのようにltの中のインデックスlt.index(0)を返します
10、ltの長さlen(lt)11、lt中最大元素max(lt)12、クリアlt lt.clear()6、シーケンスタイプ適用シーン
-              ,        
-      ,          
-     :        ,      。    

三、辞書の種類
1、辞書タイプ定義
-      (  )  (  )   
-   :         
-         ,        
-     {} dict()  ,      :  
-             

2、辞書タイプの操作関数と方法
関数またはメソッド
説明
del d[k]
辞書の中キーkに対応するデータ値を削除
k in d
キーkが辞書dにあるかどうかを判断し、Trueを返す場合、False
d.keys()
辞書dのすべてのキーの情報を返す
d.value()
辞書dのすべての値を返す情報
d.items()
辞書dのすべてのキー値ペア情報を返す
d.get(k,)
キーkが存在する場合は対応する値を返し、存在しない場合はdefault値を返す
d.pop(k,)
キーkが存在する場合は対応する値を取り出し、存在しない場合はdefault値を返す
d.popitem()
辞書dからランダムにキー値ペアを取り出し、メタグループ形式で返す
d.clear()
すべてのキー値ペアを削除
len(d)
辞書dの要素の個数を返す
四、jiebaライブラリの使用
1、jiebaライブラリの概要
-jieba            ,  pip  
-                 
-jieba         ,           
-jiba        
    -        ,           
    -           ,      
    -    ,             

2、jiebaライブラリの使用説明
-    :         ,       
-   :           °    ,   
-      :        ,       

jiebaライブラリ共通関数
関数#カンスウ#
説明
jieba.lcut(S)
正確なモードで、リストの分詞結果を返します.例えばjieba.lcut(「中国は偉大な国際である」).輸出:[『中国』,『はい』,『一つ』,『偉大』,『国家』]
jieba.lcut(s,cut_all=True)
全モードで、リストタイプの分詞結果を返し、冗長性があります.例:ieba.lcut(「中国は偉大な国」、cut_all=True);輸出:[‘中国’,‘国是’,‘一つ’,‘偉大’,‘大国’,‘国家’]
jieba.lcut_for_search(S)
エンジンモードを検索し、リストタイプの分詞結果を返し、冗長性があります.例:jieba.lcut_for_search(「中華人民共和国万歳」);輸出:[『中華人民共和国』,『華人』,『人民』,『共和』,『共和国』,『中華人民共和国』,『万歳』]
jieba.add_word(w)
分詞辞典に新語を加えるw