Pythonデータマイニングチュートリアル-7日目(1):Python常用内蔵関数


これまで(3.8.2)、Python解釈器は合計69個の内蔵関数とタイプを提供し、これらの関数は任意の条件で呼び出すことができる.たとえば、変数タイプをクエリーするために使用したtype()は、組み込み関数です.
type()は実際にはクラスの構造方法であり,その戻り値はtypeオブジェクトであり,クラスとオブジェクトを理解する前に簡単に関数として理解することもできる.
初学段階でよく使われる内蔵関数を詳しく紹介し,関数の機能を記述する際にも初学段階で利用できる機能が主である.
1.データ型関連
まず、データ型に関連する組み込み関数について説明します.先ほど例として挙げたtype()メソッドは、変数(オブジェクト)のタイプを取得するために使用できるデータ型に関連する重要な組み込み関数です.
関数#カンスウ#
機能
type()
オブジェクトのタイプの取得
さらに、データ型に関連する組み込み関数には、新しい変数を構築したり、変数タイプを変換したりするために使用できる構造関数も含まれています.
これらの組み込み関数は、実際には組み込みタイプの構築方法でもあります.
関数#カンスウ#
機能
bool()
ブール型変数を作成するか、変数をブール型に変換します.
dict()
辞書の作成
float()
浮動小数点型変数を作成するか、変数を浮動小数点型に変換します.
list()
リストを作成するか、オブジェクトをリストに変換します.
int()
整数型変数を作成するか、変数を整数型に変換します.
set()
アセンブリを作成するか、オブジェクトをアセンブリに変換します.
str()
文字列変数を作成するか、変数を文字列に変換します.
tuple()
メタグループを作成するか、オブジェクトをメタグループに変換します.
x = str("123")
y = int(x)
print(type(x), type(y))  #    :  

初心者の段階では、いくつかの一般的なデータ型に対応する組み込み関数を理解するだけでいいです.パラメータのフォーマットが適切でない場合、データ型を強制的に変換すると、エラーが発生する可能性があります.
2.シーケンス操作
次に、基本的な操作シーケンスの組み込み関数について説明します.
関数#カンスウ#
機能
len()
シーケンスに含まれる要素の数を取得
sorted()
オブジェクトを新しいリストに並べ替える
len()
シーケンスに含まれる要素の数を取得します.パラメータが文字列である場合、文字列の長さを返します.パラメータがリスト、メタグループ、またはセットの場合、要素の数が返されます.パラメータが辞書の場合、辞書の最初のレイヤのプロパティの数が返されます.
a = "1234"
b = [1, 2, 3]
c = (1, 2, 3, 4, 5)
d = {1, 2, 3, 4, 5, 6}
e = {"a": 1, "b": 2}
print(len(a))  #    : 4
print(len(b))  #    : 3
print(len(c))  #    : 5
print(len(d))  #    : 6
print(len(e))  #    : 2

sorted()
反復可能なオブジェクトをリストに並べ替えます.パラメータがリスト、メタグループ、またはコレクションの場合、メタグループはリストに変換され、ソートされます.パラメータが文字列の場合、文字列は1つの文字に分割され、ソートされます.パラメータがディクショナリの場合、ディクショナリの最初のレイヤのプロパティ名がリストとしてソートされます.
sorted()にはFalseとしてデフォルトのパラメータreverseがあり、このパラメータは逆順序を制御するために使用され、逆順序が必要な場合はreserseパラメータをTrueに設定できます.
a = "1324"
b = [1, 3, 2]
c = (1, 3, 2, 5, 4)
d = {1, 6, 5, 4, 2, 3}
e = {"b": 5, "a": 1}
print(sorted(a))  #    : ['1', '2', '3', '4']
print(sorted(b))  #    : [1, 2, 3]
print(sorted(c))  #    : [1, 2, 3, 4, 5]
print(sorted(d, reverse=True))  #    : [6, 5, 4, 3, 2, 1]
print(sorted(e))  #    : ['a', 'b']

3.数学演算
内蔵関数には、絶対値、最大値の除去、最小値の取得、べき乗演算、四捨五入、和など、数学演算によく使用される関数も含まれています.
関数#カンスウ#
機能
abs(x)
xの絶対値を計算する
max()
最大値の計算
min()
最小値の計算
pow(base,exp)
ベースのexp乗を計算する
round(number[,ndigits])
nunmer四捨五入小数点後のndigitsビット精度の値を返します.ndigitsを設定しない場合、デフォルトは整列です.
sum()
和を求める
abs()
絶対値を計算します.パラメータが整数または浮動小数点数の場合、整数または浮動小数点数の絶対値を返します.パラメータが虚数の場合、虚数のモードが返されます.
print(abs(-3))  #    : 3
print(abs(-3.1415926))  #    : 3.1415926
print(abs(complex(2,1)))  #    : 2.23606797749979

max()
最大値を計算します.パラメータが複数の数値の場合、その最大値が返されます.パラメータがシーケンスの場合、シーケンスの最大値が返されます.
print(max(1, 2, 3, 4, 5))  #    : 5
print(max([1, 2, 3, 4, 5]))  #    : 5

min()
最小値を計算します.パラメータが複数の数値の場合、その最小値が返されます.パラメータがシーケンスの場合、シーケンスの最小値が返されます.
print(min(1, 2, 3, 4, 5))  #    : 1
print(min([1, 2, 3, 4, 5]))  #    : 1

pow()
pow(base,exp)はbaseを計算するexp次べき乗であり、底数とべき乗は整数でも浮動小数点数でもよい.
print(pow(3, 5))  #    : 243
print(pow(3.5, 4.2))  #    : 192.79056951583615

round()
浮動小数点数を四捨五入する.1つのパラメータしかない場合、そのパラメータを整数に四捨五入する.2つのパラメータaとbがある場合、aを小数点以下b位に四捨五入する.
print(round(3.1415926))  #    : 3
print(round(3.1415926, 2))  #    : 3.14

sum()
シーケンス内の要素の和を求めます.1つのパラメータしかない場合、パラメータはリスト、メタグループ、または集合であり、パラメータ内の要素の和を計算することができる.2つのパラメータがある場合、最初のパラメータの要素の和を計算した上で、2番目のパラメータの値も加算されます.
print(sum([1, 2, 3, 4, 5]))  #    : 15
print(sum((1, 2, 3, 4, 5)))  #    : 15
print(sum({1, 2, 3, 4, 5}))  #    : 15
print(sum([1, 2, 3, 4, 5], 2))  #    : 17

4.反復相関
初期段階ではrange()を主に用いてサイクルを実現した.
関数#カンスウ#
機能
range(stop)
0からstopまでの可変シーケンスタイプを返します.
range(start, stop[, step])
startからstopまでのstepをステップ長とする可変シーケンスタイプを返します.
range()は可変シーケンスを生成するために使用され、一般的にループに使用される.パラメータstopが1つしかない場合、0からstop-1までの1ビットステップの可変シーケンスを返します.2つのパラメータstartとstopがある場合、startからstop-1までの1ビットステップの可変シーケンスを返す.3つのパラメータstart、stop、stepがある場合、startからstop-1までのstepをステップ長とする可変シーケンスが返されます.
print(list(range(5)))  #    : [0, 1, 2, 3, 4]
print(list(range(1, 5)))  #    : [1, 2, 3, 4]
print(list(range(1, 5, 2)))  #    : [1, 3]

5.コンソール関連
これまで,input()とprint()の2つのコンソール入出力の方法を複数回用いた.ここでinput()のパラメータは比較的簡単であり、print()のパラメータは比較的複雑である.初心段階では、この2つの内蔵関数を直接使用すればよいので、深く理解する必要はありません.
関数#カンスウ#
機能
input([prompt])
コンソール入力からローを読み込み、文字列に変換して返します.
print(*objects, sep=’ ‘, end=’’, file=sys.stdout, flush=False)
objectsをコンソールに印刷し、sepで区切り、末尾にendを付ける
6.書類の読み書き
ファイルの読み書きではopen()という内蔵関数を使用します.この関数も同様に多くのオプションパラメータを持っており、初期段階ではfile、mode、encodingの3つのパラメータの使い方を理解すればよい.ここでfileパラメータはファイルが存在するパスであり、modeパラメータはファイルを開くモードであり、encodingはファイルの符号化タイプである.
関数#カンスウ#
機能
open(file, mode=‘r’, buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
ファイルを開き、対応するファイルオブジェクトを返します.
modeのモードタイプは次のとおりです(ファイルポインタは、文書ドキュメントを使用してファイルを開くときのカーソルの位置と簡単に理解できます).
を選択します.
説明
r
読み取り専用でファイルを開く(ポインタはファイルの先頭にある)
rb
ファイルをバイナリ、読み取り専用で開く(ポインタはファイルの先頭にある)
r+
ファイルを読み書きで開く(ポインタはファイルの先頭にある)
rb+
ファイルをバイナリ、読み書きで開く(ポインタはファイルの先頭にある)
w
ファイルを書き込みで開く(ポインタはファイルの先頭にあり、ファイルが存在しない場合は新しいファイルを作成)
wb
ファイルをバイナリ、書き込みで開く(ポインタはファイルの先頭にあり、ファイルが存在しない場合は新しいファイルを作成する)
w+
ファイルを読み書きで開く(ポインタがファイルの先頭にある;ファイルが存在しない場合は新しいファイルを作成する)
wb+
ファイルをバイナリ、読み書きで開きます(ポインタはファイルの先頭にあります.ファイルが存在しない場合は、新しいファイルを作成します).
a
ファイルを追加で開く(ポインタはファイルの最後にあり、ファイルが存在しない場合は新しいファイルを作成する)
ab
ファイルをバイナリ、追加で開きます(ポインタはファイルの最後にあります.ファイルが存在しない場合は、新しいファイルを作成します).
a+
ファイルを追加読み書きで開きます(ポインタはファイルの最後にあります;ファイルが存在しない場合は新しいファイルを作成します)
ab+
ファイルをバイナリ、追加読み書きで開きます(ポインタはファイルの最後にあります.ファイルが存在しない場合は、新しいファイルを作成します).
Python常用内蔵モジュール
組み込み関数に加えて、Pythonは多くの組み込みモジュールを提供しています.以下では、初学段階でよく使われる組み込みモジュールの使い方を主に理解します.
re正規表現モジュール
reはregular expressionの略で、正規表現の一連の検索、置換、区切りなどの操作をサポートします.ここで、クエリは通常serachメソッドまたはfindallメソッドを使用します.置換は通常subメソッドを使用します.区切りは通常splitメソッドを使用します.
import re
sentence = "This is a sentence."
print(re.findall("en.", sentence))  #    :['ent', 'enc']
print(re.search("en.", sentence))  #    :
print(re.sub("en", "[NEW]", sentence))  #    :This is a s[NEW]t[NEW]ce.
print(re.split("en", sentence))  #    :['This is a s', 't', 'ce.']

timeタイムモジュール
timeモジュールは、strftime(出力フォーマット時間)と
import time
print(time.strftime('%Y-%m-%d %H:%M:%S'))  #    : 2020-05-09 09:50:51
print(time.time())  #    : 1588989051.660889
time.sleep(1)