[PYTHON]forデータプリプロセッシング


ファイルの処理
ファイルを開く:open()
Open()の基本構造
open('파일명.확장자')
ファイルを閉じる:close()
close()の基本構造
파일명.close()
ファイルを開いたら、必ず閉じてください!必要とする
✔openとcloseを一緒に使うと?
file = open('file.csv')
content = file.read()
file.close()
✔ファイルを自動的に閉じるには、次の手順に従います.
with open('file.csv') as file :
  content = file.read()
ファイル行による読み込み
contents = []
with open('file.csv') as file :
  for line in file :
    contents.append(line)
ファイルのモード
ファイルを開くときに何も指定されていない場合は、読み取りモードで開きます.
書き込みモード
with open('file.csv', 'w') as file :
  file.write('Hello')
文字列関数
文字列の頭文字:startswith()
startswith()の基本構造
문자열.startswith('문자')
値はTrue、Falseを返します.1文字ではなく複数の文字を使用することもできます.
分割文字列:split()
split()の基本構造
문자열.split('문자')
文字列を分割する関数.スペース区切り分離された文字列は、リスト内の要素として格納されます.
空白のある文字列を空白と空白に分けるときの違いは何ですか?
numbers = "  1 2 3  "

print(numbers.split())
>>> ['1', '2', '3']

print(numbers.split(' '))
>>> ['', '', '1', '', '2', '', '3', '', '']
代表空白文字
(1)":スペース(スペース)
(2)"t":Tab(Tabキー)
(3)「n」:Newline(トルコ)
(4):すべてのスペース文字
リスト値の追加:append()
新しい値を追加するとき.これは事実リスト関数ですが、文字列で一緒に表示しましょう.
append()のデフォルト構造
리스트.append(원소)
最も一般的な方法
* 조건에 맞는 값들만 새로 리스트로 반환하고 싶을 때

numbers = [1, 2, 10, 17]
small_numbers = []

for num in numbers :
  if num < 10 :
    small_numbers.append(num)
大文字、小文字の変更:lower()、upper()
大文字と小文字の関数を変換します.「下」を「小文字」、「上」を「大文字」に変換します.元の文字列を直接変更するのではなく、実行時に変換して表示します.したがって、変更した値を利用するには、値に入れる必要があります.
Powerの基本構造
문자열.lower()
문자열.upper()
置換文字ちかんもじ:replace()replace()replace()
文字値を置換する関数.
replace()の基本構造
문자열.replace('바꾸고 싶은 문자', '바꿀 문자')
特定の文字を検索して削除することもできます.この場合、 문자열.replace('없애고 싶은 문자', '')を使用できます.
文字列関数は、値を置き換えるのではなく、新しい値を表示するだけで、実際に使用するには、変数に値を再配置する必要があります.
データ構造でーたこうぞう:リストりすと
複文
for、inを使用してリスト内の各要素を取得します.
文の基本構造
for 변수 in 리스트(또는 튜플, 문자열) :
  수행할 문장1
  수행할 문장2
  ...
✔一緒に理解する良い関数:range
数値リストの関数を自動的に生成します.range(n)の数字は0からn−1,range(n,m)の数字はnからm−1である.
for num in range(10) :
  print(num)
fruits = ["사과", "바나나", "키위"]

for i in range(len(fruits)) :
  print("과일" + str(i+1) + ":" + fruits[i])
索引の作成
リスト、文字列で使用され、順序付きの資料構造では、その要素が何番目であるかを示します.
インデックスの基本構造
a = "Life is too short, You need Python"

a[n]
a[-m]
マイナス記号を使用している場合は、後ろから位置の読み取りを開始します.つまり、-mは後ろからmまで数える文字です.
スライド
リスト、文字列で使用し、順序のある資料構造で要素を順番に切除する場合に使用します.
レールの基本構造
a = "Life is too short, You need Python"
a[n:m]
a文字列からn番からm番までの文字を抽出します.このとき注意すべき点はmであり,終了番号に対応する文字列は抽出されない.このスライド式を式で表すと、n<=a並べ替え:並べ替え
ソートの基本構造
sorted(정렬하고자 하는 리스트, key = 함수(정렬 기준), reverse = True|False)
デフォルトのソート関数(何も入れない場合)、数値のソートは小さいものから小さいものまでです.任意の受信可能な小さなオブジェクト.英語ではアルファベット順に並べ替えられます.keyにはabs(割引でソート)とlen(長さでソート)、およびカスタム関数が含まれます.sorted(리스트, reverse = True)を使用して降順でソートします.
「ソート」との違いは何ですか?
sortは、ソース自体を変更し、리스트.sort()として使用します.ソートされたソースは保持され、新しいソートリストが返されます.
リストを使用したリストの作成:リストの理解
デフォルトでは、コードを書くときに簡単にコードを書くことが望ましいので、既存のマルチラインコードを使うほうが便利であれば、この方法を使用する必要はありません.
List理解の基本構造
[표현식 for 항목 in 반복 가능 객체]
✔実際比較
* for문 사용
a = [1, 2, 3, 4]
result = []
for num in a :
  result.append(num*3)
  
* list comprehension 사용
a = [1, 2, 3, 4]
result = [num*3 for num in a]
リスト理解に条件を追加する際の基本構造
[표현식 for 항목 in 반복 가능 객체 if 조건]
しかしこの場合、元よりも見づらいことが多いのであまり使いません.
データ構造:tuple
リストに似た順序付き要素の集合.ただし、リストとは異なり、各要素の値を変更したり、個数を変更したりすることはできません.
tupleの基本構造
love = ('가연', '상현')
したがって、love[0]love.append('옹성우')をリストのように使用することは不可能である.
--
upload : 2022.01.30
1st update : 2022.02.14 🍫