[データ科学]text,jsonファイルからデータを抽出する

1967 ワード

テキストファイルは基本的なファイルタイプであり、csv、xls、json、xmlなどにかかわらずテキストファイルの形式で読み取ることができます.
#-*- coding: utf-8 -*-
fpath = "data/textfile.txt"

f = open(fpath, 'r')

##         
first_char = f.read(1)
print "first char: ", first_char

##          ,      bytesize   
##           ,              
f.seek(0)

##          
all_chars = f.read()
print all_chars

##       
f.seek(0)
first_line = f.readline()
print 'first line: ',first_line

##      
f.seek(0)
all_lines = f.readlines()
num_lines = len(all_lines)
print "number of lines: ", num_lines

for i, line in f:
    print i, line

 
データ科学では、jsonも最もよく使われるファイル形式の一つであり、pythonはjsonをよくサポートしています.
import json

f = open('data/donut.json', 'r')
##   json   ,        list    dict
data = json.load(f)

print "type: ", type(data)
print data