江西区コンビニデータ抽出


データダウンロード(パブリックデータポータル)
import pandas as pd 
# 공공데이터 포털에서 서울상권정보를 다운 받은 후 df로 바꿔줌
df = pd.read_csv('소상공인시장진흥공단_상가(상권)정보_서울_202112.csv')
df.shape
(315294, 39)
# 도로명 주소에 강서구가 포함된 데이터만 추출
df2 = df[df['도로명주소'].str.contains('강서구')]
df2.shape
(15283, 39)
# 강서구 상권정보 중 편의점 데이터만 추출 후 칼럼 확인
df3 = df2.loc[df['상권업종소분류명'] == '편의점']
df3.columns
Index(['상가업소번호', '상호명', '지점명', '상권업종대분류코드', '상권업종대분류명', '상권업종중분류코드',
       '상권업종중분류명', '상권업종소분류코드', '상권업종소분류명', '표준산업분류코드', '표준산업분류명', '시도코드',
       '시도명', '시군구코드', '시군구명', '행정동코드', '행정동명', '법정동코드', '법정동명', '지번코드',
       '대지구분코드', '대지구분명', '지번본번지', '지번부번지', '지번주소', '도로명코드', '도로명', '건물본번지',
       '건물부번지', '건물관리번호', '건물명', '도로명주소', '구우편번호', '신우편번호', '동정보', '층정보',
       '호정보', '경도', '위도'],
      dtype='object')
# 필요한 내용인 지점명, 위도, 경도만 추출
df_store = df3[['지점명','위도','경도']]
df_store.head(2)
サイト名
緯度
経度
128
江西太陽店
37.535125
126.853607
809
江西内の発散路
37.549387
126.834082