๊ด€๋ฆฌ ๋ฉ”๋‰ด

yeon's ๐Ÿ‘ฉ๐Ÿป‍๐Ÿ’ป

[ํ”„๋žœ์ฐจ์ด์ฆˆ ์ž…์ ๋ถ„์„] *์š”์•ฝ ๋ณธ๋ฌธ

Computer ๐Ÿ’ป/๋ฐ์ดํ„ฐ ๋ถ„์„

[ํ”„๋žœ์ฐจ์ด์ฆˆ ์ž…์ ๋ถ„์„] *์š”์•ฝ

yeon42 2021. 8. 7. 11:46
728x90

6. ์ƒ‰์ธ์œผ๋กœ ์„œ๋ธŒ์…‹ ๊ฐ€์ ธ์˜ค๊ธฐ

6.1 ์„œ์šธ๋งŒ ๋”ฐ๋กœ ๋ณด๊ธฐ

df_seoul = df[df["์‹œ๋„๋ช…"] == "์„œ์šธํŠน๋ณ„์‹œ"].copy()

 

7. ํŒŒ์ผ๋กœ ์ €์žฅํ•˜๊ธฐ

df_seoul์„ "seoul_open_store.csv" ํŒŒ์ผ๋กœ ์ €์žฅํ•˜๊ธฐ

-> ์ „์ฒ˜๋ฆฌ ํŒŒ์ผ ์ €์žฅํ•˜๋ฉด ์žฌ์‚ฌ์šฉ ํ•  ์ˆ˜ ์žˆ์Œ

df_seoul.to_csv("seoul_open_store.csv", index=False)

 

8. ๋ฐฐ์Šคํ‚จ๋ผ๋นˆ์Šค, ๋˜ํ‚จ๋„๋„ˆ์ธ  ์œ„์น˜ ๋ถ„์„

8.1 ํŠน์ • ์ƒํ˜ธ๋งŒ ๊ฐ€์ ธ์˜ค๊ธฐ

- ๋ฌธ์ž์—ด ์†Œ๋ฌธ์ž๋กœ ๋ณ€๊ฒฝ : df_seoul["์ƒํ˜ธ๋ช…_๋ฌธ์ž"]

df_seoul["์ƒํ˜ธ๋ช…_์†Œ๋ฌธ์ž"] = df_seoul["์ƒํ˜ธ๋ช…"].str.lower()
df_seoul["์ƒํ˜ธ๋ช…_์†Œ๋ฌธ์ž"].str.extract("(๋ฒ |๋ฐฐ)์Šคํ‚จ๋ผ๋นˆ์Šค|baskinrobbins")[0].value_counts()
df_seoul.loc[df_seoul["์ƒํ˜ธ๋ช…_์†Œ๋ฌธ์ž"].str.contains("๋ฐฐ์Šคํ‚จ๋ผ๋นˆ์Šค|๋ฒ ์Šคํ‚จ๋ผ๋นˆ์Šค|baskinrobbins"), "์ƒํ˜ธ๋ช…_์†Œ๋ฌธ์ž"].shape

 

df_seoul.loc[df_seoul["์ƒํ˜ธ๋ช…_์†Œ๋ฌธ์ž"].str.contains("๋˜ํ‚จ|dunkin"), "์ƒํ˜ธ๋ช…_์†Œ๋ฌธ์ž"].shape

 

- ๋ฐฐ์Šคํ‚จ๋ผ๋นˆ์Šค, ๋˜ํ‚จ ๋„๋„ˆ์ธ  ๋ฐ์ดํ„ฐ๋กœ ๊ฐ€์ ธ์™€ ๋ณ€์ˆ˜์— ๋‹ด๊ธฐ : df_31

df_31 = df_seoul[df_seoul["์ƒํ˜ธ๋ช…_์†Œ๋ฌธ์ž"].str.contains("๋ฐฐ์Šคํ‚จ๋ผ๋นˆ์Šค|๋ฒ ์Šคํ‚จ๋ผ๋นˆ์Šค|baskinrobbins|๋˜ํ‚จ|dunkin")].copy()

 

- df_31์— ๋ธŒ๋žœ๋“œ๋ช…์ด๋ผ๋Š” column์ถ”๊ฐ€

df_31.loc[df_31["์ƒํ˜ธ๋ช…_์†Œ๋ฌธ์ž"].str.contains("๋ฐฐ์Šคํ‚จ๋ผ๋นˆ์Šค|๋ฒ ์Šคํ‚จ๋ผ๋นˆ์Šค|baskinrobbins"), "๋ธŒ๋žœ๋“œ๋ช…"] = "๋ฐฐ์Šคํ‚จ๋ผ๋นˆ์Šค"
df_31["๋ธŒ๋žœ๋“œ๋ช…"] = df_31["๋ธŒ๋žœ๋“œ๋ช…"].fillna("๋˜ํ‚จ๋„๋„ˆ์ธ ")

 

- isin์„ ํ†ตํ•ด '์†Œ๋งค', '์ƒํ™œ์„œ๋น„์Šค' ๋ฐ์ดํ„ฐ๋Š” ์ œ์™ธ

df_31 = df_31[~df_31["์ƒ๊ถŒ์—…์ข…๋Œ€๋ถ„๋ฅ˜๋ช…"].isin(["์†Œ๋งค", "์ƒํ™œ์„œ๋น„์Šค"])].copy()

 

Comments