Notice
Recent Posts
Recent Comments
Link
์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- ๋ถ์
- ๋ค์ดํฐ๋ธ
- ์๋๋ก์ด๋์คํ๋์ค
- ๋จธ์ ๋ฌ๋
- ๋ฐ์ดํฐ๋ถ์
- native
- Kaggle
- ๋ฐฑ์ค
- ์ธํ๋ฐ
- linearalgebra
- c++
- Git
- react
- ํ์ดํ๋
- ๋ฐ์ดํฐ์๊ฐํ
- ์ ํ๋์ํ
- ๊นํ
- ์๋ฒ ๋ฉ
- ๋ฐ์ดํฐ
- AI
- ๊ฒฐ์ ํธ๋ฆฌ
- Titanic
- ์ํ์ฝ๋ฉ
- ์๊ณ ๋ฆฌ์ฆ
- cs231n
- ๋์
- nlp
- ๋ฆฌ์กํธ
- ํ๊ตญ์ด์๋ฒ ๋ฉ
- ๋ฅ๋ฌ๋
Archives
- Today
- Total
yeon's ๐ฉ๐ป๐ป
[ํ๋์ฐจ์ด์ฆ ์ ์ ๋ถ์] *์์ฝ ๋ณธ๋ฌธ
728x90
6. ์์ธ์ผ๋ก ์๋ธ์ ๊ฐ์ ธ์ค๊ธฐ
6.1 ์์ธ๋ง ๋ฐ๋ก ๋ณด๊ธฐ
df_seoul = df[df["์๋๋ช "] == "์์ธํน๋ณ์"].copy()
7. ํ์ผ๋ก ์ ์ฅํ๊ธฐ
df_seoul์ "seoul_open_store.csv" ํ์ผ๋ก ์ ์ฅํ๊ธฐ
-> ์ ์ฒ๋ฆฌ ํ์ผ ์ ์ฅํ๋ฉด ์ฌ์ฌ์ฉ ํ ์ ์์
df_seoul.to_csv("seoul_open_store.csv", index=False)
8. ๋ฐฐ์คํจ๋ผ๋น์ค, ๋ํจ๋๋์ธ ์์น ๋ถ์
8.1 ํน์ ์ํธ๋ง ๊ฐ์ ธ์ค๊ธฐ
- ๋ฌธ์์ด ์๋ฌธ์๋ก ๋ณ๊ฒฝ : df_seoul["์ํธ๋ช _๋ฌธ์"]
df_seoul["์ํธ๋ช _์๋ฌธ์"] = df_seoul["์ํธ๋ช "].str.lower()
df_seoul["์ํธ๋ช _์๋ฌธ์"].str.extract("(๋ฒ |๋ฐฐ)์คํจ๋ผ๋น์ค|baskinrobbins")[0].value_counts()
df_seoul.loc[df_seoul["์ํธ๋ช _์๋ฌธ์"].str.contains("๋ฐฐ์คํจ๋ผ๋น์ค|๋ฒ ์คํจ๋ผ๋น์ค|baskinrobbins"), "์ํธ๋ช _์๋ฌธ์"].shape
df_seoul.loc[df_seoul["์ํธ๋ช _์๋ฌธ์"].str.contains("๋ํจ|dunkin"), "์ํธ๋ช _์๋ฌธ์"].shape
- ๋ฐฐ์คํจ๋ผ๋น์ค, ๋ํจ ๋๋์ธ ๋ฐ์ดํฐ๋ก ๊ฐ์ ธ์ ๋ณ์์ ๋ด๊ธฐ : df_31
df_31 = df_seoul[df_seoul["์ํธ๋ช _์๋ฌธ์"].str.contains("๋ฐฐ์คํจ๋ผ๋น์ค|๋ฒ ์คํจ๋ผ๋น์ค|baskinrobbins|๋ํจ|dunkin")].copy()
- df_31์ ๋ธ๋๋๋ช ์ด๋ผ๋ column์ถ๊ฐ
df_31.loc[df_31["์ํธ๋ช _์๋ฌธ์"].str.contains("๋ฐฐ์คํจ๋ผ๋น์ค|๋ฒ ์คํจ๋ผ๋น์ค|baskinrobbins"), "๋ธ๋๋๋ช "] = "๋ฐฐ์คํจ๋ผ๋น์ค"
df_31["๋ธ๋๋๋ช "] = df_31["๋ธ๋๋๋ช "].fillna("๋ํจ๋๋์ธ ")
- isin์ ํตํด '์๋งค', '์ํ์๋น์ค' ๋ฐ์ดํฐ๋ ์ ์ธ
df_31 = df_31[~df_31["์๊ถ์ ์ข ๋๋ถ๋ฅ๋ช "].isin(["์๋งค", "์ํ์๋น์ค"])].copy()
'Computer ๐ป > ๋ฐ์ดํฐ ๋ถ์' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[kaggle] ํ์ดํ๋(titanic) | 9. Feature Engineering - Fill Null in Age (0) | 2021.08.07 |
---|---|
[kaggle] ํ์ดํ๋(titanic) | 8. EDA - Fare (0) | 2021.08.07 |
[ํ๋์ฐจ์ด์ฆ ์ ์ ๋ถ์] Folium | MarkerCluster (0) | 2021.08.05 |
[ํ๋์ฐจ์ด์ฆ ์ ์ ๋ถ์] countplot, scatterplot, jointplot (0) | 2021.08.05 |
[ํ๋์ฐจ์ด์ฆ ์ ์ ๋ถ์] ํน์ ์ํธ๋ง ์ถ์ถ (0) | 2021.08.05 |
Comments