Notice
Recent Posts
Recent Comments
Link
์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- ์๋ฒ ๋ฉ
- react
- native
- ์ธํ๋ฐ
- nlp
- Git
- ๋จธ์ ๋ฌ๋
- ํ์ดํ๋
- ๋ฐ์ดํฐ์๊ฐํ
- ๋ฆฌ์กํธ
- ๊ฒฐ์ ํธ๋ฆฌ
- Kaggle
- ์ ํ๋์ํ
- ๋ฅ๋ฌ๋
- ๋ฐฑ์ค
- Titanic
- cs231n
- ํ๊ตญ์ด์๋ฒ ๋ฉ
- ์ํ์ฝ๋ฉ
- ์๋๋ก์ด๋์คํ๋์ค
- ๋ค์ดํฐ๋ธ
- linearalgebra
- ๋์
- ๊นํ
- ์๊ณ ๋ฆฌ์ฆ
- AI
- c++
- ๋ฐ์ดํฐ๋ถ์
- ๋ถ์
- ๋ฐ์ดํฐ
Archives
- Today
- Total
yeon's ๐ฉ๐ป๐ป
[์ ๊ตญ ๋์ ๊ณต์ ํ์ค ๋ฐ์ดํฐ] ํน์ ๊ณต์ ์๊ฐํ ๋ณธ๋ฌธ
Computer ๐ป/๋ฐ์ดํฐ ๋ถ์
[์ ๊ตญ ๋์ ๊ณต์ ํ์ค ๋ฐ์ดํฐ] ํน์ ๊ณต์ ์๊ฐํ
yeon42 2021. 8. 13. 01:02728x90
4.4 ํน์ ๊ณต์๊ตฌ๋ถ ๊ฐ์ ธ์ค๊ธฐ
- ๊ณต์๊ตฌ๋ถ ๋น๋์ ๊ตฌํ๊ธฐ
df["๊ณต์๊ตฌ๋ถ"].value_counts()
- ํน์ ํ ์คํธ๊ฐ ๋ค์ด๊ฐ๋ ๊ณต์๋ง ๊ฐ์ ธ์ค๊ธฐ: str.match
park_type = r'.*((์ญ์ฌ|์ฒด์ก|์๋ณ|๋ฌธํ)๊ณต์).*'
park = df[df["๊ณต์๊ตฌ๋ถ"].str.match(park_type)]
park.shape
- . : ๋ชจ๋ ๋ฌธ์
- * : 0๋ฒ ์ด์ ๋ฐ๋ณต
--> .* : ๋ชจ๋ ๋ฌธ์๊ฐ 0๋ฒ ์ด์ ๋ฐ๋ณต๋๋ค.
var_numbers
- ๋ฆฌ์คํธ์ "๊ณต์๊ตฌ๋ถ" ์์ ์ถ๊ฐํ๊ธฐ -> "๊ณต์๊ตฌ๋ถ"์ ๋ฐ๋ผ ์์ ๋ค๋ฅด๊ฒ ํํํ๊ธฐ ์ํด
- ๋ฆฌ์คํธ์ ์์ ์ ๊ฑฐํ๊ธฐ
var_pair = var_numbers
var_pair.append("๊ณต์๊ตฌ๋ถ")
var_pair.remove("์ง์ ๊ณ ์์ผ")
var_pair.remove("๊ณ ์์ฐ๋")
var_pair.remove("๊ณ ์์")
var_pair
- var_pair ๋ฆฌ์คํธ๋ก pairplot ๊ทธ๋ฆฌ๊ธฐ
sns.pairplot(park[var_pair], hue="๊ณต์๊ตฌ๋ถ")
- var_pair์ ๋ด๊ธด ๋ฆฌ์คํธ์ ์๋ ์ปฌ๋ผ์ ์ฌ์ฉํด ๊ทธ๋ฆผ์ ๊ทธ๋ฆฐ๋ค.
4.5 ํผ๋ดํ ์ด๋ธ๋ก ์๋๋ณ ๊ณต์์์ ํ๊ท ๋ฉด์ ๊ตฌํ๊ธฐ
park_size = pd.pivot_table(df, index="์๋", values="๊ณต์๋ฉด์ ", aggfuc=["count", "mean", "median"])
park_size.style.background_gradient()
4.6 ๋ด๊ฐ ์ฌ๋ ์ง์ญ์ ๊ณต์์ ์ง๋์ ํ์ํด๋ณด๊ธฐ
- ๊ฒฝ๊ธฐ๋ ์ฑ๋จ์์ ์์นํ ๊ณต์๋ง ์ถ๋ ฅํ๊ธฐ
df_sn = df[(df["์๋"] == "๊ฒฝ๊ธฐ๋") & (df["๊ตฌ๊ตฐ"] == "์ฑ๋จ์")]
4.6.1 ํน์ ๊ณต์ ์ ๋ณด ์ฐพ์๋ณด๊ธฐ
- ํ๊ต์ ํ๋๊ณต์ ์ฐพ์๋ณด๊ธฐ
df_sn.loc[df_sn["๊ณต์๋ช
"].str.contains("ํ๋"), ["๊ณต์๋ช
", "์๋", "๊ฒฝ๋"]]
- ํน์ ์ปฌ๋ผ๋ง ๋ถ๋ฌ์์ ๋ณด๊ธฐ
cols = "๊ณต์๋ณด์ ์์ค(์ด๋์์ค) ๊ณต์๋ณด์ ์์ค(์ ํฌ์์ค) ๊ณต์๋ณด์ ์์ค(ํธ์ต์์ค) ๊ณต์๋ณด์ ์์ค(๊ต์์์ค)"
cols = cols.split("\t")
df_sn.loc[df_sn["๊ณต์๋ช
"].str.contains("ํ๋"), cols]
4.6.2 ์ง๋์ ํํํ๊ธฐ
import folium
m = folium.Map([37.397084, 127.106226], zoom_start=13)
for n in df_sn.index:
lat = df_sn.loc[n, "์๋"]
long = df_sn.loc[n, "๊ฒฝ๋"]
tooltip = df_sn.loc[n, "๊ณต์๋ช
"] + " - " + df_sn.loc[n, "์์ฌ์ง๋๋ก๋ช
์ฃผ์"]
folium.Marker([lat, long], tooltip=tooltip).add_to(m)
m.save('index.html')
m
'Computer ๐ป > ๋ฐ์ดํฐ ๋ถ์' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๊น์ด ์ฐ์ ํ์(DFS) / ๋๋น ์ฐ์ ํ์(BFS) (0) | 2021.09.30 |
---|---|
[ํ์ด์ฌ] Asterisk(*) (0) | 2021.08.16 |
[์ ๊ตญ ๋์ ๊ณต์ ํ์ค ๋ฐ์ดํฐ] ์๋๋ณ ๊ณต์ ๋ถํฌ (0) | 2021.08.13 |
[์ ๊ตญ ๋์ ๊ณต์ ํ์ค ๋ฐ์ดํฐ] ๋ฐ์ดํฐ ์์ฝํ๊ธฐ (0) | 2021.08.13 |
[์ ๊ตญ ๋์ ๊ณต์ ํ์ค ๋ฐ์ดํฐ] ๋ง์คํน(์ ํ๋ฒํธ, ์ด๋ฉ์ผ, ์๋์ฐจ ๋ฒํธ) (0) | 2021.08.13 |
Comments