์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- c++
- ๋จธ์ ๋ฌ๋
- ๋ฐฑ์ค
- react
- ๊นํ
- ๋ฐ์ดํฐ๋ถ์
- ๊ฒฐ์ ํธ๋ฆฌ
- ๋์
- ์ธํ๋ฐ
- AI
- Titanic
- ๋ถ์
- linearalgebra
- ํ๊ตญ์ด์๋ฒ ๋ฉ
- nlp
- ์ํ์ฝ๋ฉ
- ์๊ณ ๋ฆฌ์ฆ
- ๋ฆฌ์กํธ
- cs231n
- ๋ฅ๋ฌ๋
- Kaggle
- Git
- ์๋๋ก์ด๋์คํ๋์ค
- ์๋ฒ ๋ฉ
- ๋ค์ดํฐ๋ธ
- ๋ฐ์ดํฐ์๊ฐํ
- native
- ๋ฐ์ดํฐ
- ํ์ดํ๋
- ์ ํ๋์ํ
- Today
- Total
๋ชฉ๋ก๋ฐ์ดํฐ์๊ฐํ (15)
yeon's ๐ฉ๐ป๐ป

2. 8 Fare : ํ์น์๊ธ * Skewness(์๋) - ์๋ฃ์ ๋ถํฌ๋ชจ์์ด ํ๊ท ์ ์ค์ฌ์ผ๋ก ํ ์ชฝ์ผ๋ก ์น์ฐ์ณ์ ธ ์๋ ๊ฒฝํฅ์ ๋ํ๋ด๋ ์ฒ๋ - ์๋ฃ์ ๋ถํฌ๊ฐ ๋์นญ์ธ์ง ์๋์ง๋ฅผ ์ธก์ ํด์ฃผ๋ ๊ฐ - distribution์ด ์ผ๋ง๋ ์ ๋ ธ๋ (๋น๋์นญ์ด๋) - skew = 0 : ์ ๊ท๋ถํฌ - skew > 0 : ์ข์ธก์ผ๋ก ์น์ฐ์นจ - skew < 0 : ์ฐ์ธก์ผ๋ก ์น์ฐ์นจ fig, ax = plt.subplots(1, 1, figsize=(8, 8)) g = sns.distplot(df_train['Fare'], color='b', label='Skewness: {:.2f}'.format(df_train['Fare'].skew()), ax=ax) g = g.legend(loc='best') - ๊ทธ๋ํ๊ฐ ํ ์ชฝ์ผ๋ก ๋๋ฌด ..

9. Folium์ผ๋ก ์ง๋ ํ์ฉํ๊ธฐ conda install -c conda-forge folium import folium lat = df_31["์๋"].mean() long = df_31["๊ฒฝ๋"].mean() ์ํ ํ๋ ํ์ df_31.sample(random_state=31) - randomํ๊ฒ ๋ฐ์ดํฐ๋ฅผ ์ถ์ถํ๋๋ฐ ํญ์ ๊ฐ์ ๊ฐ์ ์ถ์ถํ๊ณ ์ถ์ ๋ m = folium.Map([lat, long]) folium.Marker([[37.495593, 127.0390323]], popup="๋ํจ๋๋์ธ ", tooltip="๋ํจ๋๋์ธ ").add_to(m) 9.2 ์์ธ์ ๋ฐฐ์คํจ๋ผ๋น์ค์ ๋ํจ๋๋์ธ ๋งค์ฅ ๋ถํฌ - ๊ธฐ๋ณธ ๋ง์ปค๋ก ํํํ๊ธฐ m = folium.Map([lat, long], zoom_start=12) ..

2. Foliumn์ผ๋ก ์ง๋ ํ์ฉํ๊ธฐ conda install -c conda-forge folium 2.0.1 Foliumn ์ฌ์ฉ ์์ ์์์ ๊ทธ๋ฆฐ ์ด๋ฆฐ์ด์ง, ํ์-์ ์ ์ ์ํธ ๋ฐ์ดํฐ๋ฅผ ์ง๋์ ์๊ฐํ ํด๋ณด์ import folium long = df_academy_selected["๊ฒฝ๋"].mean() lat = df_academy_selected["์๋"].mean() - ๊ฒฝ๋์ ์๋์ ํ๊ท ๊ฐ์ ๊ฐ๊ฐ long, lat ๋ณ์์ ๋ด์์ค map ์ค์ฌ ์ก๊ธฐ m = folium.Map(location=[lat, long], zoom_start=12) - zoom_start ๋ฅผ ๋์ด๋ฉด ๊ทธ๋งํผ ๋ ํ๋๋๋ค. ์๊ถ์ ์ข ์๋ถ๋ฅ๋ช ์ด '์ด๋ฆฐ์ด์ง' ๊ณผ 'ํ์-์ ์' ์ธ ๋ฐ์ดํฐ๋ง isin์ ํตํด ๊ฐ์ ธ์ค๊ธฐ df_m = d..

1.2.7 ๊ฒฝ๋์ ์๋๋ฅผ scatterplot์ผ๋ก ํํํ๊ธฐ ์ํธ์๊ฐ 1000๊ฐ ์ด์์ธ ๋ฐ์ดํฐ df_academy_selected scatterplot์ผ๋ก ๊ฒฝ๋์ ์๋ ํํํ๊ณ ์๊ตฐ๊ตฌ๋ช ์ผ๋ก ์์ ๋ค๋ฅด๊ฒ ํํํ๊ธฐ plt.figure(figsize=(10, 7)) sns.scatterplot(data=df_academy_selected, x="๊ฒฝ๋", y="์๋", hue="์๊ตฐ๊ตฌ๋ช ") ์๊ถ์ ์ข ์๋ถ๋ฅ๋ช ์ผ๋ก ์์ ๋ค๋ฅด๊ฒ ํํํ๊ธฐ plt.figure(figsize=(10, 7)) sns.scatterplot(data=df_academy_selected, x="๊ฒฝ๋", y="์๋", hue="์๊ถ์ ์ข ์๋ถ๋ฅ๋ช ") '์๊ถ์ ์ข ์๋ถ๋ฅ๋ช ' ์ด 'ํ์-์ ์' ์ธ ๋ฐ์ดํฐ๋ง ๊ทธ๋ฆฌ๊ธฐ plt.figure(figsize=(10, 7)..