yeon's πŸ‘©πŸ»‍πŸ’»

ν…μŠ€νŠΈ 감성 뢄석 (Text Sentimental Analysis) λ³Έλ¬Έ

AIFFEL πŸ‘©πŸ»‍πŸ’»

ν…μŠ€νŠΈ 감성 뢄석 (Text Sentimental Analysis)

yeon42 2022. 1. 20. 10:57
728x90

졜근 SNS와 같은 μ†Œμ…œλ―Έλ””μ–΄μ˜ ν™œμ„±ν™”λ‘œ 인해 λ§Žμ€ λŒ€μ€‘λ“€μ€ 인터넷 상에 μžμ‹ μ˜ 감성과 νƒœλ„λ₯Ό ν‘œμΆœν•˜κ³ , 이에 λ”°λ₯Έ '감성 뢄석'에 높은 관심이 μ§€μ†λ˜κ³  μžˆλ‹€.

λŒ€ν‘œμ μΈ 예둜 'Hungerithm' μ΄λΌλŠ” λ°°κ³ ν””(Hunger) + μ•Œκ³ λ¦¬μ¦˜(Algorithm) 을 ν•©μ„±ν•œ 단어가 μžˆλŠ”λ°, μ΄λŠ” μŠ€λ‹ˆμ»€μ¦ˆ μ‹ν’ˆνšŒμ‚¬κ°€ SNSμ—μ„œ μ‹μ‚¬μ‹œκ°„ 이전이 μ‹μ‚¬μ‹œκ°„ 이후보닀 μ‚¬λžŒλ“€μ˜ ν”Όλ“œμ— 뢀정적인 글이 많이 μ˜¬λΌμ˜¨λ‹€λŠ” μ μ—μ„œ μ°©μ•ˆν•΄ λ§Œλ“  μœ λ¨ΈλŸ¬μŠ€ν•œ 단어이닀.

μ΄λŠ” λŒ€ν‘œμ μΈ ν…μŠ€νŠΈ 감성 λΆ„μ„μ˜ 예둜, μ‚¬λžŒλ“€μ˜ μ½”λ©˜νŠΈλ₯Ό μ‹€μ‹œκ°„μœΌλ‘œ 뢄석해 λ§ˆμΌ€νŒ…μ„ νŽΌμ³€λ‹€.

 

 

🧀 κ°μ„±λΆ„μ„μ΄λž€?

: ν…μŠ€νŠΈμ— λ‚˜νƒ€λ‚˜λŠ” 주관적 μš”μ†ŒμΈ 긍정적 감정과 뢀정적 감정을 νŒλ³„ν•΄ 이λ₯Ό μˆ˜μΉ˜λ‚˜ 도식, λ“±κΈ‰ λ“±μœΌλ‘œ μ •λŸ‰ν™”ν•˜λŠ” μž‘μ—…. λ‹¨μˆœνžˆ 긍정/뢀정을 νŒλ³„ν•˜λŠ” 것 뿐 μ•„λ‹Œ λŒ€μƒμ΄ λ˜λŠ” κ°œμ²΄λ‚˜ 속성을 μΆ”μΆœν•˜κ³ , 감성을 ν‘œν˜„ν•˜λŠ” μ΄λ“€μ˜ 감정, 감성, νƒœλ„, μž…μž₯ 등을 뢄석함

 

'μΆ”μΆœ - λ²”μ£Όν™” 및 λΆ„λ₯˜ - 예츑'의 단계λ₯Ό 톡해 '긍정'κ³Ό 'λΆ€μ •'의 이뢄법적 λΆ„λ₯˜, ν˜Ήμ€ '쀑립'이 ν¬ν•¨λ˜μ–΄ κ·Έ 정도λ₯Ό 0-10의 숫자둜 ν‘œν˜„ν•œλ‹€.

 

감성 ν‘œν˜„(Sentiment Expression)의 λŒ€μƒμ€ 개체(Entity)라고 ν•œλ‹€.

예λ₯Ό λ“€μ–΄, ν™”μž₯ν’ˆμ˜ 평이 'μ΄‰μ΄‰ν•˜λ‹€' λΌλŠ” 것은 감성 ν‘œν˜„μ΄λ©°,

감성이 ν‘œν˜„ν•˜λŠ” λŒ€μƒμΈ ν™”μž₯ν’ˆ, 즉 νŒŒμš΄λ°μ΄μ…˜ 등은 κ°œμ²΄κ°€ λœλ‹€.

μΆ”κ°€λ‘œ κ°œμ²΄μ— λŒ€ν•œ ν‰κ°€λŠ” 'μ„±λΆ„', '가격'에 따라 λ‹¬λΌμ§ˆ 수 μžˆλŠ”λ° 이듀을 속성(Aspect)라고 λΆ€λ₯Έλ‹€.

λ˜ν•œ 의견 보유자(Opinion Holder)의 속성(성별, λ‚˜μ΄, 직업 λ“±)κ³Ό μ‹œκ°„μ— λ”°λ₯Έ 좔이 등이 μ€‘μš” 정보가 될 수 μžˆλ‹€.

 

1. '데이터 μˆ˜μ§‘'

2. ν…μŠ€νŠΈ μž‘μ„±μžμ˜ 주관이 λ“œλŸ¬λ‚œ 뢀뢄을 κ±ΈλŸ¬λ‚΄λŠ” 'μ£Όκ΄€μ„± 탐지'

3. 'μ£Όκ΄€μ„±μ˜ κ·Ήμ„±'을 미리 μ •μ˜λœ κ·Ήμ„± / 정도 둜 λΆ„λ₯˜ν•¨

 

 

(1) κΈ°κ³„ν•™μŠ΅ 기반 접근법

- μ£Όμ–΄μ§„ 문자 데이터에 μ‘΄μž¬ν•˜λŠ” νŒ¨ν„΄μ„ 뢄석해 감성 λΆ„λ₯˜ 예츑 λͺ¨ν˜•을 κ΅¬μΆ•ν•œ ν›„, ν•™μŠ΅ν•œ 데이터와 μœ μ‚¬ν•œ νŠΉμ„±μ„ κ°–λŠ” 뢄석 λŒ€μƒ 데이터에 μ μš©ν•¨μœΌλ‘œμ¨ 감성 뢄석 μˆ˜ν–‰

- 긍정/λΆ€μ •μœΌλ‘œ λΆ„λ₯˜λœ 라벨(label)이 뢙은 데이터가 λ‹€μˆ˜ μžˆμ–΄μ•Ό ν•™μŠ΅μ΄ κ°€λŠ₯

 

(2) 감성사전 기반 접근법

- μˆ˜μ§‘λœ 문자 데이터λ₯Ό μ „μ²˜λ¦¬ν•΄ 미리 κ΅¬μΆ•λœ 감성사전과 λ§€μΉ­ν•œ λ’€ μ–΄λŠ μͺ½ κ·Ήμ„±μ˜ 감성어가 많이 λ‚˜μ˜€λŠ”μ§€ μ •λŸ‰ν™” ν•΄ 감성 뢄석함

- κ·Ήμ„± λ²”μ£Ό, 감성 점수 (ex. '맀우 λ‚˜μ˜λ‹€' (-2)) 둜 ꡬ성됨

- 같은 단어도 의미 차이가 생길 수 μžˆμœΌλ―€λ‘œ λ§Žμ€ κ³ λ―Όκ³Ό λΉ„μš©μ΄ μš”κ΅¬λ¨

 

* 속성 기반 감성 뢄석

- λ‹¨μˆœνžˆ 'μ’‹λ‹€', 'μ‹«λ‹€'κ°€ μ•„λ‹Œ 'μ–΄λ–€ 이유둜', '무엇을' μ’‹μ•„ν•˜λŠ”μ§€μ— λŒ€ν•œ 정보가 ν•„μš”ν•˜λ‹€.

- 속성 기반 감성 뢄석은 λ¬Έμž₯ μˆ˜μ€€μ˜ 감성 뢄석에 λΉ„ν•΄ μ •κ΅ν•œ 뢄석 방법을 μš”κ΅¬ν•œλ‹€.

 

 

 

'μ—λ›°λ“œ ν•˜μš°μŠ€'의 감성 뢄석 기반 λ§ˆμΌ€νŒ… λŒ€μ‹œλ³΄λ“œ ꡬ좕 사둀

1. 데이터 μˆ˜μ§‘

2. λ°μ΄ν„°μ˜ μ „μ²˜λ¦¬

- 같은 의미λ₯Ό μ§€λ‹Œ λ‹¨μ–΄λ“€μ˜ λ‹€μ–‘ν•œ ν˜•νƒœλ₯Ό ν•˜λ‚˜μ˜ νƒ€κ²Ÿ(target)ν˜•μœΌλ‘œ ν†΅μΌν•΄μ€Œ

3. ν˜•νƒœμ†Œ 사전 ꡬ좕

4. 속성어 사전 ꡬ좕

5. 감성어 사전 ꡬ좕

6. 감성 뢄석 λͺ¨ν˜•μ˜ ꡬ좕 및 κ²°κ³Ό λ„μΆœ

 

좜처: https://dbr.donga.com/article/view/1202/article_no/8891/ac/magazine

 

좜처: https://dbr.donga.com/article/view/1202/article_no/8891/ac/magazine

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

References

https://dbr.donga.com/article/view/1202/article_no/8891/ac/magazine

Comments