2. ๋จธ์‹ ๋Ÿฌ๋‹

Metric์˜ ์ข…๋ฅ˜


์ •๊ทœํ™”(Normalization)์˜ ํ•„์š”์„ฑ


Local minimum๊ณผ Global minimum์˜ ์ฐจ์ด

Pasted image 20250301140150.png


์ฐจ์›์˜ ์ €์ฃผ

Pasted image 20250301140703.png


์ฐจ์› ์ถ•์†Œ ๊ธฐ๋ฒ•


PCA๋Š” ์ฐจ์›์ถ•์†Œ? ๋ฐ์ดํ„ฐ ์••์ถ•? ๋…ธ์ด์ฆˆ ์ œ๊ฑฐ?


Markov Chain

Pasted image 20250301141603.png


SVM

์žฅ์  ๋‹จ์ 
๋ถ„๋ฅ˜์™€ ํšŒ๊ท€์— ๋ชจ๋‘ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ์™€ ๋งค๊ฐœ๋ณ€์ˆ˜ ์„ค์ •์— ๋”ฐ๋ผ ์ •ํ™•๋„๊ฐ€ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ๋‹ค.
์‹ ๊ฒฝ๋ง ๊ธฐ๋ฒ•์— ๋น„ํ•ด ๊ณผ์ ํ•ฉ ์ •๋„๊ฐ€ ๋‚ฎ๋‹ค. ์˜ˆ์ธก์ด ์–ด๋–ป๊ฒŒ ์ด๋ฃจ์–ด์ง€๋Š”์ง€์— ๋Œ€ํ•œ ์ดํ•ด์™€ ๋ชจ๋ธ์— ๋Œ€ํ•œ ํ•ด์„์ด ์–ด๋ ต๋‹ค.
์˜ˆ์ธก์˜ ์ •ํ™•๋„๊ฐ€ ๋†’๋‹ค. ๋Œ€์šฉ๋Ÿ‰ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๋ชจ๋ธ ๊ตฌ์ถ• ์‹œ ์†๋„๊ฐ€ ๋Š๋ฆฌ๋ฉฐ,๋ฉ”๋ชจ๋ฆฌ ํ• ๋‹น๋Ÿ‰์ด ํฌ๋‹ค.
์ €์ฐจ์›๊ณผ ๊ณ ์ฐจ์› ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด์„œ ๋ชจ๋‘ ์ž˜ ์ž‘๋™ํ•œ๋‹ค.

Naive Bayes(๋‚˜์ด๋ธŒ ๋ฒ ์ด์ฆˆ)

์žฅ์  ๋‹จ์ 
๋‹จ์ˆœํ•˜๊ณ  ๋น ๋ฅด๋ฉฐ ๋งค์šฐ ํšจ๊ณผ์ ์ด๋‹ค ๋ชจ๋“  ์†์„ฑ์€ ๋™๋“ฑํ•˜๊ฒŒ ์ค‘์š”ํ•˜๊ณ  ๋…๋ฆฝ์ ์ด๋ผ๋Š” ์•Œ๋ ค์ง„ ๊ฒฐํ•จ ๊ฐ€์ •์— ์˜์กดํ•œ๋‹ค
๋…ธ์ด์ฆˆ์™€ ๊ฒฐ์ธก ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ์–ด๋„ ์ž˜ ์ˆ˜ํ–‰ํ•œ๋‹ค ์ˆ˜์น˜ ์†์„ฑ์œผ๋กœ ๊ตฌ์„ฑ๋œ ๋งŽ์€ ๋ฐ์ดํ„ฐ์…‹์— ๋Œ€ํ•ด ์ด์ƒ์ ์ด์ง€ ์•Š๋‹ค
ํ›ˆ๋ จ์— ๋Œ€ํ•œ ์ƒ๋Œ€์ ์œผ๋กœ ์ ์€ ์˜ˆ์ œ๊ฐ€ ํ•„์š”ํ•˜์ง€๋งŒ ๋งค์šฐ ๋งŽ์€ ์˜ˆ์ œ๋„ ์ž˜ ์ˆ˜ํ–‰ํ•œ๋‹ค ์ถ”์ •๋œ ํ™•๋ฅ ์€ ์˜ˆ์ธก๋œ ๋ฒ”์ฃผ๋ณด๋‹ค ๋œ ์‹ ๋ขฐ์ ์ด๋‹ค
์˜ˆ์ธก์— ๋Œ€ํ•œ ์ถ”์ •๋œ ํ™•๋ฅ ์„ ์–ป๊ธฐ ์‰ฝ๋‹ค

๋จธ์‹ ๋Ÿฌ๋‹(machine)์  ์ ‘๊ทผ๋ฐฉ๋ฒ•๊ณผ ํ†ต๊ณ„(statistics)์  ์ ‘๊ทผ๋ฐฉ๋ฒ•


์ธ๊ณต์‹ ๊ฒฝ๋ง(deep learning ์ด์ „)์ด ๊ฐ€์ง€๋Š” ์ผ๋ฐ˜์ ์ธ ๋ฌธ์ œ์ 

Pasted image 20250301145400.png


Deep Learning์˜ ํ˜์‹ ์˜ ๊ทผ๊ฐ„


์„œ๋ฒ„๊ฐ€ ๋งŽ์„ ๋•Œ Random Forest๊ฐ€ ์œ ๋ฆฌํ•œ ์ด์œ 


K-means


L1, L2 ์ •๊ทœํ™”(Regularization)


Cross Validation์ด๋ž€?

Note

์™œ test ๋ฐ์ดํ„ฐ์…‹ ๋งŒ์œผ๋กœ ๊ฒ€์ฆํ•˜๋ฉด ์•ˆ๋ ๊นŒ?
๋ชจ๋“  train ๋ฐ์ดํ„ฐ์…‹์„ ํ•™์Šตํ•˜๊ณ , test ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ๊ฒ€์ฆํ•œ ๊ฒฐ๊ณผ๋ฅผ ํ™•์ธํ•œ๋‹ค๊ณ  ํ•˜์ž. ๊ฐœ๋ฐœ์ž๋Š” test ๋ฐ์ดํ„ฐ์…‹ ์ ์ˆ˜๋ฅผ ๋†’์ด๊ธฐ ์œ„ํ•ด, test ๋ฐ์ดํ„ฐ์…‹์— ํŽธํ–ฅ๋˜๋„๋ก ๋ชจ๋ธ์„ ํŠœ๋‹ํ•˜๊ฒŒ ๋  ๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ค‘์š”ํ•œ ๊ฒƒ์€ test ๋ฐ์ดํ„ฐ์…‹์— ๋Œ€ํ•œ ์ •ํ™•๋„๋ฅผ ๋†’์ด๋Š” ๊ฒƒ ๋ฟ๋งŒ์•„๋‹ˆ๋ผ, ๋ชจ๋ธ์˜ ์ผ๋ฐ˜์ ์ธ ์ •ํ™•๋„๋ฅผ ๋†’์ด๋Š” ๊ฒƒ์ด๋‹ค. ์–ด๋–ค ๋ฐ์ดํ„ฐ๊ฐ€ ๋“ค์–ด์™€๋„ ์ผ์ •ํ•˜๊ฒŒ ๋†’์€ ์ •ํ™•๋„๋ฅผ ๋ณด์—ฌ์ฃผ๋Š” ๋ชจ๋ธ์ด ์ข‹์€ ๋ชจ๋ธ์ด๋ผ ํ•  ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ, validation ๋ฐ์ดํ„ฐ์…‹๊ณผ test ๋ฐ์ดํ„ฐ์…‹์„ ๋ถ„๋ฆฌํ•˜์—ฌ ๊ฒ€์ฆํ•˜๋Š” ๊ณผ์ •์„ ํ†ตํ•ด, ๋ชจ๋ธ์„ ์ผ๋ฐ˜ํ™”์‹œ์ผœ์•ผ ํ•œ๋‹ค.


XGBoost


์•™์ƒ๋ธ”

Pasted image 20250301153020.png

Note

๋ฐฐ๊น… vs ๋ถ€์ŠคํŒ…
๋ฐฐ๊น…์€ ๋žœ๋ค ๋ณต์›์ถ”์ถœ(๋ถ€ํŠธ์ŠคํŠธ๋žฉ)์„ ์—ฌ๋Ÿฌ๋ฒˆ ๋ฐ˜๋ณตํ•˜์—ฌ ๋ชจ๋ธ์„ย ๋ณ‘๋ ฌ์ ์œผ๋กœ ์—ฌ๋Ÿฌ๊ฐœ ํ•™์Šต์„ ์‹œํ‚จ ๋‹ค์Œ, ํ‰๊ท ์„ ๋‚ด๋Š” ๋ฐฉ์‹์ด๋‹ค. ๋ฐ˜๋ฉด,ย ๋ถ€์ŠคํŒ…์€ ๋ชจ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šต์— ์‚ฌ์šฉํ•˜๋˜, ์˜ค๋‹ต์— ๋” ํฐ ๊ฐ€์ค‘์น˜๋ฅผ ๋‘์–ด ๋‹ค์Œ ํšŒ์ฐจ๋ฅผ ํ•™์Šต์‹œํ‚ค๋Š”ย ์ˆœ์ฐจ์ ์ธ ๋ฐฉ๋ฒ•์ด๋‹ค


์ข‹์€ ๋ชจ๋ธ์ด๋ž€?


50๊ฐœ์˜ ์ž‘์€ Decision Tree(๋ฐฐ๊น…) vs ํฐ Decision Tree

Pasted image 20250301154139.png


๋ถ„๋ฅ˜ ๋ฌธ์ œ์—์„œ Rogistic Regression vs Linear Regression

images/Pasted image 202503011548291.png