Week 13-14 ํ•™์Šต ์ •๋ฆฌ

Data-centric AI์™€ DMOPs: ์ข‹์€ ๋ฐ์ดํ„ฐ๊ฐ€ AI ์„ฑ๋Šฅ์˜ ํ•ต์‹ฌ์ด๋‹ค

AI ์‹œ์Šคํ…œ์€ ๋ชจ๋ธ(์•Œ๊ณ ๋ฆฌ์ฆ˜)๊ณผ ๋ฐ์ดํ„ฐ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ์ „ํ†ต์ ์ธ AI ๊ต์œก์ด๋‚˜ ์—ฐ๊ตฌ์—์„œ๋Š” ๊ณ ์ •๋œ ๋ฐ์ดํ„ฐ์…‹๊ณผ ํ‰๊ฐ€ ๋ฐฉ์‹์„ ๋ฐ”ํƒ•์œผ๋กœ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋ฐ ์ดˆ์ ์„ ๋งž์ถฅ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์‹ค์ œ ํ˜„์—…์—์„œ๋Š” "์˜์ˆ˜์ฆ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ์ž๋™ํ™”"์™€ ๊ฐ™์ด ์š”๊ตฌ์‚ฌํ•ญ๋งŒ ์ฃผ์–ด์ง€๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์œผ๋ฉฐ, ์ „์ฒด AI ๊ฐœ๋ฐœ ์—…๋ฌด ์ค‘ ์‹ค์ œ ์„œ๋น„์Šค์— ์ ์šฉ๋˜๋Š” ๋ถ€๋ถ„์€ ๋ฐ์ดํ„ฐ์…‹ ์ค€๋น„์™€ ์ •์ œ์— ํฐ ๋น„์ค‘(~80%)์„ ์ฐจ์ง€ํ•ฉ๋‹ˆ๋‹ค.
์ด๋Ÿฌํ•œ ๋งฅ๋ฝ์—์„œ Data-centric AI๋Š” ์ข‹์€ ํ’ˆ์งˆ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ•˜๊ณ  ๊ด€๋ฆฌํ•˜๋Š” ๊ฒƒ์ด AI ์„ฑ๋Šฅ ํ–ฅ์ƒ์˜ ๊ฒฐ์ •์ ์ธ ์š”์ธ์ž…๋‹ˆ๋‹ค.
Pasted image 20250312134527.png


1. Data-centric AI์˜ ์ค‘์š”์„ฑ

๋”ฐ๋ผ์„œ AI ์‹œ์Šคํ…œ์˜ ์„ฑ๋Šฅ์„ ๊ทน๋Œ€ํ™”ํ•˜๋ ค๋ฉด, ๋†’์€ ํ’ˆ์งˆ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ•˜๋Š” ๊ฒƒ์ด ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค.


2. DMOPs (Data Management OPerations & Recipes)

DMOPs๋Š” ์–‘์งˆ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋ก , ๋„๊ตฌ, ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํฌ๊ด„ํ•˜๋Š” ๊ฐœ๋…์ž…๋‹ˆ๋‹ค. DMOPs์˜ ์ฃผ์š” ๊ตฌ์„ฑ ์š”์†Œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

์ด์™€ ๊ฐ™์€ DMOPs ์ ‘๊ทผ๋ฒ•์„ ํ†ตํ•ด, ์ข‹์€ ๋ฐ์ดํ„ฐ๋ฅผ ๋งŒ๋“œ๋Š” ์ž‘์—…์„ ์ฒด๊ณ„์ ์ด๊ณ  ํšจ์œจ์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.


3. ์ข‹์€ ๋ฐ์ดํ„ฐ๋ฅผ ๋งŒ๋“ค๊ธฐ ์œ„ํ•œ ๋ผ๋ฒจ๋ง ๊ฐ€์ด๋“œ

์ข‹์€ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ•˜๋Š” ๊ฒƒ์€ ์‰ฝ์ง€ ์•Š์€ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘๋Ÿ‰์ด ์ถฉ๋ถ„ํ•˜์ง€ ์•Š๊ฑฐ๋‚˜, ๋ผ๋ฒจ๋ง ์ž‘์—…์˜ ๋ช…ํ™•ํ•œ ์ •๋‹ต์ด ์—†๊ณ , ๋น„์šฉ๋„ ๋งŽ์ด ์†Œ์š”๋˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ์ด์— ๋”ฐ๋ผ, ์ผ๊ด€๋œ ๊ณ ํ’ˆ์งˆ ๋ฐ์ดํ„ฐ๋ฅผ ๋งŒ๋“ค๊ธฐ ์œ„ํ•ด ๋ช…ํ™•ํ•œ ๋ผ๋ฒจ๋ง ๊ฐ€์ด๋“œ๋ฅผ ์ž‘์„ฑํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

๋ผ๋ฒจ๋ง ๊ฐ€์ด๋“œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์š”์†Œ๋ฅผ ํฌํ•จํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.


๊ฒฐ๋ก 

์‹ค์ œ AI ์„œ๋น„์Šค ๊ฐœ๋ฐœ์—์„œ๋Š” ๋ชจ๋ธ๋ง๋ณด๋‹ค ๋ฐ์ดํ„ฐ ์ค€๋น„์™€ ์ •์ œ๊ฐ€ ํ›จ์”ฌ ํฐ ๋น„์ค‘์„ ์ฐจ์ง€ํ•ฉ๋‹ˆ๋‹ค. ์ข‹์€ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ•˜๊ณ , ์ด๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ๊ด€๋ฆฌํ•˜๊ธฐ ์œ„ํ•œ DMOPs์™€ ๋ช…ํ™•ํ•œ ๋ผ๋ฒจ๋ง ๊ฐ€์ด๋“œ๋ฅผ ํ†ตํ•ด, ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ์•ˆ์ •์ ์œผ๋กœ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Data-centric AI ์ ‘๊ทผ๋ฒ•์€ AI์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์œ„ํ•œ ํ•ต์‹ฌ ์ „๋žต์ด๋ฉฐ, ์„ฑ๊ณต์ ์ธ ์„œ๋น„์Šค ์šด์˜์˜ ํ•„์ˆ˜ ์š”์†Œ์ž…๋‹ˆ๋‹ค.


OCR๊ณผ ์ตœ์‹  ๊ธฐ์ˆ : ์ด๋ฏธ์ง€์—์„œ ํ…์ŠคํŠธ๋ฅผ ์ฝ์–ด๋‚ด๋Š” ํ˜์‹ 

OCR (Optical Character Recognition) ์€ ์ด๋ฏธ์ง€ ๋‚ด์˜ ๊ธ€์ž๋ฅผ ์ธ์‹ํ•˜์—ฌ ํ…์ŠคํŠธ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค. ๋‹จ์ˆœํžˆ ์ข…์ด์— ์ ํžŒ ๊ธ€์ž๋ฅผ ์ฝ๋Š” ๊ฒƒ์„ ๋„˜์–ด, ๊ธธ๊ฑฐ๋ฆฌ ๊ฐ„ํŒ์ด๋‚˜ ๋‹ค์–‘ํ•œ ์ž์—ฐ ํ™˜๊ฒฝ์—์„œ์˜ ํ…์ŠคํŠธ๋„ ์ธ์‹ํ•  ์ˆ˜ ์žˆ๋Š” STR (Scene Text Recognition) ์˜ ๋ฐœ์ „์œผ๋กœ, OCR์€ ์‹ค์ƒํ™œ์— ํญ๋„“๊ฒŒ ์ ์šฉ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.


1. OCR์˜ ํ•ต์‹ฌ ๊ณผ์ œ

OCR์€ ๋‹จ์ˆœํ•œ ๊ฐ์ฒด ๊ฒ€์ถœ(object detection)๊ณผ ๋‹ฌ๋ฆฌ, ํ…์ŠคํŠธ ์˜์—ญ์˜ ์œ„์น˜๋ฅผ ๊ฒ€์ถœํ•œ ํ›„ ๊ทธ ์˜์—ญ ๋‚ด์˜ ๊ธ€์ž๋ฅผ ์ „์‚ฌํ•˜๋Š” ๋‘ ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. OCR๋งŒ์˜ ํŠน์ด์ ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.


2. ํ…์ŠคํŠธ ์˜์—ญ ํ‘œํ˜„๋ฒ•

OCR ์‹œ์Šคํ…œ์€ ํ…์ŠคํŠธ ์˜์—ญ์„ ๋‹ค์–‘ํ•œ ๋ฐฉ์‹์œผ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.


3. OCR์˜ ์ฃผ์š” ๋ชจ๋“ˆ

ํšจ๊ณผ์ ์ธ OCR ์‹œ์Šคํ…œ์€ ๋‹ค์Œ ๋„ค ๊ฐ€์ง€ ๋ชจ๋“ˆ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค.

  1. Text Detector:
    • ์ด๋ฏธ์ง€ ๋‚ด ํ…์ŠคํŠธ ๋ฐ•์Šค์˜ ์œ„์น˜๋ฅผ ๊ฒ€์ถœํ•ฉ๋‹ˆ๋‹ค.
  2. Text Recognizer:
    • ๊ฒ€์ถœ๋œ ํ…์ŠคํŠธ ์˜์—ญ์—์„œ ์‹ค์ œ ๊ธ€์ž๋ฅผ ์ธ์‹ํ•˜๊ณ  ์ „์‚ฌํ•ฉ๋‹ˆ๋‹ค.
    • ์ด๋Š” Computer Vision๊ณผ NLP ๊ธฐ์ˆ ์˜ ๊ฒฐํ•ฉ ์˜์—ญ์ž…๋‹ˆ๋‹ค.
  3. Serializer:
    • ์ธ์‹๋œ ํ…์ŠคํŠธ๋ฅผ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌํ•˜๊ธฐ ์‰ฝ๊ฒŒ ์ •๋ ฌํ•ฉ๋‹ˆ๋‹ค.
    • ๋‹จ๋ฝ์„ ๋ฌถ๊ณ  ์ขŒ์ƒ๋‹จ๋ถ€ํ„ฐ ์šฐํ•˜๋‹จ์œผ๋กœ ์ •๋ ฌํ•˜๋ฉฐ, ๊ธˆ์น™์–ด ์ฒ˜๋ฆฌ๋‚˜ ์š”์•ฝ ๋“ฑ์˜ ํ›„์ฒ˜๋ฆฌ๋„ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
  4. Text Parser:
    • ์ •๋ ฌ๋œ ํ…์ŠคํŠธ๋ฅผ ๋ฏธ๋ฆฌ ์ •์˜๋œ ํ‚ค(์˜ˆ: ์ด๋ฆ„, ์ „ํ™”๋ฒˆํ˜ธ, ์ด๋ฉ”์ผ ๋“ฑ)์™€ ๋งคํ•‘ํ•ฉ๋‹ˆ๋‹ค.
    • ์ด ๊ณผ์ •์—์„œ๋Š” BIO tagging์„ ํ™œ์šฉํ•˜์—ฌ ๋‹จ์–ด๋ณ„ ์‹œ์ž‘(B), ๋‚ด๋ถ€(I), ์™ธ๋ถ€(O)์„ ํƒœ๊น…ํ•ฉ๋‹ˆ๋‹ค.

4. ์ตœ์‹  OCR ๋ชจ๋ธ

์ตœ๊ทผ์—๋Š” Transformer์™€ ๊ฐ™์€ ์ตœ์‹  ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ์ ์šฉํ•œ OCR ์‹œ์Šคํ…œ์ด ๋“ฑ์žฅํ–ˆ์Šต๋‹ˆ๋‹ค.

TrOCR

DTrOCR

MATRn (Multi-modAl Text Recognition Network)


๊ฒฐ๋ก 

OCR์€ ๋‹จ์ˆœํ•œ ํ…์ŠคํŠธ ์ธ์‹์„ ๋„˜์–ด, ๋‹ค์–‘ํ•œ ํ™˜๊ฒฝ์—์„œ ํ…์ŠคํŠธ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ฝ์–ด๋‚ด๊ธฐ ์œ„ํ•œ ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค.


์„œ๋น„์Šค ํ–ฅ AI ๋ชจ๋ธ ๊ฐœ๋ฐœ ์‹œ ๋ฐ์ดํ„ฐ ์ ๊ฒ€๊ณผ OCR ๋ฐ์ดํ„ฐ์…‹ ํ™•๋ณด ์ „๋žต

AI ์„ฑ๋Šฅ์€ ์ข‹์€ ๋ชจ๋ธ๋ฟ ์•„๋‹ˆ๋ผ ์–‘์งˆ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ•˜๋Š” ๋ฐ ํฌ๊ฒŒ ์ขŒ์šฐ๋ฉ๋‹ˆ๋‹ค. ํŠนํžˆ ์‹ค์ œ ์„œ๋น„์Šค์— ์ ์šฉ๋˜๋Š” AI ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•  ๋•Œ๋Š”, ๋‹จ์ˆœํžˆ ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜๋ฅผ ๊ฐœ์„ ํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ๋ฐ์ดํ„ฐ์˜ ํ’ˆ์งˆ์„ ์ฒด๊ณ„์ ์œผ๋กœ ๊ด€๋ฆฌํ•˜๋Š” ๊ฒƒ์ด ๋”์šฑ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.
์„œ๋น„์Šคํ–ฅ AI ๋ชจ๋ธ ๊ฐœ๋ฐœ ์‹œ, ์•„๋ž˜์™€ ๊ฐ™์€ ์งˆ๋ฌธ๋“ค์„ ํ†ตํ•ด ํ˜„์žฌ ์ƒํ™ฉ์„ ์ง„๋‹จํ•˜๊ณ , ์ตœ์‹  ๋ชจ๋ธ์˜ ํ•œ๊ณ„์™€ ์ผ๋ฐ˜์ ์ธ ๊ฒฝ์šฐ, ๊ทธ๋ฆฌ๊ณ  outlier ์ผ€์ด์Šค๋ฅผ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ์งˆ๋ฌธ๋“ค์— ๋‹ต์„ ์–ป๊ธฐ ์œ„ํ•ด, ๊ณต๊ฐœ๋œ ๋ฐ์ดํ„ฐ์…‹๊ณผ ์ตœ์‹  ๋ชจ๋ธ์„ ํ™œ์šฉํ•ด ์‹คํ—˜ํ•ด๋ณด๋Š” ๊ฒƒ์ด ํšจ๊ณผ์ ์ž…๋‹ˆ๋‹ค.


1. ์„œ๋น„์Šคํ–ฅ AI ๋ชจ๋ธ ๊ฐœ๋ฐœ ์‹œ ์ ๊ฒ€ํ•ด์•ผ ํ•  ์‚ฌํ•ญ

1-1. ์„ฑ๋Šฅ ๊ธฐ์ค€ ๋ฐ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ

1-2. ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ AI(Data-centric AI) ์ ‘๊ทผ๋ฒ•


2. OCR ๋ฐ์ดํ„ฐ์…‹ ํ™•๋ณด ๋ฐฉ๋ฒ•

OCR (Optical Character Recognition)์€ ์ด๋ฏธ์ง€ ๋‚ด์˜ ํ…์ŠคํŠธ๋ฅผ ๊ฒ€์ถœํ•˜๊ณ  ์ธ์‹ํ•˜๋Š” ํƒœ์Šคํฌ์ž…๋‹ˆ๋‹ค. OCR ๋ฐ์ดํ„ฐ์…‹์€ ์ผ๋ฐ˜ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋‹ฌ๋ฆฌ, ๊ธ€์ž์˜ ๋ชจ์–‘, ์–ธ์–ด, ๋ฐฐ๊ฒฝ ๋“ฑ ๋‹ค์–‘ํ•œ ์š”์†Œ๋ฅผ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ๋‹ค์Œ์€ OCR ๋ฐ์ดํ„ฐ์…‹์„ ํ™•๋ณดํ•  ์ˆ˜ ์žˆ๋Š” ์ฃผ์š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค.


3. OCR ๋ฐ์ดํ„ฐ์…‹ ํŒŒ์•… ์‹œ ๊ณ ๋ คํ•ด์•ผ ํ•  ํŠน์„ฑ

OCR ๋ฐ์ดํ„ฐ์…‹์„ ๋ถ„์„ํ•  ๋•Œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์š”์†Œ๋“ค์„ ์ฃผ์˜ ๊นŠ๊ฒŒ ์‚ดํŽด๋ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.


๊ฒฐ๋ก 

์„œ๋น„์Šค ํ–ฅ AI ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•  ๋•Œ๋Š” ๋ชจ๋ธ ์„ฑ๋Šฅ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๋ฐ์ดํ„ฐ์˜ ํ’ˆ์งˆ๊ณผ ๋‹ค์–‘์„ฑ์ด ๊ฒฐ์ •์ ์ธ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ์ ‘๊ทผ๋ฒ•์€ ์„œ๋น„์Šค์— ์ ์šฉ๋˜๋Š” AI ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๊ทน๋Œ€ํ™”ํ•˜๊ณ , ํ–ฅํ›„ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋Š” ๋ฌธ์ œ์— ๋Œ€๋น„ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋„์™€์ค„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.


OCR ์„ฑ๋Šฅ ํ‰๊ฐ€: Bounding Box ๊ด€์ ์—์„œ์˜ ํ‰๊ฐ€ Metrics

OCR (Optical Character Recognition) ์‹œ์Šคํ…œ์€ ์ด๋ฏธ์ง€ ๋‚ด ํ…์ŠคํŠธ ์˜์—ญ์„ ์ •ํ™•ํ•˜๊ฒŒ ๊ฒ€์ถœํ•˜๊ณ , ๊ทธ ์˜์—ญ ๋‚ด์˜ ๊ธ€์ž๋ฅผ ์ธ์‹ํ•˜๋Š” ๊ฒƒ์ด ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ๋Š” OCR์˜ ํ…์ŠคํŠธ ๋ฐ•์Šค(๊ฒฝ๊ณ„ ์ƒ์ž, bounding box) ๊ฒ€์ถœ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ๋‹ค๋ฃน๋‹ˆ๋‹ค.
์ผ๋ฐ˜์ ์ธ object detection ํ‰๊ฐ€ ์ง€ํ‘œ์™€ ์œ ์‚ฌํ•˜์ง€๋งŒ, OCR ํŠน์„ฑ์— ๋งž์ถฐ ๋ช‡ ๊ฐ€์ง€ ์ถ”๊ฐ€ ์ง€ํ‘œ์™€ ํŽ˜๋„ํ‹ฐ๊ฐ€ ์ ์šฉ๋ฉ๋‹ˆ๋‹ค.


1. Area Recall & Area Precision

Pasted image 20250312134754.png

Area Recall

Area Precision

๋น„๊ต ์š”์•ฝ

๊ตฌ๋ถ„ Area Precision Area Recall
๊ธฐ์ค€ Predicted bbox Ground Truth bbox
ํ‰๊ฐ€ ์งˆ๋ฌธ ์˜ˆ์ธกํ•œ bbox๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ •ํ™•ํ•œ๊ฐ€? ์‹ค์ œ ๊ฐ์ฒด๋ฅผ ์–ผ๋งˆ๋‚˜ ์ž˜ ํฌํ•จํ–ˆ๋Š”๊ฐ€?
์˜๋ฏธ ์˜ˆ์ธกํ•œ ์˜์—ญ ์ค‘ GT์™€ ์ผ์น˜ํ•˜๋Š” ๋น„์œจ GT ์˜์—ญ ์ค‘ ์˜ˆ์ธก bbox์— ํฌํ•จ๋œ ๋น„์œจ

2. Match ์œ ํ˜•

Pasted image 20250312134807.png
OCR ํƒœ์Šคํฌ์—์„œ๋Š” ํ•œ ์ด๋ฏธ์ง€ ๋‚ด์— ์—ฌ๋Ÿฌ ํ…์ŠคํŠธ๊ฐ€ ์กด์žฌํ•˜๊ธฐ ๋•Œ๋ฌธ์—, GT bbox์™€ predicted bbox ๊ฐ„์˜ ๋งค์นญ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.


3. ์ฃผ์š” ํ‰๊ฐ€ Metric

3-1. DetEval

DetEval์€ OCR์—์„œ bbox ๊ฒ€์ถœ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•œ ์ข…ํ•ฉ Metric์ž…๋‹ˆ๋‹ค.

  1. ๋งค์นญ:
    ๊ฐ GT bbox์™€ predicted bbox ์Œ์„ ๋งค์นญํ•˜๊ณ , ๊ฐ ์Œ์— ๋Œ€ํ•ด Area Recall๊ณผ Area Precision์„ ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค.
    Pasted image 20250312134832.png

  2. Binary ํ‰๊ฐ€:
    ๊ฐ ์Œ์— ๋Œ€ํ•ด ๋‹ค์Œ ์กฐ๊ฑด์„ ๋งŒ์กฑํ•˜๋ฉด 1, ๊ทธ๋ ‡์ง€ ์•Š์œผ๋ฉด 0์œผ๋กœ ์ ์ˆ˜๋ฅผ ๋ถ€์—ฌํ•ฉ๋‹ˆ๋‹ค.

    • Area Recall โ‰ฅ 0.8
    • Area Precision โ‰ฅ 0.4
      Pasted image 20250312134846.png
  3. ๋งค์นญ ์œ ํ˜• ๊ณ ๋ ค:

    • One-to-One: ๊ทธ๋Œ€๋กœ 1์ 
    • One-to-Many: ํŽ˜๋„ํ‹ฐ 0.8 ์ ์šฉ
    • Many-to-One: ํŽ˜๋„ํ‹ฐ ์—†์ด 1์  ์ ์šฉ

    Pasted image 20250312134859.png

  4. ์ตœ์ข… ์ ์ˆ˜:
    GT ๊ธฐ์ค€ ํ‰๊ท (Recall)๊ณผ ์˜ˆ์ธก ๊ธฐ์ค€ ํ‰๊ท (Precision)์„ ๊ฐ๊ฐ ๊ณ„์‚ฐํ•˜๊ณ , F1 score๋กœ ์ข…ํ•ฉํ•ฉ๋‹ˆ๋‹ค.

    F1 score=2ร—Precisionร—RecallPrecision+Recall

3-2. IoU (Intersection over Union)

3-3. TIoU (Tightness-aware IoU)

TIoU๋Š” ๋‹จ์ˆœ IoU์™€ ๋‹ฌ๋ฆฌ, GT bbox์— ๋น„ํ•ด ์˜ˆ์ธก bbox๊ฐ€ ๋ถ€์กฑํ•˜๊ฑฐ๋‚˜ ์ดˆ๊ณผํ•œ ์˜์—ญ์— ๋Œ€ํ•ด ํŽ˜๋„ํ‹ฐ๋ฅผ ๋ถ€์—ฌํ•ฉ๋‹ˆ๋‹ค.

์ฃผ์˜:
TIoU๋Š” GT๊ฐ€ golden answer๋ผ๋Š” ๊ฐ€์ •์ด ํ•„์š”ํ•˜๋ฉฐ, ๋‹จ์ˆœ ๋„“์ด ๊ธฐ๋ฐ˜ ํŽ˜๋„ํ‹ฐ๋กœ ์ธํ•ด ์ผ๋ถ€ ๊ธ€์ž ๋ˆ„๋ฝ ๊ฐ™์€ ์„ธ๋ฐ€ํ•œ ์˜ค๋ฅ˜๋Š” ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

3-4. CLEval (Character-Level Evaluation)

CLEval์€ OCR์˜ detection๋ฟ ์•„๋‹ˆ๋ผ recognition ์„ฑ๋Šฅ๋„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฌธ์ž ๋‹จ์œ„ ์ง€ํ‘œ์ž…๋‹ˆ๋‹ค.

  1. Pseudo Character Centers (PCC):
    ๊ฐ ๊ธ€์ž์˜ ์ค‘์‹ฌ์„ ๊ณ„์‚ฐํ•˜์—ฌ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.

  2. ๋งค์นญ ๋ฐ ์ ์ˆ˜ ๊ณ„์‚ฐ:

    • ๊ฐ GT bbox ๋‚ด์˜ PCC์™€ predicted bbox ๋‚ด์˜ PCC๋ฅผ ๋งค์นญํ•˜์—ฌ,
      Recall=โˆ‘(Correct PCCโˆ’Granual Penalty)GT ๋‚ด PCC ์ด ๊ฐœ์ˆ˜
    • Precision๋„ ๋น„์Šทํ•œ ๋ฐฉ์‹์œผ๋กœ ๊ณ„์‚ฐํ•˜๋ฉฐ, ์—ฌ๋Ÿฌ predicted bbox์— ์†ํ•˜๋Š” PCC๋Š” ํ•ด๋‹น bbox ์ˆ˜๋กœ ๋‚˜๋ˆ„์–ด ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค.
      Precision=โˆ‘CorrectNumโˆ’โˆ‘GranualPenaltyโˆ‘TotalNum
  3. ์ตœ์ข… CLEval:
    Recall๊ณผ Precision์˜ ์กฐํ™” ํ‰๊ท :

    CLEval=2ร—(Recallร—Precision)Recall+Precision


4. ์˜ˆ์‹œ

์•„๋ž˜ ์„ธ ๊ฐ€์ง€ ์ผ€์ด์Šค์— ๋Œ€ํ•ด ๊ฐ Metric์˜ ์˜ˆ์‹œ ์ ์ˆ˜๋ฅผ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.
Pasted image 20250312135358.png

(1) ์ •๋‹ต ์ผ€์ด์Šค

Metric Score
DetEval 1.0
IoU 1.0
TIoU 0.9
CLEval 8/9

(2) ์ •๋‹ต ์ผ€์ด์Šค

Metric Score
DetEval 0.8
IoU 0.0
TIoU -
CLEval 0.9

(3) ์ •๋‹ต ์ผ€์ด์Šค

Metric Score
DetEval 1.0
IoU 0.0
TIoU -
CLEval 0.93

ํ•ด์„:
๊ฐ ์ผ€์ด์Šค์—์„œ DetEval, IoU, TIoU, CLEval์€ OCR์˜ bounding box ๊ฒ€์ถœ ์„ฑ๋Šฅ์„ ๋‹ค๋ฅธ ๊ด€์ ์—์„œ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.


๊ฒฐ๋ก 

OCR ์‹œ์Šคํ…œ์˜ bounding box ์„ฑ๋Šฅ ํ‰๊ฐ€๋Š” ๋‹จ์ˆœํ•œ IoU ์ด์ƒ์˜ ๋‹ค์–‘ํ•œ ์ง€ํ‘œ๋ฅผ ํ†ตํ•ด ์ด๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ๋‹ค์–‘ํ•œ ์ง€ํ‘œ๋ฅผ ํ™œ์šฉํ•˜๋ฉด OCR ๋ชจ๋ธ์˜ bbox ๊ฒ€์ถœ ์„ฑ๋Šฅ์„ ๋‹ค๊ฐ๋„๋กœ ํ‰๊ฐ€ํ•˜๊ณ , ๊ฐœ์„  ๋ฐฉํ–ฅ์„ ๋ชจ์ƒ‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.


๋ฐ์ดํ„ฐ Annotation: ํšจ์œจ์ ์ธ ์ด๋ฏธ์ง€ ๋ผ๋ฒจ๋ง ๋„๊ตฌ ์†Œ๊ฐœ

Annotation ์€ ์ด๋ฏธ์ง€, ๋น„๋””์˜ค, ํ…์ŠคํŠธ ๋“ฑ ์‹œ๊ฐ ๋ฐ์ดํ„ฐ๋ฅผ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ ํ•™์Šต์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ๋ผ๋ฒจ(์ •๋ณด)๋ฅผ ์ถ”๊ฐ€ํ•˜๋Š” ์ž‘์—…์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, object detection ๋ฌธ์ œ์—์„œ๋Š” ์ด๋ฏธ์ง€ ๋‚ด ๊ฐ์ฒด์˜ ์œ„์น˜๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” bounding box์™€ ํ•ด๋‹น ๊ฐ์ฒด์˜ ํด๋ž˜์Šค(label)๋ฅผ ์ง€์ •ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์˜ค๋Š˜์€ ์ด๋Ÿฌํ•œ annotation ์ž‘์—…์„ ๋ณด๋‹ค ์ˆ˜์›”ํ•˜๊ฒŒ ์ง„ํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” ๋Œ€ํ‘œ์ ์ธ ๋„๊ตฌ๋“ค์„ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.


1. ์ฃผ์š” Annotation ๋„๊ตฌ

LabelMe


CVAT


Hasty Labeling Tool


LabelImg


2. ์„ ํƒ ์‹œ ๊ณ ๋ ค ์‚ฌํ•ญ


๊ฒฐ๋ก 

์ด๋ฏธ์ง€ annotation์€ AI ๋ชจ๋ธ ํ•™์Šต์˜ ํ’ˆ์งˆ๊ณผ ์„ฑ๋Šฅ์„ ์ขŒ์šฐํ•˜๋Š” ์ค‘์š”ํ•œ ์ „์ฒ˜๋ฆฌ ๋‹จ๊ณ„์ž…๋‹ˆ๋‹ค.

๊ฐ ๋„๊ตฌ์˜ ์žฅ๋‹จ์ ์„ ๊ณ ๋ คํ•˜์—ฌ ํ”„๋กœ์ ํŠธ์™€ ํŒ€์˜ ์š”๊ตฌ์— ๋งž๋Š” annotation ๋„๊ตฌ๋ฅผ ์„ ํƒํ•˜๋ฉด, ๊ณ ํ’ˆ์งˆ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ•˜๋Š” ๋ฐ ํฐ ๋„์›€์ด ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค.


Data-Centric AI: ์ข‹์€ ๋ฐ์ดํ„ฐ๋ฅผ ์œ„ํ•œ Annotation ๊ฐ€์ด๋“œ๋ผ์ธ๊ณผ ์ผ๊ด€์„ฑ ํ‰๊ฐ€

AI ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์—์„œ ๋ฐ์ดํ„ฐ์˜ ํ’ˆ์งˆ์€ ๋ชจ๋ธ ์ž์ฒด๋ณด๋‹ค ํ›จ์”ฌ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค. Data-Centric AI ์ ‘๊ทผ๋ฒ•์—์„œ๋Š” ํŽธํ–ฅ๋˜์ง€ ์•Š๊ณ  ๊ณจ๊ณ ๋ฃจ ๋ถ„ํฌ๋œ, ๊ทธ๋ฆฌ๊ณ  ์ผ์ •ํ•œ ๊ธฐ์ค€์— ๋”ฐ๋ผ ๋ผ๋ฒจ๋ง๋œ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ•˜๋Š” ๊ฒƒ์ด ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ๋ช…ํ™•ํ•˜๊ณ  ๊ฐ„๊ฒฐํ•œ Annotation ๊ฐ€์ด๋“œ๋ผ์ธ์„ ๋งˆ๋ จํ•˜๋Š” ๊ฒƒ์ด ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค.

์ด ํฌ์ŠคํŠธ์—์„œ๋Š” ๋ฐ์ดํ„ฐ annotation ๊ฐ€์ด๋“œ๋ผ์ธ์— ํฌํ•จ๋˜์–ด์•ผ ํ•  ๋‚ด์šฉ๊ณผ, annotation์˜ ํ’ˆ์งˆ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•œ Inter-Annotator Agreement (IAA) ์ง€ํ‘œ๋“ค(Cohen's Kappa, Fleiss' Kappa, Krippendorff's Alpha, ๊ทธ๋ฆฌ๊ณ  ์ตœ๊ทผ KS test)์„ ์‚ดํŽด๋ด…๋‹ˆ๋‹ค.


1. Annotation ๊ฐ€์ด๋“œ๋ผ์ธ ์ž‘์„ฑ

์ข‹์€ ๋ฐ์ดํ„ฐ๋ฅผ ๊ตฌ์ถ•ํ•˜๊ธฐ ์œ„ํ•œ Annotation ๊ฐ€์ด๋“œ๋ผ์ธ์€ ๋ฐ์ดํ„ฐ ํ™•๋ณด ๋ฐ ๋ผ๋ฒจ๋ง ๊ณผ์ •์˜ ํ‘œ์ค€ํ™”๋ฅผ ์œ„ํ•ด ์ž‘์„ฑ๋œ ๋ฌธ์„œ์ž…๋‹ˆ๋‹ค. ๊ฐ€์ด๋“œ๋ผ์ธ์€ ์•„๋ž˜์™€ ๊ฐ™์€ ์š”์†Œ๋“ค์„ ํฌํ•จํ•ด์•ผ ํ•˜๋ฉฐ, ํ•ด์„์˜ ์—ฌ์ง€๊ฐ€ ์—†๋„๋ก ๊ฐ„๊ฒฐํ•˜๊ณ  ๋ช…ํ™•ํ•˜๊ฒŒ ์ž‘์„ฑ๋˜์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

ํ•„์ˆ˜ ํฌํ•จ ๋‚ด์šฉ

์ด์™€ ๊ฐ™์ด ๋ช…ํ™•ํ•œ ๊ฐ€์ด๋“œ๋ผ์ธ์„ ์ž‘์„ฑํ•˜๋ฉด, annotator ๊ฐ„์— ์ผ๊ด€๋œ ์ž‘์—…์ด ์ด๋ฃจ์–ด์ง€๊ณ , ์ข‹์€ ํ’ˆ์งˆ์˜ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ•์— ํฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.


2. Inter-Annotator Agreement (IAA)

Annotation ๋ฐ์ดํ„ฐ์˜ ํ’ˆ์งˆ์€ annotator๋“ค์ด ์–ผ๋งˆ๋‚˜ ์ผ๊ด€๋˜๊ฒŒ ๋ผ๋ฒจ๋งํ•˜๋Š”์ง€์— ๋‹ฌ๋ ค ์žˆ์Šต๋‹ˆ๋‹ค. Inter-Annotator Agreement (IAA) ๋Š” ์—ฌ๋Ÿฌ annotator๊ฐ€ ์ƒ์„ฑํ•œ ๋ผ๋ฒจ์˜ ์ผ์น˜๋„๋ฅผ ํ‰๊ฐ€ํ•˜๋Š” ์ง€ํ‘œ๋กœ, ๋Œ€ํ‘œ์ ์œผ๋กœ Cohen's Kappa, Fleiss' Kappa, Krippendorff's Alpha ๋“ฑ์ด ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

2-1. Cohen's Kappa


2-2. Fleiss' Kappa


2-3. Krippendorff's Alpha


2-4. Kolmogorov-Smirnov (KS) Test

์ตœ๊ทผ์—๋Š” KS Test๋ฅผ ํ™œ์šฉํ•˜์—ฌ annotator๊ฐ€ ์ƒ์„ฑํ•œ ๋ผ๋ฒจ ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ๊นŒ์ง€ ๊ณ ๋ คํ•œ ์ผ์น˜๋„๋ฅผ ํ‰๊ฐ€ํ•˜๋Š” ์—ฐ๊ตฌ๋„ ์ง„ํ–‰๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. KS Test๋Š” ๋‘ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ ๊ฐ„์˜ ์ฐจ์ด๋ฅผ ํ†ต๊ณ„์ ์œผ๋กœ ๊ฒ€์ •ํ•  ์ˆ˜ ์žˆ์–ด, ๋‹จ์ˆœ ํ‰๊ท  ์ผ์น˜๋„๋ณด๋‹ค ๋” ์„ธ๋ฐ€ํ•œ ํ‰๊ฐ€๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.


๊ฒฐ๋ก 

์ข‹์€ ๋ฐ์ดํ„ฐ๋Š” AI ๋ชจ๋ธ ์„ฑ๋Šฅ ํ–ฅ์ƒ์˜ ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ์ ‘๊ทผ๋ฒ•์€ ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ AI ์ „๋žต์—์„œ ์ข‹์€ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ•˜์—ฌ ์ตœ์ข…์ ์œผ๋กœ AI ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๊ทน๋Œ€ํ™”ํ•˜๋Š” ๋ฐ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค.


OCR ๋ฐ์ดํ„ฐ ๊ฐ€๊ณต ์ „๋žต: Augmentation๊ณผ ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ ์ œ์ž‘

OCR (Optical Character Recognition)์€ ์ด๋ฏธ์ง€ ๋‚ด ๊ธ€์ž๋ฅผ ๊ฒ€์ถœํ•˜๊ณ  ์ธ์‹ํ•˜๋Š” ์ค‘์š”ํ•œ ํƒœ์Šคํฌ์ž…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์‹ค์ œ ์„œ๋น„์Šค ํ™˜๊ฒฝ์—์„œ๋Š” ๋ฐ์ดํ„ฐ์…‹์ด ํŽธํ–ฅ๋˜๊ณ  ์–‘์ด ๋ถ€์กฑํ•œ ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. Data-centric AI ์ ‘๊ทผ๋ฒ•์—์„œ ๊ฐ•์กฐํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ, ์ข‹์€ ๋ฐ์ดํ„ฐโ€”์ฆ‰, ํŽธํ–ฅ๋˜์ง€ ์•Š๊ณ  ๊ณจ๊ณ ๋ฃจ ๋ถ„ํฌํ•˜๋ฉฐ ์ผ์ •ํ•œ ๊ธฐ์ค€์œผ๋กœ ๋ผ๋ฒจ๋ง๋œ ๋ฐ์ดํ„ฐโ€”๊ฐ€ AI ์„ฑ๋Šฅ ํ–ฅ์ƒ์˜ ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค.
์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” OCR ํƒœ์Šคํฌ์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€๊ณตํ•˜๋Š” ๋‘ ๊ฐ€์ง€ ์ฃผ์š” ์ „๋žต, ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• (Augmentation) ๊ณผ ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ ์ œ์ž‘ ์— ๋Œ€ํ•ด ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.


1. ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• (Augmentation)

Pasted image 20250312140112.png

1-1. ๋ฐ์ดํ„ฐ ์ฆ๊ฐ•์˜ ํ•„์š”์„ฑ

1-2. OCR ํƒœ์Šคํฌ์—์„œ์˜ Augmentation ์‹œ ์ฃผ์˜ ์‚ฌํ•ญ

์ผ๋ฐ˜์ ์ธ geometric transform (Random Crop, Random Rotation ๋“ฑ)์„ OCR์— ๊ทธ๋Œ€๋กœ ์ ์šฉํ•  ๊ฒฝ์šฐ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

1-3. ํ•ด๊ฒฐ ๋ฐฉ์•ˆ


2. ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ ์ œ์ž‘

2-1. ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ ์ œ์ž‘์˜ ํ•„์š”์„ฑ

2-2. ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ ์ œ์ž‘ ๋„๊ตฌ

๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋„๊ตฌ๋“ค์„ ํ™œ์šฉํ•˜์—ฌ OCR ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ์ œ์ž‘ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

2-3. ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ ํ™œ์šฉ ์ „๋žต

  1. Pre-training:
    ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋กœ ๋ชจ๋ธ์„ ํ•œ ๋ฒˆ ๋” ์‚ฌ์ „ ํ•™์Šต(pre-train)ํ•˜์—ฌ, ๊ธฐ๋ณธ์ ์ธ ํ…์ŠคํŠธ ์ธ์‹ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค.
  2. Fine-tuning:
    ์ดํ›„ ์‹ค์ œ ์ˆ˜์ง‘ํ•œ train dataset์œผ๋กœ ๋ชจ๋ธ์„ fine-tuningํ•˜์—ฌ, ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ์™€ ์‹ค์ œ ๋ฐ์ดํ„ฐ ๊ฐ„์˜ ์ฐจ์ด๋ฅผ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค.

๊ฒฐ๋ก 

OCR ํƒœ์Šคํฌ์—์„œ ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ๊ทน๋Œ€ํ™”ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ข‹์€ ๋ฐ์ดํ„ฐ์˜ ํ™•๋ณด๊ฐ€ ๋งค์šฐ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

์ด์™€ ๊ฐ™์ด, ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ AI ์ ‘๊ทผ๋ฒ•์„ ํ†ตํ•ด ๋ณด๋‹ค ๋†’์€ ํ’ˆ์งˆ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ•˜๋ฉด, OCR ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ์ง€์†์ ์œผ๋กœ ๊ฐœ์„ ํ•˜๊ณ  ์•ˆ์ •์ ์ธ ์„œ๋น„์Šค ์šด์˜์ด ๊ฐ€๋Šฅํ•ด์งˆ ๊ฒƒ์ž…๋‹ˆ๋‹ค.