UPDATE : 2024.10.22 È­ 17:09
»ó´Ü¿©¹é
HOME ƯÁý ½ÅÁ¦Ç°
¾÷½ºÅ×ÀÌÁö, Â÷¼¼´ë OCR¸ðµ¨ Document Parse °ø°³Á¤È®¼º, ¼Óµµ, »ç¿ë¼º µî ¸ðµç ¿ä¼Ò¿¡¼­ ÇöÁ¸ÇÏ´Â °¡Àå ¿ì¼öÇÑ AI ¹®¼­Ã³¸® ¸ðµ¨
±èÁ¤È¯ ±âÀÚ | ½ÂÀÎ 2024.10.17 09:20|(1È£)

¾÷½ºÅ×ÀÌÁö°¡ °¡Àå Á¤È®ÇÏ°í ºü¸£°Ô ¹®¼­¸¦ ºÐ¼®ÇÏ¿© ´ë±Ô¸ð ¾ð¾î ¸ðµ¨(LLM)·Î 󸮰¡ °¡´ÉÇÑ Â÷¼¼´ë OCR ¸ðµ¨ Document Parse¸¦ °ø°³Çß´Ù.

Document Parse ±â´É ¼³¸í À̹ÌÁö

 

Document Parse´Â ±âÁ¸ OCR ±â¼ú¿¡¼­ ¸íÈ®ÇÑ ÀνÄÀÌ ¾î·Á¿ü´ø ¿©·¯ ¿­ÀÇ ·¹À̾ƿôÀ̳ª Å×ÀÌºí µîÀ» Æ÷ÇÔÇÑ º¹ÀâÇÑ ÇüÅÂÀÇ ¹®¼­¿¡¼­µµ °¢ ±¸Á¶¿Í ÅؽºÆ® Á¤º¸¸¦ Á¤È®È÷ ºÐ¼®ÇÏ¿© µ¥ÀÌÅÍ ÀÚ»êÈ­¸¦ °¡´ÉÇÏ°Ô ÇÑ´Ù. ¾î¶² Çü½ÄÀÇ ¹®¼­µµ HTML°ú °°Àº ±¸Á¶È­µÈ ÅؽºÆ® Çü½ÄÀ¸·Î ÀüȯÇØ ±â¾÷À̳ª ±â°ü¿¡¼­ ½ÇÁ¦ LLM È°¿ë ½Ã ¹Ù·Î Àû¿ëÇÒ ¼ö ÀÖ´Ù. ¾÷½ºÅ×ÀÌÁö´Â Document Parse¸¦ ÅëÇØ RAG ½Ã½ºÅÛ ¼º´É°ú LLMÀÇ ÀÀ´ä Á¤È®µµ¸¦ °áÁ¤ÇÏ´Â ÇÙ½É ¿ä¼ÒÀÎ µ¥ÀÌÅÍ Àüó¸® °úÁ¤¿¡¼­ÀÇ Á¤È®¼º»Ó¸¸ ¾Æ´Ï¶ó ¼Óµµ¿Í »ç¿ë¼º Ãø¸é¿¡¼­µµ ÇöÀç °¡Àå Áøº¸ÇÑ ÇüÅÂÀÇ ¹®¼­ ó¸® ±â¼úÀ» ¼±º¸ÀÌ°Ô µÆ´Ù.

 

¾÷½ºÅ×ÀÌÁö´Â °ü·Ã ±â¼úÀÇ ¼º´É ÃøÁ¤¿¡ Åë¿ëµÉ ¼ö ÀÖ´Â °´°üÀû ±âÁØ ¸¶·ÃÀ» À§ÇØ ¹®¼­ ±¸Á¶ ºÐ¼® º¥Ä¡¸¶Å©ÀΠDP-Bench¸¦ ÇÔ²² °ø°³Çß´Ù.

 

°á°ú¿¡ µû¸£¸é  Document Parse ´Â ·¹À̾ƿô ¹× Å×ÀÌºí ±¸Á¶, ÄÜÅÙÃ÷ ºÐ¼® µî Á¤È®¼ºÀ» ÃøÁ¤ÇÏ´Â ¸ðµç ÁöÇ¥¿¡¼­ AWS¿Í MS ¸¦ Æ÷ÇÔÇÑ ºòÅ×Å© 5°³»çÀÇ °ü·Ã ¼­ºñ½º¿Í ºñ±³ÇØ 5% ÀÌ»ó ³ôÀº Á¡¼ö¸¦ ¹Þ¾Ò´Ù. ¼Óµµ¸é¿¡¼­µµ Document Parse ´Â 1ºÐ¿¡ 100ÀåÀ» ó¸®ÇÏ¿© °°Àº ±âÁØÀ» Àû¿ëÇÑ AWS Texttract¿Í´Â 10¹è, LamaParse º¸´Ù´Â 5¹è °¡·® ºü¸¥ ´É·ÂÀ» º¸¿´´Ù.

 

¶ÇÇÑ DOCX, PDF, PPTX, PNG µî ¾÷¹«¿¡ »ç¿ëÇϴ 9Á¾ÀÇ ¹®¼­ 󸮻Ӹ¸ ¾Æ´Ï¶ó ¼ö½Ä ÀÎ½Ä ¹× À̹ÌÁö ÃßÃâ°ú °°Àº »õ·Î¿î ±â´ÉÀ» Ãß°¡Çß´Ù. HTML ¿Ü¿¡µµ Çì´õ ¹× Å×ÀÌºí ¿ä¼Ò¸¦ ¸¶Å©´Ù¿î Çü½ÄÀ¸·Î Á¦°øÇÏ¿© LLM »ç¿ëÀÚ°¡ ÀÔ·Â ¹®¼­ÀÇ ÅäÅ« Å©±â¸¦ ÁÙÀÏ ¼ö ÀÖ´Ù´Â °Í ¿ª½Ã Å« °­Á¡ÀÌ´Ù.

 

¾÷½ºÅ×ÀÌÁö´Â 2023³â, °ø½ÄÀûÀ¸·Î OCR ¼­ºñ½º¸¦ ¼±º¸ÀÎ Á÷ÈÄ °°Àº ÇØ ±Û·Î¹ú ÃÖ°í ±ÇÀ§ÀΠAI OCR °æÁø´ëȸ ICDAR¿¡¼­ ¾Æ¸¶Á¸°ú ¿£ºñµð¾Æ µîÀÇ ºòÅ×Å©¸¦ Á¦Ä¡°í ¾ÐµµÀûÀΠ1À§¸¦ Â÷ÁöÇÑ ¹Ù ÀÖ´Ù. ¾÷±×·¹À̵åµÈ ±â¼ú·ÂÀ» ¹ÙÅÁÀ¸·Î º¸¾ÈÀÌ ÇʼöÀûÀÎ ±ÝÀ¶±Ç ¹× Á¦Á¶¾÷ ÁÖ¿ä ±â¾÷µéÀ» °í°´À¸·Î È®º¸ÇÏ°í ÀÖÀ¸¸ç, ÇâÈÄ ´ë±Ô¸ð ¹®¼­ÀÇ µðÁöÅÐ ÀüȯÀ» ÅëÇØ LLM È°¿ë ¿¹Á¤ÀÎ Àü »ê¾÷ ¿µ¿ª¿¡¼­ À¯¿ëÇÏ°Ô È°¿ëµÉ Àü¸ÁÀÌ´Ù.

 

¾÷½ºÅ×ÀÌÁö ±è¼ºÈÆ ´ëÇ¥´Â “Document Parse ´Â °¢ ±â¾÷ÀÌ °¡Áø ±âÁ¸ ¹®¼­¸¦ °¡Àå Á¤È®ÇÏ°Ô ÀÚ»êÈ­½ÃÄÑ LLMÀ» ½ÇÁ¦ ¾÷¹«¿¡ Áï°¢ È¿À²ÀûÀ¸·Î Àû¿ëÇÒ ¼ö ÀÖµµ·Ï ¸¸µå´Â ÃÖÀûÀÇ µµ±¸”¶ó¸ç, “´Ù¾çÇÑ ºñÁî´Ï½º¿¡¼­ È°¿ëµÇ¾î ¾÷¹« Çõ½ÅÀ» Çö½ÇÈ­ÇÒ °Í”À̶ó°í ¹àÇû´Ù.

±èÁ¤È¯ ±âÀÚ  webmaster@jybtv.kr

<ÀúÀÛ±ÇÀÚ © ÀÚÀ¯¹æ¼Û, ¹«´Ü ÀüÀç ¹× Àç¹èÆ÷ ±ÝÁö>

±èÁ¤È¯ ±âÀÚÀÇ ´Ù¸¥±â»ç º¸±â
iconÀαâ±â»ç
±â»ç ´ñ±Û 0°³
Àüüº¸±â
ù¹ø° ´ñ±ÛÀ» ³²°ÜÁÖ¼¼¿ä.
½Å¹®»ç¼Ò°³¤ý±â»çÁ¦º¸¤ý±¤°í¹®ÀǤýºÒÆí½Å°í¤ý°³ÀÎÁ¤º¸Ãë±Þ¹æħ¤ýÀ̸ÞÀϹ«´Ü¼öÁý°ÅºÎ ¤ýû¼Ò³âº¸È£Á¤Ã¥
¹ßÇàó:ÀÚÀ¯¹æ¼Û  |  µî·Ï¹øÈ£:°æ³² ¾Æ 02598 |  µî·ÏÀÏ:2007³â 11¿ù 23ÀÏ |  Ã»¼Ò³âº¸È£Ã¥ÀÓÀÚ : ½ÉÈï¼·
¹ßÇà/ÆíÁýÀÎ: ÀÌ¿µ¹è webmaster@jybtv.kr  |  ÆíÁý±¹Àå: ÀÌÁ¤º¹
°æ³² °ÅÁ¦½Ã ¿ÁÆ÷ ¼º¾È·Î 15. 102µ¿ 1302È£ (¹ÌÁø ¶ó¸Þ¸£Æ縮½º)

¼­¿ï½Ã ¼ººÏ±¸ ¾È¾Ï·Î 1±æ 11,7Ãþ(º¸¼ººôµù)  |  ´ëÇ¥ÀüÈ­: (055) 688.9188 / 010.2405.8983
º»»çÀÌÆ®ÀÇ °ÔÀçµÈ ¸ðµç ±â»çÀÇ ÆDZÇÀº ÀÚÀ¯¹æ¼ÛÀÌ º¸À¯ÇÏ¸ç ¹ßÇàÀÎÀÇ »çÀü½ÂÀÎ ¾øÀÌ´Â ±â»ç¿Í »çÁøÀÇ ¹«´Ü¤ýÀüÀç º¹»ç¸¦ ±ÝÇÕ´Ï´Ù.
Copyright © 2024 ÀÚÀ¯¹æ¼Û. All rights reserved.
Back to Top