¾÷½ºÅ×ÀÌÁö(´ëÇ¥ ±è¼ºÈÆ)´Â Àڻ簡 °³¹ßÇÑ ³ëÄÚµå LLM Á¾ÇÕ Æò°¡ Ç÷§Æû ‘À̺§¹ö½º(Evalverse)’¸¦ ¹«·á·Î °ø°³ÇÑ´Ù°í 3ÀÏ ¹àÇû´Ù.
¿ÀǼҽº ÇüÅ·Π±êÇãºê(GitHub)¿¡ °ø°³µÅ ´©±¸³ª ½±°Ô È°¿ëÇÒ ¼ö ÀÖ´Ù.
Åë»ó LLM ¼º´É Æò°¡¿¡´Â ƯÁ¤ µ¥ÀÌÅͼÂÀ» ±âÁØÀ¸·Î ÀÀ´ä Á¤È®µµ¸¦ ±â·ÏÇÑ ‘º¥Ä¡¸¶Å©’ ÁöÇ¥¸¦ È°¿ëÇÑ´Ù. ¸ðµ¨ÀÇ Ãß·Ð, »ó½Ä, ¾ð¾î ÀÌÇØ ´É·Â µî 6°¡Áö ºÎ¹®À» ÃøÁ¤ÇÏ´Â Çã±ëÆäÀ̽º ‘H6’ ÁöÇ¥¸¦ Æ÷ÇÔ, ´ëÈ ´É·Â ÁöÇ¥ ‘MT-bench’, °¨¼º Æò°¡ ÁöÇ¥ ‘EQ-bench’, ¹× Áö½Ã ÀÌÇà ´É·Â ÁöÇ¥ ‘IFEval’ µîÀÌ ÁÖ¿ä º¥Ä¡¸¶Å©·Î ²ÅÈù´Ù.
ÀÌ¿¡ ¾÷½ºÅ×ÀÌÁö´Â ÀÌ·¯ÇÑ ÁÖ¿ä º¥Ä¡¸¶Å©¸¦ ÇÑ ±ºµ¥ ÅëÇÕÇØ, ¾ð¾î¸ðµ¨ ¼º´ÉÀ» Á¾ÇÕÀûÀ¸·Î Å×½ºÆ®ÇÒ ¼ö ÀÖ´Â ÀÚü Æò°¡ Ç÷§ÆûÀ» °³¹ßÇß´Ù. ±âÁ¸¿¡´Â ƯÁ¤ º¥Ä¡¸¶Å©¸¦ Å×½ºÆ®ÇÏ·Á¸é ÇØ´ç Ç÷§Æû¿¡ ¸ðµ¨À» Á¦ÃâÇØ¾ß ÇÏ´Â ¹ø°Å·Î¿òÀÌ ÀÖ¾úÁö¸¸, À̺§¹ö½º¸¦ È°¿ëÇÏ¸é ¿©·¯ º¥Ä¡¸¶Å© Å×½ºÆ®¸¦ µ¿½Ã¿¡ ÁøÇàÇÒ ¼ö ÀÖ´Ù.
¾÷½ºÅ×ÀÌÁö À̺§¹ö½º´Â ¾÷¹«¿ë ¸Þ½ÅÀú ‘½½·¢’¿¡ API 꺿 ÇüÅ·Π¿¬µ¿ÇØ »ç¿ë¼ºÀ» È®´ëÇß´Ù. ƯÈ÷, ½½·¢ ¾È¿¡¼ À̺§¹ö½º 꺿°ú 1:1 ´ëÈ(DM)¸¦ ÅëÇØ ¸ðµç Æò°¡ °úÁ¤À» °£¼ÒÈÇÑ °ÍÀÌ Æ¯Â¡ÀÌ´Ù. ÀÌ¿ëÀÚµéÀº “È£Ãâ”, “Æò°¡” µî äÆÃâ¿¡ ´Ü 2°³ÀÇ ¸í·É¾î¸¸ ÀÔ·ÂÇÏ¸é ¹Ù·Î ¿øÇÏ´Â ¸ðµ¨À» È£ÃâÇØ Å×½ºÆ®ÇÒ ¼ö ÀÖÀ¸¸ç, º¥Ä¡¸¶Å© º° Á¡¼ö¿¡ ´ëÇÑ Á¾ÇÕ ¸®Æ÷Æ®±îÁö È®ÀÎÇÒ ¼ö ÀÖ¾î ¸ðµ¨ °£ ºñ±³ Æò°¡µµ ¿ëÀÌÇÏ´Ù.
À̹ø ¾÷½ºÅ×ÀÌÁöÀÇ À̺§¹ö½º ¿ÀǼҽº °ø°³´Â »ý¼ºÇü AI »ýÅ°èÀÇ ¹ßÀü°ú »ó»ýÀ» À§ÇÑ ³ë·ÂÀÇ ÀÏȯÀÌ´Ù. ¾÷½ºÅ×ÀÌÁö´Â Çѱ¹¾î LLM Æò°¡ Ç¥ÁØÀ» Á¦½ÃÇÑ ‘Open Ko-LLM ¸®´õº¸µå’ ±¸Ãà, º¹ÀâÇÑ µ¥ÀÌÅÍ Àüó¸® ±â¼úÀ» Àü¸é °ø°³ÇÑ ‘µ¥ÀÌÅ͹ö½º(Dataverse)’¿¡ À̾î Æò°¡ Ç÷§Æû±îÁö Àü¸é °ø°³ÇÔÀ¸·Î½á µ¶º¸ÀûÀÎ ¿ÀǼҽº ¼¼°è°üÀ» ¿Ï¼ºÇß´Ù.
¾÷½ºÅ×ÀÌÁö ±è¼ºÈÆ ´ëÇ¥´Â “´©±¸³ª ÀÚ½ÅÀÌ °³¹ßÇÑ LLMÀ» ½±°Ô Å×½ºÆ®ÇØ º¼ ¼ö ÀÖ´Â À̺§¹ö½º Ç÷§ÆûÀ» ¹«·á·Î °ø°³ÇÏ°Ô µÇ¾î ±â»Ú´Ù”¶ó¸ç “¾ÕÀ¸·Î ¾÷½ºÅ×ÀÌÁö´Â ±Û·Î¹ú »ý¼ºÇü AI ½ÃÀåÀÇ ¼±µÎÁÖÀڷμ LLM »ýÅÂ°è ¹ßÀü°ú È®»êÀ» À§ÇØ ´Ù¾çÇÑ ³ë·ÂÀ» Áö¼ÓÇØ ³ª°¥ °Í”À̶ó°í ¹àÇû´Ù.
½ÅÇÑÁØ ±âÀÚ webmaster@jybtv.kr
<ÀúÀÛ±ÇÀÚ © ÀÚÀ¯¹æ¼Û, ¹«´Ü ÀüÀç ¹× Àç¹èÆ÷ ±ÝÁö>