http://www.kristalinfo.com 


À¯´ÏÄÚµå(Unicode) °ü·Ã C ¾ð¾î source

¿©±â¿¡´Â Á¦°¡ ¸¸µç À¯´ÏÄÚµå °ü·Ã ÇÁ·Î±×·¥µéÀ» °ø°³ÇÕ´Ï´Ù. ÇöÀç °è¼Ó ¼öÁ¤ÁßÀ̱⠶§¹®¿¡ ¼Ò½º°¡ Á» ÁöÀúºÐÇÏ´õ¶óµµ ÀÌÇØÇϽñ⠹ٶø´Ï´Ù. À¯´ÏÄڵ忡 ´ëÇÑ ¼Ò°³´Â »ý·«ÇÏ°Ú½À´Ï´Ù. ¿ÞÂÊ ¸Þ´ºÀÇ »çÀÌÆ® ¸µÅ©³ª À¥ °Ë»öÀ¸·Î À¯´ÏÄڵ忡 ´ëÇÑ ÀÚ¼¼ÇÑ Á¤º¸¸¦ ¾òÀ¸½Ç ¼ö ÀÖ½À´Ï´Ù. Áö±Ý±îÁö ¸¸µé¾îÁø °ÍÀº Äڵ念¿ªº° Çì´õÆÄÀÏ°ú ÇÑÀÚ-ÇÑ±Û º¯È¯ ÇÔ¼ö ¹× ¾îÀýºÐ¸®±â(tokenizer) ÀÔ´Ï´Ù. Á¦°¡ ¸¸µç ¼Ò½º´Â °ø°³µÈ °ÍµéÀ̹ǷÎ, °øÀÍ¿¡ ¹ÝÇÑ ¸ñÀûÀÌ ¾Æ´Ñ °÷¿¡´Â ¾î¶°ÇÑ ÇüÅ·Π»ç¿ëµÇ¾îµµ ÁÁ½À´Ï´Ù.

ÁÖÀÇ: ¿©±â¿¡¼­ Á¦°øµÇ´Â ¸ðµç ¼Ò½º´Â(IconvString Á¦¿Ü) Unicode 3.0¿¡ Á¤ÀÇµÈ Äڵ常À» ó¸®ÇÒ ¼ö ÀÖ½À´Ï´Ù. Á¤È®ÇÏ°Ô ¾ê±âÇÏÀÚ¸é BMPÀÇ 65536ÀÚ¸¸À» ´ë»óÀ¸·Î ÇÏ´Â °ÍÀÔ´Ï´Ù. µû¶ó¼­ À̸¦ ³Ñ¾î°¡´Â ¿µ¿ªÀÇ Äڵ带 ó¸®ÇϱâÀ§Çؼ­´Â Äڵ带 »õ·Î ÀÛ¼ºÇÏ¼Å¾ß ÇÕ´Ï´Ù. unicode.org¿¡¼­ Á¦°øÇÏ´Â ¼Ò½º¸¦ »ç¿ëÇϽñ⠹ٶø´Ï´Ù. ÀÚ¼¼ÇÑ ³»¿ëÀº À¯´ÏÄÚµå °³¿ä ¹®¼­¸¦ ÂüÁ¶ÇϽʽÿÀ.

  • UniCharts.h(À¯´ÏÄڵ念¿ª header)
    Unicode 3.0¿¡ ±â¹ÝÇÏ¿© 41°³ÀÇ ¾ð¾î ¿µ¿ªÀ¸·Î ±¸ºÐÇÏ¿´½À´Ï´Ù.
    [¼³¸í ¹× ¼Ò½º]
  • UTF-8 ¾îÀý ºÐ¸®±â(Tokenizer)
    ¾îÀýºÐ¸®±â´Â ÇöÀç '+'¸¦ Á¦¿ÜÇÑ ¸ðµç °ø¹é¹®ÀÚ, Ư¼ö¹®ÀÚ µî¿¡¼­ ¾îÀý(token)À» ºÐ¸®ÇÕ´Ï´Ù.
    [¼Ò½º, ¾îÀýºÐ¸®½ÃÇè ÇÁ·Î±×·¥, µîµî]
  • À¯´ÏÄÚµå ÇÑÀÚÇѱۺ¯È¯±â
    Unicode 3.0¿¡ ÁöÁ¤µÈ ¾à 3¸¸ÀÚ(27,786ÀÚ)ÀÇ ÇÑÀÚ¸¦ Çѱ۷Πº¯È¯ÇÒ ¼ö ÀÖ½À´Ï´Ù.
    [¼Ò½º, ½ÃÇè ÇÁ·Î±×·¥, Çì´õ µîµî]
  • Äڵ庯ȯ±â(iconv wrapper)/IconvString()
    GNUÀÇ iconv¿¡ ±â¹ÝÇÑ ¹®ÀÚ¿­ÀÇ Äڵ庯ȯ ÇÔ¼öÀÔ´Ï´Ù. GCC¸¦ »ç¿ëÇϽŴٸé libiconv¸¦ ¼³Ä¡ÇÏ½Ç ÇÊ¿ä´Â ¾ø½À´Ï´Ù. ¿äÁò gcc´Â iconv¸¦ ±âº»ÀûÀ¸·Î Áö¿øÇÕ´Ï´Ù. UCS-2ÀÇ °æ¿ì ù¹ø° ±ÛÀÚ¸¸ º¯È¯ÇÏ´Â ¹ö±×°¡ ÀÖÀ¸´Ï ÂüÁ¶ÇϽñ⠹ٶø´Ï´Ù. [¼Ò½º]
  • UCS2/UTF8 Äڵ庯ȯ±â
    UTF8°ú UCS2°£ÀÇ Äڵ庯ȯ ÇÔ¼ö ÀÔ´Ï´Ù. ÀÌ µÎ encoding°£ÀÇ º¯È¯Àº ´Ü¼øÇÑ ºñÆ®¿¬»êÀ» ÇÏ¸é µÇ¹Ç·Î ¼Ò½º´Â ¸Å¿ì °£´ÜÇÕ´Ï´Ù. µÎ Äڵ尣ÀÇ º¯È¯ ½ÃÇèÀº UTF8À» Àо UCS2·Î º¯È¯ÇÑ ´ÙÀ½ À̸¦ ´Ù½Ã UTF8·Î ¹Ù²Ù´Â °ÍÀÔ´Ï´Ù. °á°ú°¡ µ¿ÀÏÇϸé Àß ÀÛµ¿ÇÏ´Â °ÍÀÌ°ÚÁÒ? Unicode¸¦ UTF-8·Î ÀÎÄÚµùÇÏ´Â ¹æ½ÄÀº À¥¿¡¼­ °Ë»öÇؼ­ ã¾Æ º¸½Ã±â ¹Ù¶ø´Ï´Ù :-)
    [¼Ò½º] [º¯È¯ ½ÃÇè]
  • ¾îÀýºÐ¸® ¹× ÇÑÀÚÇѱۺ¯È¯ ½ÃÇè CGIµéÀº UTF-8·Î ÀÎÄÚµùµÈ ¹®ÀÚ¿­À» ±â¹ÝÀ¸·Î ÀÛ¼ºµÇ¾ú½À´Ï´Ù. ½ÃÇè¿¡ »ç¿ëÇÑ ÆÄÀÏÀº utf8sample.txt ÆÄÀÏÀÔ´Ï´Ù. °ü¸®»ó ºÒÆíÇؼ­ tarµîÀ¸·Î ¹­Àº ÆÄÀÏÀº Á¦°øÇÏÁö ¾Ê½À´Ï´Ù. ÇÊ¿äÇϽøé, ¿ÞÂÊ ¸Þ´º¿¡¼­ ÇÊ¿äÇÑ ¼Ò½º¸¦ ¹Þ¾Æ°¡½Ã±â ¹Ù¶ø´Ï´Ù.

    ÇöÀç À¯´ÏÄڵ忡 ´ëÇÑ ÀÔ¹®¼­¸¦ ÀÛ¼ºÇÏ°í ÀÖ½À´Ï´Ù. ÂüÁ¶ÇϽñ⠹ٶø´Ï´Ù. ±×¸®°í ÀÌ ÀÛ¾÷ÀÌ ³¡³ª´Â ´ë·Î ÀÌ ÆäÀÌÁö¸¦ ´ë´ëÀûÀ¸·Î Á¤¸®ÇÒ °èȹÀÔ´Ï´Ù.

    UTF-8°ú UCS-2°£ÀÇ º¯È¯ ¼Ò½º´Â ¹æÁØ¿µ´ÔÀÇ ¼Ò½º¸¦ Âü°íÇÏ¿© ¸¸µé¾ú´Âµ¥, Áö±ÝÀº ¹æÁØ¿µ´ÔÀÇ È¨ÆäÀÌÁö¿¡¼­ ÇÑ±Û Ã³¸® ºÎºÐÀ» ãÀ» ¼ö°¡ ¾ø±º¿ä. ¾î·µç, ¹æÁØ¿µ´Ô²² Áö¸éÀ» ºô¾î °¨»çµå¸³´Ï´Ù. ±×¸®°í ÀÌ °÷Àº °è¼Ó ÀÛ¾÷ÁßÀ̹ǷΠ³»¿ëÀÌ ´Þ¶óÁú ¼ö°¡ ÀÖ½À´Ï´Ù. Ȥ½Ã Àǹ®³ª´Â °ÍÀ̳ª À߸øµÈ °ÍÀÌ ÀÖÀ¸¸é ¿ÞÂÊ ¸Þ´º¿¡ ÀÖ´Â Á¦ ¿¬¶ôó·Î ¸ÞÀÏ ÁֽʽÿÀ. -- ±èÁø¼÷