ಯುನಿಕೋಡ್: ಪರಿಷ್ಕರಣೆಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸ

ವಿಕಿಪೀಡಿಯದಿಂದ, ಇದು ಮುಕ್ತ ಹಾಗೂ ಸ್ವತಂತ್ರ ವಿಶ್ವಕೋಶ
Content deleted Content added
ಚು r2.7.3) (Robot: Adding ks:یونیکوڈ
ಚು r2.7.3) (Robot: Adding kk:Юникод
೧೦೭ ನೇ ಸಾಲು: ೧೦೭ ನೇ ಸಾಲು:
[[jv:Unicode]]
[[jv:Unicode]]
[[ka:უნიკოდი]]
[[ka:უნიკოდი]]
[[kk:Юникод]]
[[ko:유니코드]]
[[ko:유니코드]]
[[ks:یونیکوڈ]]
[[ks:یونیکوڈ]]

೦೨:೨೯, ೩೦ ಡಿಸೆಂಬರ್ ೨೦೧೨ ನಂತೆ ಪರಿಷ್ಕರಣೆ

ಯುನಿಕೋಡ್
ಶ್ರೇಣಿ
ಯುನಿಕೋಡ್
ಯುನಿಕೋಡ್ ಕನ್ಸಾರ್ಟಿಯಮ್
UCS
ಯುಟಿಎಫ್ - ೭
ಯುಟಿಎಫ್ - ೮
ಯುಟಿಎಫ್ - ೧೬
ಯುಟಿಎಫ್ - ೩೨
SCSU
Punycode
Bi-directional text
BOM
Han unification
ಯುನಿಕೋಡ್ ಮತ್ತು ಹೆಚ್.ಟಿ.ಎಂ.ಎಲ್

ಗಣಕೀಕರಣದಲ್ಲಿ, ಯುನಿಕೋಡ್ ಎಂದರೆ ಒಂದು ಅಂತರರಾಷ್ತ್ರೀಯ ನಿರ್ದಿಷ್ಟಮಾನ. ಇದರ ಧ್ಯೇಯ - ಎಲ್ಲಾ ಮಾನವ ಭಾಷೆಗಳಲ್ಲಿ ಬೇಕಾಗುವ ಪ್ರತಿಯೊಂದು ಅಕ್ಷರಕ್ಕೂ ಆಕರದಲ್ಲಿ ಒಂದು ಅಪೂರ್ವ (Unique) ಇಂಟಿಜರ್ ಸಂಖ್ಯೆಯನ್ನು ಕೊಡುವುದು. ಈ ಕೋಡ್ ಸಂಖ್ಯೆಯನ್ನು ಕೋಡ್ ಪಾಯಿಂಟ್ ಎನ್ನುತ್ತಾರೆ.

ಬಹಳಷ್ಟು ಟೀಕೆ, ಸಂಧಿಗ್ಧತೆ ಹಾಗೂ ತಾಂತ್ರಿಕ ತೊಂದರೆಗಳಿದ್ದರೂ ಸಹ ತಂತ್ರಾಂಶಗಳ ಅಂತರರಾಷ್ಟ್ರೀಯಕತೆಯಲ್ಲಿ (internationalization) ಪ್ರಬಲ ಎನ್ಕೋಡಿಂಗ್ ವಿಧಾನವಾಗಿ ಹೊರಹೊಮ್ಮಿದೆ. ಯುನಿಕ್ಸ್ ಮತ್ತು ಸಮಾನವಾದ ಗ್ನು/ಲಿನಕ್ಸ್, ಬಿ ಎಸ್ ಡಿ, ಹಾಗೂ ಮ್ಯಾಕ್ ಓಎಸ್ ಎಕ್ಸ್ ಇವೇ ಮೊದಲಾದ ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್ ಗಳು ಯುನಿಕೋಡನ್ನು (ಯು ಟಿ ಎಫ್ -೮ ರ ರೂಪದಲ್ಲಿ) ಅಂಗೀಕರಿಸಿವೆ. 'ಮೈಕ್ರೊಸಾಫ್ಟ್'ನ ವಿಂಡೋಸ್ ಶ್ರೇಣಿಯ ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್ ಗಳು ಯು ಟಿ ಎಫ್ - ೧೬ನ್ನು ಬಹಳವಾಗಿ ಉಪಯೋಗಿಸುತ್ತವೆ.

ಮುನ್ನುಡಿ

ಯುನಿಕೋಡ್ ಎಂಬ ವಿಶ್ವಸಂಕೇತ


ಅಂಗಡಿಗೆ ಹೋಗಿ ಒಂದು ಬಲ್ಬ್ ಬೇಕೆಂದು ಕೇಳಿ ನೋಡಿ. ಅಂಗಡಿಯಾತ ನಿಮ್ಮ ಮನೆಯಲ್ಲಿ ಯಾವ ಕಂಪೆನಿಯ ಹೋಲ್ಡರ್ ಇದೆ ಎಂದು ಕೇಳುವುದಿಲ್ಲ. ಯಾಕೆಂದರೆ ಯಾವ ಕಂಪೆನಿಯ ಹೋಲ್ಡರ್ ಆದರೇನು, ಎಲ್ಲ ಬಲ್ಬ್‌ಗಳು ಎಲ್ಲ ಹೋಲ್ಡರ್‌ಗಳಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತವೆ. ಈಗ ಕನ್ನಡ ಮತ್ತು ಗಣಕ ಕ್ಷೇತ್ರಕ್ಕೆ ಬನ್ನಿ. ನಿಮ್ಮ ಮನೆಯ ಗಣಕದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿ ಫ್ಲಾಪಿಯಲ್ಲಿ ತುಂಬಿಸಿ ಅದರ ಲೇಸರ್ ಮುದ್ರಣಕ್ಕೆ ಯಾವುದಾದರು ಡಿ.ಟಿ.ಪಿ. ಕೇಂದ್ರಕ್ಕೆ ತೆಗೆದುಕೊಂದು ಹೋಗಿ. ಆತ ನಿಮ್ಮನ್ನು ಖಂಡಿತವಾಗಿ ಕೇಳುವ ಪ್ರಶ್ನೆಯೆಂದರೆ "ನೀವು ಯಾವ ತಂತ್ರಾಂಶ ತಯಾರಿಸಿ ಕಡತವನ್ನು ತಯಾರು ಮಾಡಿದ್ದೀರಾ?". ನೀವು ಬಳಸಿದ ತಂತ್ರಾಂಶ ಆತನ ಗಣಕದಲ್ಲಿ ಇಲ್ಲದಿರುವ ಸಂಭವವೇ ಹೆಚ್ಚು. ಕನ್ನಡದ ಯಾವುದೇ ತಂತ್ರಾಂಶವನ್ನು ಬಳಸಿ ತಯಾರಿಸಿದ ಕಡತವನ್ನು ಕನ್ನಡದ ಯಾವುದೇ ತಂತ್ರಾಂಶದಲ್ಲಿ ಓದಲು ಸಾಧ್ಯವಿರಬೇಕಲ್ಲವೇ, ಇಂಗ್ಲೀಷ್ ಭಾಷೆಯಲ್ಲಿದ್ದಂತೆ, ಎಂದು ನಿಮಗೆ ಅನ್ನಿಸಿರಬೇಕಲ್ಲವೇ? ಆದರೆ ನಿಜ ಪರಿಸ್ಥಿತಿ ಹಾಗೇನೂ ಇಲ್ಲ.

ಕನ್ನಡದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿ ಜಪಾನಿಗೆ ಕಳುಹಿಸಿದರೆ ಅವರಿಗೆ ಇದು ಕನ್ನಡ ಭಾಷೆಯಲ್ಲಿದೆ ಎಂದು ತಿಳಿಯುವುದು ಹೇಗೆ? ವಿಶ್ವಕ್ಕೆಲ್ಲ ಒಂದೇ ಸಂಕೇತ ವಿಧಾನ ಇದ್ದರೆ ಒಳ್ಳೆಯದಲ್ಲವೇ? ಇದುವೇ ಯುನಿಕೋಡ್.

ನಾವು ಇಂಗ್ಲೀಷ್ ನಲ್ಲಿ ಮಾತನಾಡುವಾಗ ಕನ್ನಡದಲ್ಲಿ ಆಲೋಚಿಸಿ ಇಂಗ್ಲೀಷ್ ಗೆ ಅನುವಾದಿಸಿ ಮಾತನಾಡುತ್ತೇವಲ್ಲವೇ? ಗಣಕಗಳು ಕನ್ನಡದಲ್ಲಿ ವ್ಯವಹರಿಸುವುದು ಸುಮಾರಾಗಿ ಹಾಗೆಯೇ. ಮಾಹಿತಿಯ ಸಂಗ್ರಹಣೆಗೆ ಒಂದು ಸಂಕೇತ, ತೋರಿಸಲು ಇನ್ನೊಂದು ಸಂಕೇತ. ಮಾಹಿತಿಯ ಸಂಗ್ರಹಣೆಗೆ ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೆ ಬಳಸುತ್ತಿರುವುದು ಇಸ್ಕಿಯನ್ನು (ISCII = Indian Script Code for Information Interchange). ಇಸ್ಕಿಯು ಆಸ್ಕಿಯನ್ನು (ASCII = American Standards Code for Information Interchange) ಆಧರಿಸಿದೆ. ಇವುಗಳನ್ನು ಸ್ವಲ್ಪ ವಿಮರ್ಶಿಸೋಣ.

ಆಸ್ಕಿ ಮತ್ತು ಇಸ್ಕಿ

ಆಸ್ಕಿ ೮ ಬಿಟ್‌ಗಳನ್ನು ಹೊಂದಿದೆ. ಗಣಕದಲ್ಲಿ ಮಾಹಿತಿಯ ಒಂದು ತುಣಕೇ ಬಿಟ್ (bit = binary digit). ವಿದ್ಯುತ್ತಿಗೆ ಎರಡೇ ಸಾಧ್ಯತೆಗಳಿರುವುದು -ಇದೆ ಅಥವಾ ಇಲ್ಲ. ವಿದ್ಯುತ್ ಇದೆ ಎಂದರೆ "ಒಂದು", ಇಲ್ಲ ಎಂದರೆ "ಸೊನ್ನೆ" ಎಂದು ತೆಗೆದುಕೊಂಡರೆ ಒಂದು ಬಿಟ್‌ನಲ್ಲಿ ೦ ಅಥವಾ ೧ ಅನ್ನು ಸೂಚಿಸಬಹದು. ಒಂದು ಅಕ್ಷರವನ್ನು ಶೇಖರಿಸಲು ಎರಡು ಬಿಟ್‌ಗಳನ್ನು ತೆಗೆದುಕೊಂಡರೆ ಒಟ್ಟು ನಾಲ್ಕು ಸಾಧ್ಯತೆಗಳಿವೆ -೦೦, ೦೧, ೧೦ ಮತ್ತು ೧೧ (ದ್ವಿಮಾನ). ಇವು ದಶಮಾನ ಪದ್ಧತಿಯಲ್ಲಿ ೦, ೧, ೨, ೩ ಆಗುತ್ತವೆ. ಆಸ್ಕಿ ಮತ್ತು ಇಸ್ಕಿಗಳು ೮ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುತ್ತವೆ. ೮ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವ ಯಾವುದೇ ಸಂಕೇತೀಕರಣ ವಿಧಾನವು ೨೫೬ (೨ = ೨೫೬) ಅಕ್ಷರಗಳನ್ನು ಮಾತ್ರವೇ ಹೊಂದಿರಬಲ್ಲುದು. ಕನ್ನಡ ಭಾಷೆಯಲ್ಲಿ ೪೯ ಅಕ್ಷರಗಳಿವೆ. ಜೊತೆಗೆ ಸ್ವರ ಚಿಹ್ನೆಗಳಿವೆ. ಇಂಗ್ಲೀಷ್ ಭಾಷೆಯಲ್ಲಿ ೨೬ (ಮತ್ತು ೨೬) ಅಕ್ಷರಗಳಿವೆ. ಬರೆವಣಿಗೆಯ ಚಿಹ್ನೆ, ಅಂಕೆ, ಇತ್ಯಾದಿಗಳೆಲ್ಲ ಒಟ್ಟು ಸೇರಿದರೂ ೨೫೬ಕ್ಕಿಂತ ಕಡಿಮೆಯೇ. ಹಾಗಿದ್ದಲ್ಲಿ ೨೫೬ ಸಂಕೇತಗಳು ಸಾಕಲ್ಲವೇ? ಇಸ್ಕಿಯಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸುವಾಗ ಇಂಗ್ಲೀಷ್ ಮತ್ತು ಒಂದು ಭಾರತೀಯ ಭಾಷೆಯನ್ನು ಬಳಸಬಹುದು. ಅಂದರೆ ಕನ್ನಡ, ಹಿಂದಿ, ತಮಿಳು, ತೆಲುಗು, ಹೀಗೆ ಹಲವು ಭಾಷೆಗಳನ್ನು ಒಂದೇ ಕಡತದಲ್ಲಿ ಸಂಗ್ರಹಿಸುವುದು ಅಸಾಧ್ಯ.

ಇಸ್ಕಿಯಲ್ಲಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಗಳಿಗೆ ಒಂದೇ ಸಂಕೇತ ನೀಡಲಾಗಿದೆ. ಅಂದರೆ ಕನ್ನಡದ "ಕ" ಮತ್ತು ಹಿಂದಿಯ "क" ಎರಡಕ್ಕೂ ಒಂದೇ ಸಂಕೇತ ಇದೆ. ಇದರಿಂದ ಕೆಲವೊಮ್ಮೆ ಲಾಭವೂ ಇದೆ. ಒಂದು ಟೆಲಿಫೋನ್ ಡೈರೆಕ್ಟರಿಯನ್ನು ಕನ್ನಡ ಮತ್ತು ಹಿಂದಿ ಭಾಷೆಯಲ್ಲಿ ತಯಾರಿಸಬೇಕಾದರೆ, ಕನ್ನಡದಲ್ಲಿ ಬೆರಳಚ್ಚು ಮಾಡಿ, ಇಸ್ಕಿಯಲ್ಲಿ ಶೇಖರಿಸಿ, ಅದನ್ನು ಹಿಂದಿಯ ಫಾಂಟ್‌ನ ಸಂಕೇತಗಳಿಗೆ ಪರಿವರ್ತಿಸಿದರೆ ಸಾಕು. ಆದರೆ ಸಮಸ್ಯೆ ಇರುವುದು ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯಲ್ಲಿ. ಕನ್ನಡ, ತೆಲುಗು, ಮರಾಠಿ, ಹಿಂದಿ, ಹೀಗೆ ಎಲ್ಲ ಭಾಷೆಗಳಿಗೂ ಒಂದೆ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸೂತ್ರ ಕಲ್ಪಿಸಲಾಗಿದೆ. ಕನ್ನಡ ಮತ್ತು ಹಿಂದಿಯ ಸೂತ್ರ ಒಂದೇ ಆಗಿರಬೇಕಾಗಿಲ್ಲ. ಉದಾಹರಣೆಗೆ ಇಸ್ಕಿಯಲ್ಲಿರುವ ಅಕಾರಾದಿ ವಿಂಗಡಣೆ -"ಯ, ರ ಲ, ಳ, ವ, ಶ, ಷ, ಸ, ಹ". ಕನ್ನಡದಲ್ಲಿ ಇದು "ಯ, ರ, ಲ, ವ, ಶ, ಷ, ಸ, ಹ, ಳ" ಆಗಬೇಕು.

ಯುನಿಕೋಡ್

ಪ್ರಪಂಚದ ಮಟ್ಟಿಗೆ ಹೇಳುವುದಾದರೆ ಭಾರತೀಯ ಭಾಷೆಗಳ ಜೊತೆ, ಚೀನಾ, ಜಪಾನ್, ಅರೇಬಿ, ಯುರೋಪಿನ ಭಾಷೆಗಳು, ಹೀಗೆ ನೂರಾರು ಭಾಷೆಗಳಿಗೆ ಸ್ಥಾನ ಕಲ್ಪಿಸಿ ಕೊಡಬೇಕಾಗುತ್ತದೆ. ಇದಕ್ಕೆಲ್ಲ ಮದ್ದೆಂದರೆ ೮ ಬಿಟ್‌ಗಳ ಸಂಕೇತೀಕರಣದ ಬದಲಿಗೆ ೧೬ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವುದು. ೧೬ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವುದರಿಂದ ಸುಮಾರು ೬೫,೦೦೦ (೨೧೬ = ೬೫೫೩೬)ಮೂಲಾಕ್ಷರಗಳಿಗೆ ಜಾಗ ಮಾಡಿಕೊಟ್ಟಂತಾಗುತ್ತದೆ. ಇದು ಪ್ರಪಂಚದ ಬಹುತೇಕ ಭಾಷೆಗಳಿಗೆ ಸಾಕು. ಇದುವೇ ಯುನಿಕೋಡ್ (Unicode). ಯುನಿಕೋಡ್ ಎಂಬುದು uniform, universal, unique ಮತ್ತು code (ಸಂಕೇತ) ಎಂಬ ಪದಗಳನ್ನು ಸೂಚಿಸುತ್ತದೆ. ಪ್ರಪಂಚಕ್ಕೆಲ್ಲಾ ಒಂದೇ ಸಂಕೇತ ವಿಧಾನ ಇರತಕ್ಕದ್ದು. ಪ್ರಪಂಚದ ಪ್ರತಿ ಭಾಷೆಯ ಪ್ರತಿಯೊಂದು ಅಕ್ಷರಕ್ಕೂ ತನ್ನದೇ ಆದ ಪ್ರತ್ಯೇಕ ಸಂಕೇತ ಇರಬೇಕು. ಈ ಎಲ್ಲ ಬೇಕುಗಳಿಗೆ ಉತ್ತರವೇ ಯುನಿಕೋಡ್. ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಸಂಕೇತಶ್ರೇಣಿ ಇದೆ. ಇದು ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೂ ಅನ್ವಯಿಸುತ್ತದೆ. ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆ ಮಾಡಿದರೆ ಒಂದೇ ಕಡತದಲ್ಲಿ ಪ್ರಪಂಚದ ಎಲ್ಲ ಭಾಷೆಗಳಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಶೇಖರಣೆ ಮಾಡಲು ಸಾಧ್ಯ. ಗ್ರಂಥಾಲಯವೊಂದರಲ್ಲಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಯ ಪುಸ್ತಕಗಳಿದ್ದಲ್ಲಿ ಅವುಗಳ ವಿವರಗಳ ದತ್ತಸಂಚಯ (database) ತಯಾರಿಸಬೇಕಾದರೆ ಯುನಿಕೋಡ್ ವಿಧಾನದಿಂದ ಮಾತ್ರ ಸಾಧ್ಯ.

ಯುನಿಕೋಡ್ ಆಧಾರಿತ ತಂತ್ರಾಂಶಗಳಲ್ಲಿ ಬೆರಳಚ್ಚು ಮಾಡಿದ ಮಾಹಿತಿಯನ್ನು ನೇರವಾಗಿ ಮಾಹಿತಿ ಶೇಖರಣೆಯ ಸಂಕೇತವಾದ ಯುನಿಕೋಡ್‌ನಲ್ಲೇ ಸಂಗ್ರಹಿಸಿಡಲಾಗುತ್ತದೆ. ಅಂದರೆ ನುಡಿ, ಬರಹ, ಆಕೃತಿ, ಶ್ರೀಲಿಪಿ, ಸಿಡಾಕ್, ಇತ್ಯಾದಿ ತಂತ್ರಾಂಶಗಳಂತೆ ಅಕ್ಷರಶೈಲಿ (ಫಾಂಟ್) ಗಳ ಸಂಕೇತಗಳಲ್ಲಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆ ಅಲ್ಲ. ನಿಮ್ಮಲ್ಲಿ ಯುನಿಕೋಡ್ ಆಧಾರಿತ ಕನ್ನಡದ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್ ಇರತಕ್ಕದ್ದು. ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ತಯಾರಿಸಿದ ಕಡತವನ್ನು ಬೇರೊಬ್ಬರಿಗೆ ಕಳುಹಿಸುವಾಗ ಕಡತದ ಜೊತೆ ನಿಮ್ಮ ಅಕ್ಷರಶೈಲಿಯನ್ನೂ ಕಳುಹಿಸುವ ಅಗತ್ಯವಿಲ್ಲ. ನಿಮ್ಮಲ್ಲಿರುವ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್ ಮತ್ತು ನಿಮ್ಮ ಸ್ನೇಹಿತರಲ್ಲಿರುವ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್ ಬೇರೆ ಬೇರೆ ಇರಬಹುದು. ಮಾಹಿತಿಯನ್ನು ಅಕ್ಷರಶೈಲಿಯ ಸಂಕೇತಗಳ ಬದಲಿಗೆ ಮೂಲ ಮಾಹಿತಿಯಾಗಿಯೇ ಕಳುಹಿಸುವುದರಿಂದ ಮಾಹಿತಿ ಸಂವಹನೆಯಲ್ಲಿ ಯಾವ ತೊಡಕೂ ಇಲ್ಲ.

ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಸಂಕೇತಗಳಿರುವುದು ಮಾತ್ರವಲ್ಲ, ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸೂತ್ರವೂ ಯುನಿಕೋಡ್‌ನಲ್ಲಿದೆ. ಇಸ್ಕಿಯಲ್ಲಿರುವ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸಮಸ್ಯೆಗೆ ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪರಿಹಾರಹವಿದೆ. ಯುನಿಕೋಡ್‌ನ ಹಳೆಯ ಆವೃತ್ತಿಯಲ್ಲಿ ಕನ್ನಡದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಗೆ ಇಸ್ಕಿಯಲ್ಲಿನ ಸೂತ್ರವನ್ನೇ ಬಳಸಲಾಗಿತ್ತು. ಆದರೆ ಯುನಿಕೋಡ್‌ನ ೪.೦ ಆವೃತ್ತಿಯಲ್ಲಿ ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲಾಗಿದೆ.

ಪ್ರಪಂಚದ ಖ್ಯಾತ ಗಣಕ ಕಂಪೆನಿಗಳು, ತಂತ್ರಾಂಶ ತಯಾರಕರು, ದೇಶಗಳು ಸೇರಿ ಆಗಿರುವ ಒಂದು ಸಂಸ್ಥೆ ಯುನಿಕೋಡ್ ಕನ್‌ಸೋರ್ಟಿಯಂ. ಭಾರತ ದೇಶವೂ ಇದರ ಸದಸ್ಯತ್ವ ಹೊಂದಿದೆ. ಯುನಿಕೋಡ್ ಒಂದು ಕಂಪೆನಿಯ ಸ್ವತ್ತಲ್ಲ. ಈಗ (೨೦೦೪) ನಾವು ಬಳಸುತ್ತಿರುವ ಯುನಿಕೋಡ್ ಅಲ್ಲದ ವಿಧಾನಕ್ಕೆ ಹೆಚ್ಚೆಂದರೆ ಒಂದು ವರ್ಷದ ಆಯುಷ್ಯವಿರಬಹುದು. ನಂತರ ಎಲ್ಲ ತಂತ್ರಾಂಶಗಳು ಯುನಿಕೋಡ್‌ನ್ನೇ ಬಳಸುತ್ತಿರುತ್ತವೆ.

ಮೈಕ್ರೋಸಾಫ್ಟ್‌ನವರ ವಿಂಡೋಸ್ ಎಕ್ಸ್‌ಪಿ ಮತ್ತು ಸರ್ವರ್ ೨೦೦೩ ಕಾರ್ಯಾಚರಣ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ (operating system) ಕನ್ನಡದ ಯುನಿಕೋಡ್ ಸವಲತ್ತನ್ನು ನೀಡಲಾಗಿದೆ. ವಿಂಡೋಸ್ ಎಂಇ, ೯೮, ೯೫, ಇತ್ಯಾದಿಗಳಲ್ಲಿ ಯುನಿಕೋಡ್‌ನ ಸೌಲಭ್ಯ (ಸರಿಯಾಗಿ) ಇಲ್ಲವೆಂದೇ ಹೇಳಬಹುದು. ಕನ್ನಡ ಲಿನಕ್ಸ್‌ನಲ್ಲಿ ನೇರವಾಗಿ ಯುನಿಕೋಡ್‌ನ್ನೇ ಬಳಸಲಾಗಿದೆ. ಅಂದರೆ ವಿಂಡೋಸ್‌ನಲ್ಲಿ ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿದರೆ ಅದನ್ನು ಲಿನಕ್ಸ್‌ನಲ್ಲಿ ಯಾವ ತೊಂದರೆಯೂ ಇಲ್ಲದೆ ಓದಬಹುದು.

ಧ್ಯೇಯ

ಯುನಿಕೋಡ್ ಸಹಯೋಗ ಸಮಿತಿ

ಕ್ಯಾಲಿಫೊರ್ನಿಯ ಸ್ಥಿತ ಯುನಿಕೋಡ್ ಸಹಯೋಗ ಸಮಿತಿ (Unicode Consortium) ಮೊಟ್ಟಮೊದಲಾಗಿ ೧೯೯೧ರಲ್ಲಿ "ದ ಯುನಿಕೋಡ್ ಸ್ಟ್ಯಾಂಡರ್ಡ್" (ISBN ೦-೩೨೧-೧೮೫೭೮-೧) ಎಂಬ ಸ್ಟ್ಯಾಂಡರ್ಡ್ ಹೊರತಂದಿತು. ಈಗಲೂ ಕೂಡ ಆ ಮೂಲ ಕೆಲಸವನ್ನುಪಯೋಗಿಸಿಕೊಂಡು ಹಲವು ನಿರ್ದಿಷ್ಟಮಾನಗಳನ್ನು ಹೊರತರಲಾಗುತ್ತಿದೆ. 'ಇಂಟರ್ನ್ಯಾಷನಲ್ ಆರ್ಗನೈಝೇಶನ್ ಫಾರ್ ಸ್ಟ್ಯಾಂಡರ್ಡೈಝೇಶನ್' ಜೊತೆಜೊತೆಗೆ ವಿಕಸಿತಗೊಂಡ ಯುನಿಕೋಡ್, ತನ್ನ ಅಕ್ಷರಗಳ ಸಮೃದ್ಧ ಕಣಜವನ್ನು ISO/IEC ೧೦೬೪೬ ಜೊತೆ ಹಂಚಿಕೊಳ್ಳುತ್ತಿದೆ. ಯುನಿಕೋಡ್ ಹಾಗೂ ISO/IEC ೧೦೬೪೬ ಸಮನಾದ ಅಕ್ಷರ ಎನ್ಕೋಡಿಂಗ್ ಗಳಾಗಿದ್ದರೂ, ಯುನಿಕೋಡ್ ನಿರ್ದಿಷ್ಟಮಾನ ಇಂಪ್ಲಿಮೆಂಟರ್‍ಗಳು, ಬಿಟ್ ವೈಸ್ ಎನ್ಕೋಡಿಂಗ್, ಕೊಲ್ಲೇಶನ್, ರೆಂಡರಿಂಗ್ ಹಾಗೂ ಮತ್ತಷ್ಟು ಹಲವು ವಿಷಯಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿ ಹೊಂದಿದೆ. ಅದಲ್ಲದೆ, ಇವೆರಡೂ ನಿರ್ದಿಷ್ಟಮಾನಗಳು ಕೆಲವು ಅಸಮಾನ ಶಬ್ದ ಪ್ರಯೋಗಗಳನ್ನು (Terminology) ಹೊಂದಿವೆ.

ಮ್ಯಾಪ್ಪಿಂಗ್

ವಿವರವನ್ನು ನೋಡಿ. (ಆಂಗ್ಲ ಭಾಷೆಯಲ್ಲಿದೆ)

ಯುನಿಕೋಡ್ ಪೈಪ್ ಲೈನ್

ಹೊಸ ಅಕ್ಷರಗಳನ್ನು ಈಗಾಗಲೇ ಕೂಡಿಸಲ್ಪಟ್ಟ ಯುನಿಕೋಡ್ ನಿರ್ಧಿಷ್ಟಮಾನಕ್ಕೆ ಮತ್ತು ISO/IEC 10646ಗೆ ಸ್ವೀಕರಿಸಲು ಬಹಳ ದೂರದ ಹಾದಿ ತುಳಿಯಬೇಕಾಗಬಹುದು. ಆದ್ದರಿಂದ ಇದರ ಬಳಕೆದಾರರಿಗೆ ಹಾಗು ಪ್ರಬಂಧಕರಿಗೆ ಮುಂದೆ ಬರುವ ಸೇರ್ಪಡೆಗಳೆಡೆಗೆ ಗಮನವಿರಿಸುವುದಕ್ಕೆ ಸಹಾಯ ಮಾಡಲು ಯುನಿಕೋಡ್ ಪೈಪ್ ಲೈನ್ ಟೇಬಲ್ ಇದುವರೆಗೆ ಪ್ರಸ್ತಾಪಿಸಿದ ಕೋಡ್ ಪಾಯಿಂಟ್ಗಳನ್ನು ಹಾಗು ಹೊಸ ಅಕ್ಷರಗಳ ಈಗಿನ ಸ್ಥಿತಿಯನ್ನು ತಿಳಿಸುತ್ತದೆ. ಹೊಸ ಸ್ಕ್ರಿಪ್ಟ್ ಗಳು ಅಥವಾ ಅಕ್ಷರಗಳು ಯುನಿಕೋಡ್ ಪೈಪ್ಲೈನ್ ಸೇರುವ ಮುನ್ನ 'Characters and Scripts Under Investigation' ಅಥವಾ 'Proposed new scripts' ವರ್ಗಗಳ ಕೆಳಗೆ ನಾವು ಅವನ್ನು ಕಾಣಬಹುದು. ಪ್ರಸ್ತಾವನೆಗಳು ಮುಕ್ತವಾಗಿ ನಡೆಯುವುದಲ್ಲದೆ ಎಲ್ಲೆಡೆಯಿಂದಲೂ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಆಮಂತ್ರಿಸಲಾಗುತ್ತದೆ.

ವಿವಾದಗಳು

'ಎನ್ಕೋಡಿಂಗ್'ಗಳು

ಯುನಿಕೋಡ್ ಮತ್ತು ವಿ-ಅಂಚೆ

ಇತರೆ

ಅಂತರ ಜಾಲದಲ್ಲಿ ಯುನಿಕೋಡ್

ಯುನಿಕೋಡ್ ಫಾಂಟ್ ಗಳು

ಇತರೆ ಸಂಬಂದಪಟ್ಟ ಸಂಪರ್ಕಗಳು

ಟೆಂಪ್ಲೇಟು:Link FA