ಯುನಿಕೋಡ್

ಯುನಿಕೋಡ್
ಶ್ರೇಣಿ

ಗಣಕೀಕರಣದಲ್ಲಿ ಯುನಿಕೋಡ್ ಎಂದರೆ ಒಂದು ಅಂತರರಾಷ್ಟ್ರೀಯ ನಿರ್ದಿಷ್ಟಮಾನ. ಇದರ ಧ್ಯೇಯ - ಎಲ್ಲಾ ಮಾನವ ಭಾಷೆಗಳಲ್ಲಿ ಬೇಕಾಗುವ ಪ್ರತಿಯೊಂದು ಅಕ್ಷರಕ್ಕೂ ಆಕರದಲ್ಲಿ ಒಂದು ಅಪೂರ್ವ (Unique) ಇಂಟಿಜರ್ ಸಂಖ್ಯೆಯನ್ನು ಕೊಡುವುದು. ಈ ಕೋಡ್ ಸಂಖ್ಯೆಯನ್ನು ಕೋಡ್ ಪಾಯಿಂಟ್ ಎನ್ನುತ್ತಾರೆ.

ಕೆಲವು ಟೀಕೆ, ಸಂಧಿಗ್ಧತೆ ಹಾಗೂ ತಾಂತ್ರಿಕ ತೊಂದರೆಗಳಿದ್ದರೂ ಸಹ ತಂತ್ರಾಂಶಗಳ ಅಂತರರಾಷ್ಟ್ರೀಯತೆಯಲ್ಲಿ (internationalization) ಪ್ರಬಲ ಎನ್ಕೋಡಿಂಗ್ ವಿಧಾನವಾಗಿ ಹೊರಹೊಮ್ಮಿದೆ. ಯುನಿಕ್ಸ್ ಮತ್ತು ಸಮಾನವಾದ ಗ್ನು/ಲಿನಕ್ಸ್, ಬಿ ಎಸ್ ಡಿ, ಹಾಗೂ ಮ್ಯಾಕ್ ಓಎಸ್ ಎಕ್ಸ್ ಇವೇ ಮೊದಲಾದ ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್ ಗಳು ಯುನಿಕೋಡನ್ನು (ಯು ಟಿ ಎಫ್ -೮ ರ ರೂಪದಲ್ಲಿ) ಅಂಗೀಕರಿಸಿವೆ. ಮೈಕ್ರೊಸಾಫ್ಟ್ನ ವಿಂಡೋಸ್ ಶ್ರೇಣಿಯ ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್ ಗಳು ಯು ಟಿ ಎಫ್ -೧೬ನ್ನು ಬಹಳವಾಗಿ ಉಪಯೋಗಿಸುತ್ತವೆ.

ಯುನಿಕೋಡ್ ಎಂಬ ವಿಶ್ವಸಂಕೇತ

ಅಂಗಡಿಗೆ ಹೋಗಿ ಒಂದು ಬಲ್ಬ್ ಬೇಕೆಂದು ಕೇಳಿ ನೋಡಿ. ಅಂಗಡಿಯಾತ ನಿಮ್ಮ ಮನೆಯಲ್ಲಿ ಯಾವ ಕಂಪೆನಿಯ ಹೋಲ್ಡರ್ ಇದೆ ಎಂದು ಕೇಳುವುದಿಲ್ಲ. ಯಾಕೆಂದರೆ ಯಾವ ಕಂಪೆನಿಯ ಹೋಲ್ಡರ್ ಆದರೇನು, ಎಲ್ಲ ಬಲ್ಬ್‌ಗಳು ಎಲ್ಲ ಹೋಲ್ಡರ್‌ಗಳಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತವೆ. ಈಗ ಕನ್ನಡ ಮತ್ತು ಗಣಕ ಕ್ಷೇತ್ರಕ್ಕೆ ಬನ್ನಿ. ನಿಮ್ಮ ಮನೆಯ ಗಣಕದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿ ಫ್ಲಾಪಿಯಲ್ಲಿ ತುಂಬಿಸಿ ಅದರ ಲೇಸರ್ ಮುದ್ರಣಕ್ಕೆ ಯಾವುದಾದರು ಡಿ.ಟಿ.ಪಿ. ಕೇಂದ್ರಕ್ಕೆ ತೆಗೆದುಕೊಂದು ಹೋಗಿ. ಆತ ನಿಮ್ಮನ್ನು ಖಂಡಿತವಾಗಿ ಕೇಳುವ ಪ್ರಶ್ನೆಯೆಂದರೆ "ನೀವು ಯಾವ ತಂತ್ರಾಂಶ ತಯಾರಿಸಿ ಕಡತವನ್ನು ತಯಾರು ಮಾಡಿದ್ದೀರಾ?". ನೀವು ಬಳಸಿದ ತಂತ್ರಾಂಶ ಆತನ ಗಣಕದಲ್ಲಿ ಇಲ್ಲದಿರುವ ಸಂಭವವೇ ಹೆಚ್ಚು. ಕನ್ನಡದ ಯಾವುದೇ ತಂತ್ರಾಂಶವನ್ನು ಬಳಸಿ ತಯಾರಿಸಿದ ಕಡತವನ್ನು ಕನ್ನಡದ ಯಾವುದೇ ತಂತ್ರಾಂಶದಲ್ಲಿ ಓದಲು ಸಾಧ್ಯವಿರಬೇಕಲ್ಲವೇ, ಎಂದು ನಿಮಗೆ ಅನ್ನಿಸಿರಬೇಕಲ್ಲವೇ? ಅದನ್ನು ಸಾಧ್ಯಮಾಡಿಕೊಡುವುದೇ ಈ ಯುನಿಕೋಡ್. ಕನ್ನಡದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿ ಜಪಾನಿಗೆ ಕಳುಹಿಸಿದರೆ ಅವರಿಗೆ ಇದು ಕನ್ನಡ ಭಾಷೆಯಲ್ಲಿದೆ ಎಂದು ತಿಳಿಯುವುದು ಹೇಗೆ? ವಿಶ್ವಕ್ಕೆಲ್ಲ ಒಂದೇ ಸಂಕೇತ ವಿಧಾನ ಇದ್ದರೆ ಒಳ್ಳೆಯದಲ್ಲವೇ? ಇದುವೇ ಯುನಿಕೋಡ್.

ನಾವು ಇಂಗ್ಲೀಷ್ನಲ್ಲಿ ಮಾತನಾಡುವಾಗ ಕನ್ನಡದಲ್ಲಿ ಆಲೋಚಿಸಿ ಇಂಗ್ಲೀಷ್ ಗೆ ಅನುವಾದಿಸಿ ಮಾತನಾಡುತ್ತೇವಲ್ಲವೇ? ಗಣಕಗಳು ಕನ್ನಡದಲ್ಲಿ ವ್ಯವಹರಿಸುವುದು ಸುಮಾರಾಗಿ ಹಾಗೆಯೇ. ಮಾಹಿತಿಯ ಸಂಗ್ರಹಣೆಗೆ ಒಂದು ಸಂಕೇತ, ತೋರಿಸಲು ಇನ್ನೊಂದು ಸಂಕೇತ. ಮಾಹಿತಿಯ ಸಂಗ್ರಹಣೆಗೆ ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೆ ಬಳಸುತ್ತಿರುವುದು ಇಸ್ಕಿಯನ್ನು (ISCII = Indian Script Code for Information Interchange). ಇಸ್ಕಿಯು ಆಸ್ಕಿಯನ್ನು (ASCII = American Standards Code for Information Interchange) ಆಧರಿಸಿದೆ.

ಆಸ್ಕಿ ಮತ್ತು ಇಸ್ಕಿ

ಆಸ್ಕಿ ೮ ಬಿಟ್‌ಗಳನ್ನು ಹೊಂದಿದೆ. ಗಣಕದಲ್ಲಿ ಮಾಹಿತಿಯ ಒಂದು ತುಣಕೇ ಬಿಟ್ (bit = binary digit). ವಿದ್ಯುತ್ತಿಗೆ ಎರಡೇ ಸಾಧ್ಯತೆಗಳಿರುವುದು -ಇದೆ ಅಥವಾ ಇಲ್ಲ. ವಿದ್ಯುತ್ ಇದೆ ಎಂದರೆ "ಒಂದು", ಇಲ್ಲ ಎಂದರೆ "ಸೊನ್ನೆ" ಎಂದು ತೆಗೆದುಕೊಂಡರೆ ಒಂದು ಬಿಟ್‌ನಲ್ಲಿ ೦ ಅಥವಾ ೧ ಅನ್ನು ಸೂಚಿಸಬಹದು. ಒಂದು ಅಕ್ಷರವನ್ನು ಶೇಖರಿಸಲು ಎರಡು ಬಿಟ್‌ಗಳನ್ನು ತೆಗೆದುಕೊಂಡರೆ ಒಟ್ಟು ನಾಲ್ಕು ಸಾಧ್ಯತೆಗಳಿವೆ -೦೦, ೦೧, ೧೦ ಮತ್ತು ೧೧ (ದ್ವಿಮಾನ). ಇವು ದಶಮಾನ ಪದ್ಧತಿಯಲ್ಲಿ ೦, ೧, ೨, ೩ ಆಗುತ್ತವೆ. ಆಸ್ಕಿ ಮತ್ತು ಇಸ್ಕಿಗಳು ೮ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುತ್ತವೆ. ೮ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವ ಯಾವುದೇ ಸಂಕೇತೀಕರಣ ವಿಧಾನವು ೨೫೬ (೨^೮ = ೨೫೬) ಅಕ್ಷರಗಳನ್ನು ಮಾತ್ರವೇ ಹೊಂದಿರಬಲ್ಲುದು. ಕನ್ನಡ ಭಾಷೆಯಲ್ಲಿ ೪೯ ಅಕ್ಷರಗಳಿವೆ. ಜೊತೆಗೆ ಸ್ವರ ಚಿಹ್ನೆಗಳಿವೆ. ಇಂಗ್ಲೀಷ್ ಭಾಷೆಯಲ್ಲಿ ೨೬ (ಮತ್ತು ೨೬) ಅಕ್ಷರಗಳಿವೆ. ಬರೆವಣಿಗೆಯ ಚಿಹ್ನೆ, ಅಂಕೆ, ಇತ್ಯಾದಿಗಳೆಲ್ಲ ಒಟ್ಟು ಸೇರಿದರೂ ೨೫೬ಕ್ಕಿಂತ ಕಡಿಮೆಯೇ. ಹಾಗಿದ್ದಲ್ಲಿ ೨೫೬ ಸಂಕೇತಗಳು ಸಾಕಲ್ಲವೇ? ಇಸ್ಕಿಯಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸುವಾಗ ಇಂಗ್ಲೀಷ್ ಮತ್ತು ಒಂದು ಭಾರತೀಯ ಭಾಷೆಯನ್ನು ಬಳಸಬಹುದು. ಅಂದರೆ ಕನ್ನಡ, ಹಿಂದಿ, ತಮಿಳು, ತೆಲುಗು, ಹೀಗೆ ಹಲವು ಭಾಷೆಗಳನ್ನು ಒಂದೇ ಕಡತದಲ್ಲಿ ಸಂಗ್ರಹಿಸುವುದು ಅಸಾಧ್ಯ.

ಇಸ್ಕಿಯಲ್ಲಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಗಳಿಗೆ ಒಂದೇ ಸಂಕೇತ ನೀಡಲಾಗಿದೆ. ಅಂದರೆ ಕನ್ನಡದ "ಕ" ಮತ್ತು ಹಿಂದಿಯ "क" ಎರಡಕ್ಕೂ ಒಂದೇ ಸಂಕೇತ ಇದೆ. ಇದರಿಂದ ಕೆಲವೊಮ್ಮೆ ಲಾಭವೂ ಇದೆ. ಒಂದು ಟೆಲಿಫೋನ್ ಡೈರೆಕ್ಟರಿಯನ್ನು ಕನ್ನಡ ಮತ್ತು ಹಿಂದಿ ಭಾಷೆಯಲ್ಲಿ ತಯಾರಿಸಬೇಕಾದರೆ, ಕನ್ನಡದಲ್ಲಿ ಬೆರಳಚ್ಚು ಮಾಡಿ, ಇಸ್ಕಿಯಲ್ಲಿ ಶೇಖರಿಸಿ, ಅದನ್ನು ಹಿಂದಿಯ ಫಾಂಟ್‌ನ ಸಂಕೇತಗಳಿಗೆ ಪರಿವರ್ತಿಸಿದರೆ ಸಾಕು. ಆದರೆ ಸಮಸ್ಯೆ ಇರುವುದು ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯಲ್ಲಿ. ಕನ್ನಡ, ತೆಲುಗು, ಮರಾಠಿ, ಹಿಂದಿ, ಹೀಗೆ ಎಲ್ಲ ಭಾಷೆಗಳಿಗೂ ಒಂದೆ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸೂತ್ರ ಕಲ್ಪಿಸಲಾಗಿದೆ. ಕನ್ನಡ ಮತ್ತು ಹಿಂದಿಯ ಸೂತ್ರ ಒಂದೇ ಆಗಿರಬೇಕಾಗಿಲ್ಲ. ಉದಾಹರಣೆಗೆ ಇಸ್ಕಿಯಲ್ಲಿರುವ ಅಕಾರಾದಿ ವಿಂಗಡಣೆ -"ಯ, ರ ಲ, ಳ, ವ, ಶ, ಷ, ಸ, ಹ". ಕನ್ನಡದಲ್ಲಿ ಇದು "ಯ, ರ, ಲ, ವ, ಶ, ಷ, ಸ, ಹ, ಳ" ಆಗಬೇಕು.

ಯುನಿಕೋಡ್

ಪ್ರಪಂಚದ ಮಟ್ಟಿಗೆ ಹೇಳುವುದಾದರೆ ಭಾರತೀಯ ಭಾಷೆಗಳ ಜೊತೆ, ಚೀನಾ, ಜಪಾನ್, ಅರೇಬಿ, ಯುರೋಪಿನ ಭಾಷೆಗಳು, ಹೀಗೆ ನೂರಾರು ಭಾಷೆಗಳಿಗೆ ಸ್ಥಾನ ಕಲ್ಪಿಸಿ ಕೊಡಬೇಕಾಗುತ್ತದೆ. ಇದಕ್ಕೆಲ್ಲ ಮದ್ದೆಂದರೆ ೮ ಬಿಟ್‌ಗಳ ಸಂಕೇತೀಕರಣದ ಬದಲಿಗೆ ೧೬ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವುದು. ೧೬ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವುದರಿಂದ ಸುಮಾರು ೬೫,೦೦೦ (೨^೧೬ = ೬೫೫೩೬)ಮೂಲಾಕ್ಷರಗಳಿಗೆ ಜಾಗ ಮಾಡಿಕೊಟ್ಟಂತಾಗುತ್ತದೆ. ಇದು ಪ್ರಪಂಚದ ಬಹುತೇಕ ಭಾಷೆಗಳಿಗೆ ಸಾಕು. ಇದುವೇ ಯುನಿಕೋಡ್ (Unicode). ಯುನಿಕೋಡ್ ಎಂಬುದು uniform, universal, unique ಮತ್ತು code (ಸಂಕೇತ) ಎಂಬ ಪದಗಳನ್ನು ಸೂಚಿಸುತ್ತದೆ. ಪ್ರಪಂಚಕ್ಕೆಲ್ಲಾ ಒಂದೇ ಸಂಕೇತ ವಿಧಾನ ಇರತಕ್ಕದ್ದು. ಪ್ರಪಂಚದ ಪ್ರತಿ ಭಾಷೆಯ ಪ್ರತಿಯೊಂದು ಅಕ್ಷರಕ್ಕೂ ತನ್ನದೇ ಆದ ಪ್ರತ್ಯೇಕ ಸಂಕೇತ ಇರಬೇಕು. ಈ ಎಲ್ಲ ಬೇಕುಗಳಿಗೆ ಉತ್ತರವೇ ಯುನಿಕೋಡ್. ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಸಂಕೇತಶ್ರೇಣಿ ಇದೆ. ಇದು ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೂ ಅನ್ವಯಿಸುತ್ತದೆ. ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆ ಮಾಡಿದರೆ ಒಂದೇ ಕಡತದಲ್ಲಿ ಪ್ರಪಂಚದ ಎಲ್ಲ ಭಾಷೆಗಳಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಶೇಖರಣೆ ಮಾಡಲು ಸಾಧ್ಯ. ಗ್ರಂಥಾಲಯವೊಂದರಲ್ಲಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಯ ಪುಸ್ತಕಗಳಿದ್ದಲ್ಲಿ ಅವುಗಳ ವಿವರಗಳ ದತ್ತಸಂಚಯ (database) ತಯಾರಿಸಬೇಕಾದರೆ ಯುನಿಕೋಡ್ ವಿಧಾನದಿಂದ ಮಾತ್ರ ಸಾಧ್ಯ.

ಯುನಿಕೋಡ್ ಆಧಾರಿತ ತಂತ್ರಾಂಶಗಳಲ್ಲಿ ಬೆರಳಚ್ಚು ಮಾಡಿದ ಮಾಹಿತಿಯನ್ನು ನೇರವಾಗಿ ಮಾಹಿತಿ ಶೇಖರಣೆಯ ಸಂಕೇತವಾದ ಯುನಿಕೋಡ್‌ನಲ್ಲೇ ಸಂಗ್ರಹಿಸಿಡಲಾಗುತ್ತದೆ. ಅಂದರೆ ನುಡಿ, ಬರಹ, ಆಕೃತಿ, ಶ್ರೀಲಿಪಿ, ಸಿಡಾಕ್, ಇತ್ಯಾದಿ ತಂತ್ರಾಂಶಗಳಂತೆ ಅಕ್ಷರಶೈಲಿ (ಫಾಂಟ್)ಗಳ ಸಂಕೇತಗಳಲ್ಲಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆ ಅಲ್ಲ. ನಿಮ್ಮಲ್ಲಿ ಯುನಿಕೋಡ್ ಆಧಾರಿತ ಕನ್ನಡದ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್ ಇರತಕ್ಕದ್ದು. ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ತಯಾರಿಸಿದ ಕಡತವನ್ನು ಬೇರೊಬ್ಬರಿಗೆ ಕಳುಹಿಸುವಾಗ ಕಡತದ ಜೊತೆ ನಿಮ್ಮ ಅಕ್ಷರಶೈಲಿಯನ್ನೂ ಕಳುಹಿಸುವ ಅಗತ್ಯವಿಲ್ಲ. ನಿಮ್ಮಲ್ಲಿರುವ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್ ಮತ್ತು ನಿಮ್ಮ ಸ್ನೇಹಿತರಲ್ಲಿರುವ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್ ಬೇರೆ ಬೇರೆ ಇರಬಹುದು. ಮಾಹಿತಿಯನ್ನು ಅಕ್ಷರಶೈಲಿಯ ಸಂಕೇತಗಳ ಬದಲಿಗೆ ಮೂಲ ಮಾಹಿತಿಯಾಗಿಯೇ ಕಳುಹಿಸುವುದರಿಂದ ಮಾಹಿತಿ ಸಂವಹನೆಯಲ್ಲಿ ಯಾವ ತೊಡಕೂ ಇಲ್ಲ.

ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಸಂಕೇತಗಳಿರುವುದು ಮಾತ್ರವಲ್ಲ, ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸೂತ್ರವೂ ಯುನಿಕೋಡ್‌ನಲ್ಲಿದೆ. ಇಸ್ಕಿಯಲ್ಲಿರುವ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸಮಸ್ಯೆಗೆ ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪರಿಹಾರಹವಿದೆ. ಯುನಿಕೋಡ್‌ನ ಹಳೆಯ ಆವೃತ್ತಿಯಲ್ಲಿ ಕನ್ನಡದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಗೆ ಇಸ್ಕಿಯಲ್ಲಿನ ಸೂತ್ರವನ್ನೇ ಬಳಸಲಾಗಿತ್ತು. ಆದರೆ ಯುನಿಕೋಡ್‌ನ ೪.೦ ಆವೃತ್ತಿಯಲ್ಲಿ ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲಾಗಿದೆ.

ಪ್ರಪಂಚದ ಖ್ಯಾತ ಗಣಕ ಕಂಪೆನಿಗಳು, ತಂತ್ರಾಂಶ ತಯಾರಕರು, ದೇಶಗಳು ಸೇರಿ ಆಗಿರುವ ಒಂದು ಸಂಸ್ಥೆ ಯುನಿಕೋಡ್ ಕನ್‌ಸೋರ್ಟಿಯಂ. ಭಾರತ ದೇಶವೂ ಇದರ ಸದಸ್ಯತ್ವ ಹೊಂದಿದೆ. ಯುನಿಕೋಡ್ ಒಂದು ಕಂಪೆನಿಯ ಸ್ವತ್ತಲ್ಲ.

ಮೈಕ್ರೋಸಾಫ್ಟ್‌ನವರ ವಿಂಡೋಸ್ 7, 8, ‍XP ಮತ್ತು ಸರ್ವರ್ ೨೦೦೩ ಕಾರ್ಯಾಚರಣ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ (operating system) ಕನ್ನಡದ ಯುನಿಕೋಡ್ ಸವಲತ್ತನ್ನು ನೀಡಲಾಗಿದೆ. ವಿಂಡೋಸ್ ಎಂಇ, ೯೮, ೯೫, ಇತ್ಯಾದಿಗಳಲ್ಲಿ ಯುನಿಕೋಡ್‌ನ ಸೌಲಭ್ಯ (ಸರಿಯಾಗಿ) ಇಲ್ಲವೆಂದೇ ಹೇಳಬಹುದು. ಕನ್ನಡ ಲಿನಕ್ಸ್‌ನಲ್ಲಿ ನೇರವಾಗಿ ಯುನಿಕೋಡ್‌ನ್ನೇ ಬಳಸಲಾಗಿದೆ. ಅಂದರೆ ವಿಂಡೋಸ್‌ನಲ್ಲಿ ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿದರೆ ಅದನ್ನು ಲಿನಕ್ಸ್‌ನಲ್ಲಿ ಯಾವ ತೊಂದರೆಯೂ ಇಲ್ಲದೆ ಓದಬಹುದು.

ಯುನಿಕೋಡ್ ಸಹಯೋಗ ಸಮಿತಿ

ಕ್ಯಾಲಿಫೊರ್ನಿಯ ಸ್ಥಿತ ಯುನಿಕೋಡ್ ಸಹಯೋಗ ಸಮಿತಿ (Unicode Consortium) ಮೊಟ್ಟಮೊದಲಾಗಿ ೧೯೯೧ರಲ್ಲಿ "ದ ಯುನಿಕೋಡ್ ಸ್ಟ್ಯಾಂಡರ್ಡ್" (ISBN ೦-೩೨೧-೧೮೫೭೮-೧) ಎಂಬ ಸ್ಟ್ಯಾಂಡರ್ಡ್ ಹೊರತಂದಿತು. ಈಗಲೂ ಕೂಡ ಆ ಮೂಲ ಕೆಲಸವನ್ನುಪಯೋಗಿಸಿಕೊಂಡು ಹಲವು ನಿರ್ದಿಷ್ಟಮಾನಗಳನ್ನು ಹೊರತರಲಾಗುತ್ತಿದೆ. 'ಇಂಟರ್ನ್ಯಾಷನಲ್ ಆರ್ಗನೈಝೇಶನ್ ಫಾರ್ ಸ್ಟ್ಯಾಂಡರ್ಡೈಝೇಶನ್' ಜೊತೆಜೊತೆಗೆ ವಿಕಸಿತಗೊಂಡ ಯುನಿಕೋಡ್, ತನ್ನ ಅಕ್ಷರಗಳ ಸಮೃದ್ಧ ಕಣಜವನ್ನು ISO/IEC ೧೦೬೪೬ ಜೊತೆ ಹಂಚಿಕೊಳ್ಳುತ್ತಿದೆ. ಯುನಿಕೋಡ್ ಹಾಗೂ ISO/IEC ೧೦೬೪೬ ಸಮನಾದ ಅಕ್ಷರ ಎನ್ಕೋಡಿಂಗ್ ಗಳಾಗಿದ್ದರೂ, ಯುನಿಕೋಡ್ ನಿರ್ದಿಷ್ಟಮಾನ ಇಂಪ್ಲಿಮೆಂಟರ್‍ಗಳು, ಬಿಟ್ ವೈಸ್ ಎನ್ಕೋಡಿಂಗ್, ಕೊಲ್ಲೇಶನ್, ರೆಂಡರಿಂಗ್ ಹಾಗೂ ಮತ್ತಷ್ಟು ಹಲವು ವಿಷಯಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿ ಹೊಂದಿದೆ. ಅದಲ್ಲದೆ, ಇವೆರಡೂ ನಿರ್ದಿಷ್ಟಮಾನಗಳು ಕೆಲವು ಅಸಮಾನ ಶಬ್ದ ಪ್ರಯೋಗಗಳನ್ನು (Terminology) ಹೊಂದಿವೆ.

ಮ್ಯಾಪಿಂಗ್

ಈ ವಿವರವನ್ನು ನೋಡಿ. (ಆಂಗ್ಲ ಭಾಷೆಯಲ್ಲಿದೆ)

ಯುನಿಕೋಡ್ ಪೈಪ್ ಲೈನ್

ಹೊಸ ಅಕ್ಷರಗಳನ್ನು ಈಗಾಗಲೇ ಕೂಡಿಸಲ್ಪಟ್ಟ ಯುನಿಕೋಡ್ ನಿರ್ಧಿಷ್ಟಮಾನಕ್ಕೆ ಮತ್ತು ISO/IEC 10646ಗೆ ಸ್ವೀಕರಿಸಲು ಬಹಳ ದೂರದ ಹಾದಿ ತುಳಿಯಬೇಕಾಗಬಹುದು. ಆದ್ದರಿಂದ ಇದರ ಬಳಕೆದಾರರಿಗೆ ಹಾಗು ಪ್ರಬಂಧಕರಿಗೆ ಮುಂದೆ ಬರುವ ಸೇರ್ಪಡೆಗಳೆಡೆಗೆ ಗಮನವಿರಿಸುವುದಕ್ಕೆ ಸಹಾಯ ಮಾಡಲು ಯುನಿಕೋಡ್ ಪೈಪ್ ಲೈನ್ ಟೇಬಲ್ ಇದುವರೆಗೆ ಪ್ರಸ್ತಾಪಿಸಿದ ಕೋಡ್ ಪಾಯಿಂಟ್ಗಳನ್ನು ಹಾಗು ಹೊಸ ಅಕ್ಷರಗಳ ಈಗಿನ ಸ್ಥಿತಿಯನ್ನು ತಿಳಿಸುತ್ತದೆ. ಹೊಸ ಸ್ಕ್ರಿಪ್ಟ್ ಗಳು ಅಥವಾ ಅಕ್ಷರಗಳು ಯುನಿಕೋಡ್ ಪೈಪ್ಲೈನ್ ಸೇರುವ ಮುನ್ನ 'Characters and Scripts Under Investigation' ಅಥವಾ 'Proposed new scripts' ವರ್ಗಗಳ ಕೆಳಗೆ ನಾವು ಅವನ್ನು ಕಾಣಬಹುದು. ಪ್ರಸ್ತಾವನೆಗಳು ಮುಕ್ತವಾಗಿ ನಡೆಯುವುದಲ್ಲದೆ ಎಲ್ಲೆಡೆಯಿಂದಲೂ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಆಮಂತ್ರಿಸಲಾಗುತ್ತದೆ.

'ಎನ್ಕೋಡಿಂಗ್'ಗಳು

ಯುನಿಕೋಡ್ ಮತ್ತು ವಿ-ಅಂಚೆ

ಅಂತರ ಜಾಲದಲ್ಲಿ ಯುನಿಕೋಡ್

ಯುನಿಕೋಡ್ ಫಾಂಟ್ ಗಳು

ವಿವಾದಗಳು

ಸಂಬಂದಪಟ್ಟ ಸಂಪರ್ಕಗಳು