ಯುನಿಕೋಡ್
ಯುನಿಕೋಡ್ ಶ್ರೇಣಿ |
ಯುನಿಕೋಡ್ |
ಯುನಿಕೋಡ್ ಕನ್ಸಾರ್ಟಿಯಮ್
|
UCS |
ಯುಟಿಎಫ್ - ೭ |
ಯುಟಿಎಫ್ - ೮ |
ಯುಟಿಎಫ್ - ೧೬ |
ಯುಟಿಎಫ್ - ೩೨ |
SCSU |
Punycode
|
Bi-directional text |
BOM |
Han unification |
ಯುನಿಕೋಡ್ ಮತ್ತು ಹೆಚ್.ಟಿ.ಎಂ.ಎಲ್ |
ಗಣಕೀಕರಣದಲ್ಲಿ ಯುನಿಕೋಡ್ ಎಂದರೆ ಒಂದು ಅಂತರರಾಷ್ಟ್ರೀಯ ನಿರ್ದಿಷ್ಟಮಾನ. ಇದರ ಧ್ಯೇಯ - ಎಲ್ಲಾ ಮಾನವ ಭಾಷೆಗಳಲ್ಲಿ ಬೇಕಾಗುವ ಪ್ರತಿಯೊಂದು ಅಕ್ಷರಕ್ಕೂ ಆಕರದಲ್ಲಿ ಒಂದು ಅಪೂರ್ವ (Unique) ಇಂಟಿಜರ್ ಸಂಖ್ಯೆಯನ್ನು ಕೊಡುವುದು. ಈ ಕೋಡ್ ಸಂಖ್ಯೆಯನ್ನು ಕೋಡ್ ಪಾಯಿಂಟ್ ಎನ್ನುತ್ತಾರೆ.
ಕೆಲವು ಟೀಕೆ, ಸಂಧಿಗ್ಧತೆ ಹಾಗೂ ತಾಂತ್ರಿಕ ತೊಂದರೆಗಳಿದ್ದರೂ ಸಹ ತಂತ್ರಾಂಶಗಳ ಅಂತರರಾಷ್ಟ್ರೀಯತೆಯಲ್ಲಿ (internationalization) ಪ್ರಬಲ ಎನ್ಕೋಡಿಂಗ್ ವಿಧಾನವಾಗಿ ಹೊರಹೊಮ್ಮಿದೆ. ಯುನಿಕ್ಸ್ ಮತ್ತು ಸಮಾನವಾದ ಗ್ನು/ಲಿನಕ್ಸ್, ಬಿ ಎಸ್ ಡಿ, ಹಾಗೂ ಮ್ಯಾಕ್ ಓಎಸ್ ಎಕ್ಸ್ ಇವೇ ಮೊದಲಾದ ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್ ಗಳು ಯುನಿಕೋಡನ್ನು (ಯು ಟಿ ಎಫ್ -೮ ರ ರೂಪದಲ್ಲಿ) ಅಂಗೀಕರಿಸಿವೆ. ಮೈಕ್ರೊಸಾಫ್ಟ್ನ ವಿಂಡೋಸ್ ಶ್ರೇಣಿಯ ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್ ಗಳು ಯು ಟಿ ಎಫ್ -೧೬ನ್ನು ಬಹಳವಾಗಿ ಉಪಯೋಗಿಸುತ್ತವೆ.
ಯುನಿಕೋಡ್ ಎಂಬ ವಿಶ್ವಸಂಕೇತ
[ಬದಲಾಯಿಸಿ]ಅಂಗಡಿಗೆ ಹೋಗಿ ಒಂದು ಬಲ್ಬ್ ಬೇಕೆಂದು ಕೇಳಿ ನೋಡಿ. ಅಂಗಡಿಯಾತ ನಿಮ್ಮ ಮನೆಯಲ್ಲಿ ಯಾವ ಕಂಪೆನಿಯ ಹೋಲ್ಡರ್ ಇದೆ ಎಂದು ಕೇಳುವುದಿಲ್ಲ. ಯಾಕೆಂದರೆ ಯಾವ ಕಂಪೆನಿಯ ಹೋಲ್ಡರ್ ಆದರೇನು, ಎಲ್ಲ ಬಲ್ಬ್ಗಳು ಎಲ್ಲ ಹೋಲ್ಡರ್ಗಳಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತವೆ. ಈಗ ಕನ್ನಡ ಮತ್ತು ಗಣಕ ಕ್ಷೇತ್ರಕ್ಕೆ ಬನ್ನಿ. ನಿಮ್ಮ ಮನೆಯ ಗಣಕದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿ ಫ್ಲಾಪಿಯಲ್ಲಿ ತುಂಬಿಸಿ ಅದರ ಲೇಸರ್ ಮುದ್ರಣಕ್ಕೆ ಯಾವುದಾದರು ಡಿ.ಟಿ.ಪಿ. ಕೇಂದ್ರಕ್ಕೆ ತೆಗೆದುಕೊಂದು ಹೋಗಿ. ಆತ ನಿಮ್ಮನ್ನು ಖಂಡಿತವಾಗಿ ಕೇಳುವ ಪ್ರಶ್ನೆಯೆಂದರೆ "ನೀವು ಯಾವ ತಂತ್ರಾಂಶ ತಯಾರಿಸಿ ಕಡತವನ್ನು ತಯಾರು ಮಾಡಿದ್ದೀರಾ?". ನೀವು ಬಳಸಿದ ತಂತ್ರಾಂಶ ಆತನ ಗಣಕದಲ್ಲಿ ಇಲ್ಲದಿರುವ ಸಂಭವವೇ ಹೆಚ್ಚು. ಕನ್ನಡದ ಯಾವುದೇ ತಂತ್ರಾಂಶವನ್ನು ಬಳಸಿ ತಯಾರಿಸಿದ ಕಡತವನ್ನು ಕನ್ನಡದ ಯಾವುದೇ ತಂತ್ರಾಂಶದಲ್ಲಿ ಓದಲು ಸಾಧ್ಯವಿರಬೇಕಲ್ಲವೇ, ಎಂದು ನಿಮಗೆ ಅನ್ನಿಸಿರಬೇಕಲ್ಲವೇ? ಅದನ್ನು ಸಾಧ್ಯಮಾಡಿಕೊಡುವುದೇ ಈ ಯುನಿಕೋಡ್. ಕನ್ನಡದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿ ಜಪಾನಿಗೆ ಕಳುಹಿಸಿದರೆ ಅವರಿಗೆ ಇದು ಕನ್ನಡ ಭಾಷೆಯಲ್ಲಿದೆ ಎಂದು ತಿಳಿಯುವುದು ಹೇಗೆ? ವಿಶ್ವಕ್ಕೆಲ್ಲ ಒಂದೇ ಸಂಕೇತ ವಿಧಾನ ಇದ್ದರೆ ಒಳ್ಳೆಯದಲ್ಲವೇ? ಇದುವೇ ಯುನಿಕೋಡ್.
ನಾವು ಇಂಗ್ಲೀಷ್ನಲ್ಲಿ ಮಾತನಾಡುವಾಗ ಕನ್ನಡದಲ್ಲಿ ಆಲೋಚಿಸಿ ಇಂಗ್ಲೀಷ್ ಗೆ ಅನುವಾದಿಸಿ ಮಾತನಾಡುತ್ತೇವಲ್ಲವೇ? ಗಣಕಗಳು ಕನ್ನಡದಲ್ಲಿ ವ್ಯವಹರಿಸುವುದು ಸುಮಾರಾಗಿ ಹಾಗೆಯೇ. ಮಾಹಿತಿಯ ಸಂಗ್ರಹಣೆಗೆ ಒಂದು ಸಂಕೇತ, ತೋರಿಸಲು ಇನ್ನೊಂದು ಸಂಕೇತ. ಮಾಹಿತಿಯ ಸಂಗ್ರಹಣೆಗೆ ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೆ ಬಳಸುತ್ತಿರುವುದು ಇಸ್ಕಿಯನ್ನು (ISCII = Indian Script Code for Information Interchange). ಇಸ್ಕಿಯು ಆಸ್ಕಿಯನ್ನು (ASCII = American Standards Code for Information Interchange) ಆಧರಿಸಿದೆ.
ಆಸ್ಕಿ ಮತ್ತು ಇಸ್ಕಿ
[ಬದಲಾಯಿಸಿ]ಆಸ್ಕಿ ೮ ಬಿಟ್ಗಳನ್ನು ಹೊಂದಿದೆ. ಗಣಕದಲ್ಲಿ ಮಾಹಿತಿಯ ಒಂದು ತುಣಕೇ ಬಿಟ್ (bit = binary digit). ವಿದ್ಯುತ್ತಿಗೆ ಎರಡೇ ಸಾಧ್ಯತೆಗಳಿರುವುದು -ಇದೆ ಅಥವಾ ಇಲ್ಲ. ವಿದ್ಯುತ್ ಇದೆ ಎಂದರೆ "ಒಂದು", ಇಲ್ಲ ಎಂದರೆ "ಸೊನ್ನೆ" ಎಂದು ತೆಗೆದುಕೊಂಡರೆ ಒಂದು ಬಿಟ್ನಲ್ಲಿ ೦ ಅಥವಾ ೧ ಅನ್ನು ಸೂಚಿಸಬಹದು. ಒಂದು ಅಕ್ಷರವನ್ನು ಶೇಖರಿಸಲು ಎರಡು ಬಿಟ್ಗಳನ್ನು ತೆಗೆದುಕೊಂಡರೆ ಒಟ್ಟು ನಾಲ್ಕು ಸಾಧ್ಯತೆಗಳಿವೆ -೦೦, ೦೧, ೧೦ ಮತ್ತು ೧೧ (ದ್ವಿಮಾನ). ಇವು ದಶಮಾನ ಪದ್ಧತಿಯಲ್ಲಿ ೦, ೧, ೨, ೩ ಆಗುತ್ತವೆ. ಆಸ್ಕಿ ಮತ್ತು ಇಸ್ಕಿಗಳು ೮ ಬಿಟ್ಗಳನ್ನು ಬಳಸುತ್ತವೆ. ೮ ಬಿಟ್ಗಳನ್ನು ಬಳಸುವ ಯಾವುದೇ ಸಂಕೇತೀಕರಣ ವಿಧಾನವು ೨೫೬ (೨೮ = ೨೫೬) ಅಕ್ಷರಗಳನ್ನು ಮಾತ್ರವೇ ಹೊಂದಿರಬಲ್ಲುದು. ಕನ್ನಡ ಭಾಷೆಯಲ್ಲಿ ೪೯ ಅಕ್ಷರಗಳಿವೆ. ಜೊತೆಗೆ ಸ್ವರ ಚಿಹ್ನೆಗಳಿವೆ. ಇಂಗ್ಲೀಷ್ ಭಾಷೆಯಲ್ಲಿ ೨೬ (ಮತ್ತು ೨೬) ಅಕ್ಷರಗಳಿವೆ. ಬರೆವಣಿಗೆಯ ಚಿಹ್ನೆ, ಅಂಕೆ, ಇತ್ಯಾದಿಗಳೆಲ್ಲ ಒಟ್ಟು ಸೇರಿದರೂ ೨೫೬ಕ್ಕಿಂತ ಕಡಿಮೆಯೇ. ಹಾಗಿದ್ದಲ್ಲಿ ೨೫೬ ಸಂಕೇತಗಳು ಸಾಕಲ್ಲವೇ? ಇಸ್ಕಿಯಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸುವಾಗ ಇಂಗ್ಲೀಷ್ ಮತ್ತು ಒಂದು ಭಾರತೀಯ ಭಾಷೆಯನ್ನು ಬಳಸಬಹುದು. ಅಂದರೆ ಕನ್ನಡ, ಹಿಂದಿ, ತಮಿಳು, ತೆಲುಗು, ಹೀಗೆ ಹಲವು ಭಾಷೆಗಳನ್ನು ಒಂದೇ ಕಡತದಲ್ಲಿ ಸಂಗ್ರಹಿಸುವುದು ಅಸಾಧ್ಯ.
ಇಸ್ಕಿಯಲ್ಲಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಗಳಿಗೆ ಒಂದೇ ಸಂಕೇತ ನೀಡಲಾಗಿದೆ. ಅಂದರೆ ಕನ್ನಡದ "ಕ" ಮತ್ತು ಹಿಂದಿಯ "क" ಎರಡಕ್ಕೂ ಒಂದೇ ಸಂಕೇತ ಇದೆ. ಇದರಿಂದ ಕೆಲವೊಮ್ಮೆ ಲಾಭವೂ ಇದೆ. ಒಂದು ಟೆಲಿಫೋನ್ ಡೈರೆಕ್ಟರಿಯನ್ನು ಕನ್ನಡ ಮತ್ತು ಹಿಂದಿ ಭಾಷೆಯಲ್ಲಿ ತಯಾರಿಸಬೇಕಾದರೆ, ಕನ್ನಡದಲ್ಲಿ ಬೆರಳಚ್ಚು ಮಾಡಿ, ಇಸ್ಕಿಯಲ್ಲಿ ಶೇಖರಿಸಿ, ಅದನ್ನು ಹಿಂದಿಯ ಫಾಂಟ್ನ ಸಂಕೇತಗಳಿಗೆ ಪರಿವರ್ತಿಸಿದರೆ ಸಾಕು. ಆದರೆ ಸಮಸ್ಯೆ ಇರುವುದು ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯಲ್ಲಿ. ಕನ್ನಡ, ತೆಲುಗು, ಮರಾಠಿ, ಹಿಂದಿ, ಹೀಗೆ ಎಲ್ಲ ಭಾಷೆಗಳಿಗೂ ಒಂದೆ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸೂತ್ರ ಕಲ್ಪಿಸಲಾಗಿದೆ. ಕನ್ನಡ ಮತ್ತು ಹಿಂದಿಯ ಸೂತ್ರ ಒಂದೇ ಆಗಿರಬೇಕಾಗಿಲ್ಲ. ಉದಾಹರಣೆಗೆ ಇಸ್ಕಿಯಲ್ಲಿರುವ ಅಕಾರಾದಿ ವಿಂಗಡಣೆ -"ಯ, ರ ಲ, ಳ, ವ, ಶ, ಷ, ಸ, ಹ". ಕನ್ನಡದಲ್ಲಿ ಇದು "ಯ, ರ, ಲ, ವ, ಶ, ಷ, ಸ, ಹ, ಳ" ಆಗಬೇಕು.
ಯುನಿಕೋಡ್
[ಬದಲಾಯಿಸಿ]ಪ್ರಪಂಚದ ಮಟ್ಟಿಗೆ ಹೇಳುವುದಾದರೆ ಭಾರತೀಯ ಭಾಷೆಗಳ ಜೊತೆ, ಚೀನಾ, ಜಪಾನ್, ಅರೇಬಿ, ಯುರೋಪಿನ ಭಾಷೆಗಳು, ಹೀಗೆ ನೂರಾರು ಭಾಷೆಗಳಿಗೆ ಸ್ಥಾನ ಕಲ್ಪಿಸಿ ಕೊಡಬೇಕಾಗುತ್ತದೆ. ಇದಕ್ಕೆಲ್ಲ ಮದ್ದೆಂದರೆ ೮ ಬಿಟ್ಗಳ ಸಂಕೇತೀಕರಣದ ಬದಲಿಗೆ ೧೬ ಬಿಟ್ಗಳನ್ನು ಬಳಸುವುದು. ೧೬ ಬಿಟ್ಗಳನ್ನು ಬಳಸುವುದರಿಂದ ಸುಮಾರು ೬೫,೦೦೦ (೨೧೬ = ೬೫೫೩೬)ಮೂಲಾಕ್ಷರಗಳಿಗೆ ಜಾಗ ಮಾಡಿಕೊಟ್ಟಂತಾಗುತ್ತದೆ. ಇದು ಪ್ರಪಂಚದ ಬಹುತೇಕ ಭಾಷೆಗಳಿಗೆ ಸಾಕು. ಇದುವೇ ಯುನಿಕೋಡ್ (Unicode). ಯುನಿಕೋಡ್ ಎಂಬುದು uniform, universal, unique ಮತ್ತು code (ಸಂಕೇತ) ಎಂಬ ಪದಗಳನ್ನು ಸೂಚಿಸುತ್ತದೆ. ಪ್ರಪಂಚಕ್ಕೆಲ್ಲಾ ಒಂದೇ ಸಂಕೇತ ವಿಧಾನ ಇರತಕ್ಕದ್ದು. ಪ್ರಪಂಚದ ಪ್ರತಿ ಭಾಷೆಯ ಪ್ರತಿಯೊಂದು ಅಕ್ಷರಕ್ಕೂ ತನ್ನದೇ ಆದ ಪ್ರತ್ಯೇಕ ಸಂಕೇತ ಇರಬೇಕು. ಈ ಎಲ್ಲ ಬೇಕುಗಳಿಗೆ ಉತ್ತರವೇ ಯುನಿಕೋಡ್. ಯುನಿಕೋಡ್ನಲ್ಲಿ ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಸಂಕೇತಶ್ರೇಣಿ ಇದೆ. ಇದು ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೂ ಅನ್ವಯಿಸುತ್ತದೆ. ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆ ಮಾಡಿದರೆ ಒಂದೇ ಕಡತದಲ್ಲಿ ಪ್ರಪಂಚದ ಎಲ್ಲ ಭಾಷೆಗಳಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಶೇಖರಣೆ ಮಾಡಲು ಸಾಧ್ಯ. ಗ್ರಂಥಾಲಯವೊಂದರಲ್ಲಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಯ ಪುಸ್ತಕಗಳಿದ್ದಲ್ಲಿ ಅವುಗಳ ವಿವರಗಳ ದತ್ತಸಂಚಯ (database) ತಯಾರಿಸಬೇಕಾದರೆ ಯುನಿಕೋಡ್ ವಿಧಾನದಿಂದ ಮಾತ್ರ ಸಾಧ್ಯ.
ಯುನಿಕೋಡ್ ಆಧಾರಿತ ತಂತ್ರಾಂಶಗಳಲ್ಲಿ ಬೆರಳಚ್ಚು ಮಾಡಿದ ಮಾಹಿತಿಯನ್ನು ನೇರವಾಗಿ ಮಾಹಿತಿ ಶೇಖರಣೆಯ ಸಂಕೇತವಾದ ಯುನಿಕೋಡ್ನಲ್ಲೇ ಸಂಗ್ರಹಿಸಿಡಲಾಗುತ್ತದೆ. ಅಂದರೆ ನುಡಿ, ಬರಹ, ಆಕೃತಿ, ಶ್ರೀಲಿಪಿ, ಸಿಡಾಕ್, ಇತ್ಯಾದಿ ತಂತ್ರಾಂಶಗಳಂತೆ ಅಕ್ಷರಶೈಲಿ (ಫಾಂಟ್)ಗಳ ಸಂಕೇತಗಳಲ್ಲಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆ ಅಲ್ಲ. ನಿಮ್ಮಲ್ಲಿ ಯುನಿಕೋಡ್ ಆಧಾರಿತ ಕನ್ನಡದ ಓಪನ್ಟೈಪ್ ಫಾಂಟ್ ಇರತಕ್ಕದ್ದು. ಯುನಿಕೋಡ್ನಲ್ಲಿ ತಯಾರಿಸಿದ ಕಡತವನ್ನು ಬೇರೊಬ್ಬರಿಗೆ ಕಳುಹಿಸುವಾಗ ಕಡತದ ಜೊತೆ ನಿಮ್ಮ ಅಕ್ಷರಶೈಲಿಯನ್ನೂ ಕಳುಹಿಸುವ ಅಗತ್ಯವಿಲ್ಲ. ನಿಮ್ಮಲ್ಲಿರುವ ಓಪನ್ಟೈಪ್ ಫಾಂಟ್ ಮತ್ತು ನಿಮ್ಮ ಸ್ನೇಹಿತರಲ್ಲಿರುವ ಓಪನ್ಟೈಪ್ ಫಾಂಟ್ ಬೇರೆ ಬೇರೆ ಇರಬಹುದು. ಮಾಹಿತಿಯನ್ನು ಅಕ್ಷರಶೈಲಿಯ ಸಂಕೇತಗಳ ಬದಲಿಗೆ ಮೂಲ ಮಾಹಿತಿಯಾಗಿಯೇ ಕಳುಹಿಸುವುದರಿಂದ ಮಾಹಿತಿ ಸಂವಹನೆಯಲ್ಲಿ ಯಾವ ತೊಡಕೂ ಇಲ್ಲ.
ಯುನಿಕೋಡ್ನಲ್ಲಿ ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಸಂಕೇತಗಳಿರುವುದು ಮಾತ್ರವಲ್ಲ, ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸೂತ್ರವೂ ಯುನಿಕೋಡ್ನಲ್ಲಿದೆ. ಇಸ್ಕಿಯಲ್ಲಿರುವ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸಮಸ್ಯೆಗೆ ಯುನಿಕೋಡ್ನಲ್ಲಿ ಪರಿಹಾರಹವಿದೆ. ಯುನಿಕೋಡ್ನ ಹಳೆಯ ಆವೃತ್ತಿಯಲ್ಲಿ ಕನ್ನಡದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಗೆ ಇಸ್ಕಿಯಲ್ಲಿನ ಸೂತ್ರವನ್ನೇ ಬಳಸಲಾಗಿತ್ತು. ಆದರೆ ಯುನಿಕೋಡ್ನ ೪.೦ ಆವೃತ್ತಿಯಲ್ಲಿ ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲಾಗಿದೆ.
ಪ್ರಪಂಚದ ಖ್ಯಾತ ಗಣಕ ಕಂಪೆನಿಗಳು, ತಂತ್ರಾಂಶ ತಯಾರಕರು, ದೇಶಗಳು ಸೇರಿ ಆಗಿರುವ ಒಂದು ಸಂಸ್ಥೆ ಯುನಿಕೋಡ್ ಕನ್ಸೋರ್ಟಿಯಂ. ಭಾರತ ದೇಶವೂ ಇದರ ಸದಸ್ಯತ್ವ ಹೊಂದಿದೆ. ಯುನಿಕೋಡ್ ಒಂದು ಕಂಪೆನಿಯ ಸ್ವತ್ತಲ್ಲ.
ಮೈಕ್ರೋಸಾಫ್ಟ್ನವರ ವಿಂಡೋಸ್ 7, 8, XP ಮತ್ತು ಸರ್ವರ್ ೨೦೦೩ ಕಾರ್ಯಾಚರಣ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ (operating system) ಕನ್ನಡದ ಯುನಿಕೋಡ್ ಸವಲತ್ತನ್ನು ನೀಡಲಾಗಿದೆ. ವಿಂಡೋಸ್ ಎಂಇ, ೯೮, ೯೫, ಇತ್ಯಾದಿಗಳಲ್ಲಿ ಯುನಿಕೋಡ್ನ ಸೌಲಭ್ಯ (ಸರಿಯಾಗಿ) ಇಲ್ಲವೆಂದೇ ಹೇಳಬಹುದು. ಕನ್ನಡ ಲಿನಕ್ಸ್ನಲ್ಲಿ ನೇರವಾಗಿ ಯುನಿಕೋಡ್ನ್ನೇ ಬಳಸಲಾಗಿದೆ. ಅಂದರೆ ವಿಂಡೋಸ್ನಲ್ಲಿ ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿದರೆ ಅದನ್ನು ಲಿನಕ್ಸ್ನಲ್ಲಿ ಯಾವ ತೊಂದರೆಯೂ ಇಲ್ಲದೆ ಓದಬಹುದು.
ಯುನಿಕೋಡ್ ಸಹಯೋಗ ಸಮಿತಿ
[ಬದಲಾಯಿಸಿ]ಕ್ಯಾಲಿಫೊರ್ನಿಯ ಸ್ಥಿತ ಯುನಿಕೋಡ್ ಸಹಯೋಗ ಸಮಿತಿ (Unicode Consortium) ಮೊಟ್ಟಮೊದಲಾಗಿ ೧೯೯೧ರಲ್ಲಿ "ದ ಯುನಿಕೋಡ್ ಸ್ಟ್ಯಾಂಡರ್ಡ್" (ISBN ೦-೩೨೧-೧೮೫೭೮-೧) ಎಂಬ ಸ್ಟ್ಯಾಂಡರ್ಡ್ ಹೊರತಂದಿತು. ಈಗಲೂ ಕೂಡ ಆ ಮೂಲ ಕೆಲಸವನ್ನುಪಯೋಗಿಸಿಕೊಂಡು ಹಲವು ನಿರ್ದಿಷ್ಟಮಾನಗಳನ್ನು ಹೊರತರಲಾಗುತ್ತಿದೆ. 'ಇಂಟರ್ನ್ಯಾಷನಲ್ ಆರ್ಗನೈಝೇಶನ್ ಫಾರ್ ಸ್ಟ್ಯಾಂಡರ್ಡೈಝೇಶನ್' ಜೊತೆಜೊತೆಗೆ ವಿಕಸಿತಗೊಂಡ ಯುನಿಕೋಡ್, ತನ್ನ ಅಕ್ಷರಗಳ ಸಮೃದ್ಧ ಕಣಜವನ್ನು ISO/IEC ೧೦೬೪೬ ಜೊತೆ ಹಂಚಿಕೊಳ್ಳುತ್ತಿದೆ. ಯುನಿಕೋಡ್ ಹಾಗೂ ISO/IEC ೧೦೬೪೬ ಸಮನಾದ ಅಕ್ಷರ ಎನ್ಕೋಡಿಂಗ್ ಗಳಾಗಿದ್ದರೂ, ಯುನಿಕೋಡ್ ನಿರ್ದಿಷ್ಟಮಾನ ಇಂಪ್ಲಿಮೆಂಟರ್ಗಳು, ಬಿಟ್ ವೈಸ್ ಎನ್ಕೋಡಿಂಗ್, ಕೊಲ್ಲೇಶನ್, ರೆಂಡರಿಂಗ್ ಹಾಗೂ ಮತ್ತಷ್ಟು ಹಲವು ವಿಷಯಗಳ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿ ಹೊಂದಿದೆ. ಅದಲ್ಲದೆ, ಇವೆರಡೂ ನಿರ್ದಿಷ್ಟಮಾನಗಳು ಕೆಲವು ಅಸಮಾನ ಶಬ್ದ ಪ್ರಯೋಗಗಳನ್ನು (Terminology) ಹೊಂದಿವೆ.
ಮ್ಯಾಪಿಂಗ್
[ಬದಲಾಯಿಸಿ]ಈ ವಿವರವನ್ನು ನೋಡಿ. (ಆಂಗ್ಲ ಭಾಷೆಯಲ್ಲಿದೆ)
ಯುನಿಕೋಡ್ ಪೈಪ್ ಲೈನ್
[ಬದಲಾಯಿಸಿ]ಹೊಸ ಅಕ್ಷರಗಳನ್ನು ಈಗಾಗಲೇ ಕೂಡಿಸಲ್ಪಟ್ಟ ಯುನಿಕೋಡ್ ನಿರ್ಧಿಷ್ಟಮಾನಕ್ಕೆ ಮತ್ತು ISO/IEC 10646ಗೆ ಸ್ವೀಕರಿಸಲು ಬಹಳ ದೂರದ ಹಾದಿ ತುಳಿಯಬೇಕಾಗಬಹುದು. ಆದ್ದರಿಂದ ಇದರ ಬಳಕೆದಾರರಿಗೆ ಹಾಗು ಪ್ರಬಂಧಕರಿಗೆ ಮುಂದೆ ಬರುವ ಸೇರ್ಪಡೆಗಳೆಡೆಗೆ ಗಮನವಿರಿಸುವುದಕ್ಕೆ ಸಹಾಯ ಮಾಡಲು ಯುನಿಕೋಡ್ ಪೈಪ್ ಲೈನ್ ಟೇಬಲ್ ಇದುವರೆಗೆ ಪ್ರಸ್ತಾಪಿಸಿದ ಕೋಡ್ ಪಾಯಿಂಟ್ಗಳನ್ನು ಹಾಗು ಹೊಸ ಅಕ್ಷರಗಳ ಈಗಿನ ಸ್ಥಿತಿಯನ್ನು ತಿಳಿಸುತ್ತದೆ. ಹೊಸ ಸ್ಕ್ರಿಪ್ಟ್ ಗಳು ಅಥವಾ ಅಕ್ಷರಗಳು ಯುನಿಕೋಡ್ ಪೈಪ್ಲೈನ್ ಸೇರುವ ಮುನ್ನ 'Characters and Scripts Under Investigation' ಅಥವಾ 'Proposed new scripts' ವರ್ಗಗಳ ಕೆಳಗೆ ನಾವು ಅವನ್ನು ಕಾಣಬಹುದು. ಪ್ರಸ್ತಾವನೆಗಳು ಮುಕ್ತವಾಗಿ ನಡೆಯುವುದಲ್ಲದೆ ಎಲ್ಲೆಡೆಯಿಂದಲೂ ಪ್ರತಿಕ್ರಿಯೆಗಳನ್ನು ಆಮಂತ್ರಿಸಲಾಗುತ್ತದೆ.