ವಿಷಯಕ್ಕೆ ಹೋಗು

ಸಹಜ ಭಾಷಾ ಸಂಸ್ಕರಣೆ

ವಿಕಿಪೀಡಿಯದಿಂದ, ಇದು ಮುಕ್ತ ಹಾಗೂ ಸ್ವತಂತ್ರ ವಿಶ್ವಕೋಶ


ನ್ಯಾಚುರಲ್ ಲ್ಯಾಂಗ್ವೇಜ್ ಪ್ರೊಸೆಸಿಂಗ್ (ಎನ್. ಎಲ್. ಪಿ.) ಎಂಬುದು ಕಂಪ್ಯೂಟರ್ ವಿಜ್ಞಾನ ಮತ್ತು ವಿಶೇಷವಾಗಿ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಯ ಉಪಕ್ಷೇತ್ರವಾಗಿದೆ. ಇದು ಮುಖ್ಯವಾಗಿ ಕಂಪ್ಯೂಟರ್ ಗಳಿಗೆ ನೈಸರ್ಗಿಕ ಭಾಷೆ ಎನ್ಕೋಡ್ ಮಾಡಲಾದ ದತ್ತಾಂಶವನ್ನು ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಒದಗಿಸುವುದಕ್ಕೆ ಸಂಬಂಧಿಸಿದೆ ಮತ್ತು ಹೀಗಾಗಿ ಮಾಹಿತಿ ಮರುಪಡೆಯುವಿಕೆ, ಜ್ಞಾನ ಪ್ರಾತಿನಿಧ್ಯ ಮತ್ತು ಭಾಷಾಶಾಸ್ತ್ರ ಉಪಕ್ಷೇತ್ರವಾದ ಕಂಪ್ಯೂಟೇಶನಲ್ ಭಾಷಾಶಾಸ್ತ್ರಕ್ಕೆ ನಿಕಟ ಸಂಬಂಧ ಹೊಂದಿದೆ. ಸಾಮಾನ್ಯವಾಗಿ ದತ್ತಾಂಶವನ್ನು ಪಠ್ಯ ಸಮೂಹದಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ. ಇದರ ಜೊತೆಗೆ ಯಂತ್ರ ಕಲಿಕೆ (ಮಷೀನ್ ಲರ್ನಿಂಗ್) ಮತ್ತು ಡೀಪ್ ಲರ್ನಿಂಗ್ ಗಳಲ್ಲಿ ನಿಯಮ-ಆಧಾರಿತ, ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಅಥವಾ ನರ-ಆಧಾರಿತ ವಿಧಾನಗಳನ್ನು ಬಳಸಲಾಗುತ್ತದೆ.

ನ್ಯಾಚುರಲ್ ಲ್ಯಾಂಗ್ವೇಜ್ ಪ್ರೊಸೆಸಿಂಗ್ ನಲ್ಲಿನ ಪ್ರಮುಖ ಕಾರ್ಯಗಳೆಂದರೆ ಭಾಷಣ (ಸ್ಪೀಚ್) ಗುರುತಿಸುವಿಕೆ, ಪಠ್ಯ ವರ್ಗೀಕರಣ, ನೈಸರ್ಗಿಕ-ಭಾಷಾ ತಿಳುವಳಿಕೆ ಮತ್ತು ನೈಸರ್ಗಿಕ-ಭಾಷಾ ಪೀಳಿಗೆ ಮಾಹಿತಿ.

ಇತಿಹಾಸ

[ಬದಲಾಯಿಸಿ]

ನ್ಯಾಚುರಲ್ ಲ್ಯಾಂಗ್ವೇಜ್ ಪ್ರೊಸೆಸಿಂಗ್ 1950ರ ದಶಕದಲ್ಲಿ ತನ್ನ ಬೇರುಗಳನ್ನು ಹೊಂದಿದೆ. 1950ರಲ್ಲಿ, ಅಲನ್ ಟ್ಯೂರಿಂಗ್ "ಕಂಪ್ಯೂಟಿಂಗ್ ಮೆಷಿನರಿ ಅಂಡ್ ಇಂಟೆಲಿಜೆನ್ಸ್" ಎಂಬ ಶೀರ್ಷಿಕೆಯ ಲೇಖನವೊಂದನ್ನು ಪ್ರಕಟಿಸಿದ್ದರು. ಅದು ಈಗ ಟ್ಯೂರಿಂಗ್ ಪರೀಕ್ಷೆ ಎಂದು ಕರೆಯಲ್ಪಡುವ ಬುದ್ಧಿಮತ್ತೆಯ ಮಾನದಂಡವನ್ನು ಪ್ರಸ್ತಾಪಿಸಿದೆ. ಆದರೆ ಆ ಸಮಯದಲ್ಲಿ ಅದನ್ನು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಯಿಂದ ಪ್ರತ್ಯೇಕವಾದ ಸಮಸ್ಯೆಯೆಂದು ವ್ಯಕ್ತಪಡಿಸಲಾಗಲಿಲ್ಲ. ಪ್ರಸ್ತಾವಿತ ಪರೀಕ್ಷೆಯು ಸ್ವಯಂಚಾಲಿತ ವ್ಯಾಖ್ಯಾನ ಮತ್ತು ನೈಸರ್ಗಿಕ ಭಾಷೆಯ ಉತ್ಪಾದನೆಯನ್ನು ಒಳಗೊಂಡಿರುವ ಕಾರ್ಯವನ್ನು ಒಳಗೊಂಡಿದೆ.

ಸಾಂಕೇತಿಕ ಎನ್ಎಲ್ ಪಿ (1950-1990ರ ದಶಕದ ಆರಂಭ)

[ಬದಲಾಯಿಸಿ]

ಸಾಂಕೇತಿಕ ಎನ್ಎಲ್ ಪಿ ಯ ಪ್ರಮೇಯವನ್ನು ಜಾನ್ ಸಿಯರ್ಲೆ ಅವರ ಚೀನೀ ಕೊಠಡಿ ಪ್ರಯೋಗದಿಂದ ಚೆನ್ನಾಗಿ ಸಂಕ್ಷೇಪಿಸಲಾಗಿದೆಃ ನಿಯಮಗಳ ಸಂಗ್ರಹವನ್ನು ನೀಡಲಾಗಿದೆ (ಉದಾಹರಣೆಗೆ, ಚೀನೀ ನುಡಿಗಟ್ಟು ಪುಸ್ತಕ, ಪ್ರಶ್ನೆಗಳು ಮತ್ತು ಹೊಂದಾಣಿಕೆಯ ಉತ್ತರಗಳೊಂದಿಗೆ) ಕಂಪ್ಯೂಟರ್ ನೈಸರ್ಗಿಕ ಭಾಷಾ ತಿಳುವಳಿಕೆಯನ್ನು ಅನುಕರಿಸುತ್ತದೆ (ಅಥವಾ ಇತರ ಎನ್ಎಲ್ ಪಿ ಕಾರ್ಯಗಳು). ಆ ನಿಯಮಗಳನ್ನು ಅದು ಎದುರಿಸುತ್ತಿರುವ ದತ್ತಾಂಶಕ್ಕೆ ಅನ್ವಯಿಸಲಾಗುತ್ತದೆ.

  • 1950ರ ದಶಕ 1954ರ ಜಾರ್ಜ್ಟೌನ್ ಪ್ರಯೋಗ ಅರವತ್ತಕ್ಕೂ ಹೆಚ್ಚು ರಷ್ಯನ್ ವಾಕ್ಯಗಳನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಇಂಗ್ಲಿಷ್ ಗೆ ಅನುವಾದಿಸುವುದನ್ನು ಒಳಗೊಂಡಿತ್ತು. ಮೂರು ಅಥವಾ ಐದು ವರ್ಷಗಳಲ್ಲಿ, ಯಂತ್ರ ಅನುವಾದ(ಮಷೀನ್ ಟ್ರಾನ್ಸ್ ಲೇಷನ್)ವು ಪರಿಹರಿಸಿದ ಸಮಸ್ಯೆಯಾಗಲಿದೆ ಎಂದು ಲೇಖಕರು ಹೇಳಿದ್ದರು ಆದಾಗ್ಯೂ, ನಿಜವಾದ ಪ್ರಗತಿಯು ತುಂಬಾ ನಿಧಾನವಾಗಿತ್ತು, ಮತ್ತು 1966ರಲ್ಲಿ ಹತ್ತು ವರ್ಷಗಳ ಸಂಶೋಧನೆಯು ನಿರೀಕ್ಷೆಗಳನ್ನು ಪೂರೈಸಲು ವಿಫಲವಾಗಿದೆ ಎಂದು ಕಂಡುಹಿಡಿದ ALPAC ವರದಿಯ ನಂತರ, ಯಂತ್ರ ಅನುವಾದಕ್ಕೆ ಹಣಕಾಸಿನ ನೆರವು ನಾಟಕೀಯವಾಗಿ ಕಡಿಮೆಯಾಯಿತು. ಯಂತ್ರ ಅನುವಾದದಲ್ಲಿ ಸ್ವಲ್ಪ ಹೆಚ್ಚಿನ ಸಂಶೋಧನೆಯನ್ನು ಅಮೆರಿಕದಲ್ಲಿ ನಡೆಸಲಾಯಿತು (ಆದಾಗ್ಯೂ ಕೆಲವು ಸಂಶೋಧನೆಗಳು ಜಪಾನ್ ಮತ್ತು ಯುರೋಪ್ ನಂತಹ ಇತರೆಡೆಗಳಲ್ಲಿ ಮುಂದುವರೆದವು, 1980 ರ ದಶಕದ ಅಂತ್ಯದವರೆಗೂ ಮೊದಲ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಯಂತ್ರ ಅನುವಾದ ವ್ಯವಸ್ಥೆಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾಯಿತು.
  • 1960ರ ದಶಕ ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾದ ಕೆಲವು ಗಮನಾರ್ಹವಾಗಿ ಯಶಸ್ವಿಯಾದ ನೈಸರ್ಗಿಕ ಭಾಷಾ ಸಂಸ್ಕರಣಾ ವ್ಯವಸ್ಥೆಗಳೆಂದರೆ ಎಸ್. ಎಚ್. ಆರ್. ಡಿ. ಎಲ್. ಯು, ನಿರ್ಬಂಧಿತ ಶಬ್ದಕೋಶಗಳೊಂದಿಗೆ ನಿರ್ಬಂಧಿತ "ಬ್ಲಾಕ್ ವರ್ಲ್ಡ್ಸ್" ನಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವ ನೈಸರ್ಗಿಕ ಭಾಷಾ ವ್ಯವಸ್ಥೆ, ಮತ್ತು 1964 ಮತ್ತು 1966ರ ನಡುವೆ ಜೋಸೆಫ್ ವೈಜೆನ್ಬಾಮ್ ಬರೆದ ರೋಜೇರಿಯನ್ ಸೈಕೋಥೆರಪಿಸ್ಟ್ ನ ಅನುಕರಣೆಯಾದ ಎಲಿಜಾ. ಮಾನವನ ಆಲೋಚನೆ ಅಥವಾ ಭಾವನೆಯ ಬಗ್ಗೆ ಬಹುತೇಕ ಯಾವುದೇ ಮಾಹಿತಿಯನ್ನು ಬಳಸದೆ, ಎಲಿಜಾ ಕೆಲವೊಮ್ಮೆ ಆಶ್ಚರ್ಯಕರವಾದ ಮಾನವನಂತಹ ಪರಸ್ಪರ ಕ್ರಿಯೆಯನ್ನು ಒದಗಿಸುತ್ತದೆ. "ರೋಗಿಯು" ಬಹಳ ಕಡಿಮೆ ಜ್ಞಾನದ ಮೂಲವನ್ನು ಮೀರಿದಾಗ, ಎಲಿಜಾ ಒಂದು ಸಾಮಾನ್ಯ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ನೀಡಬಹುದು, ಉದಾಹರಣೆಗೆ, "ನನ್ನ ತಲೆ ನೋವುಂಟುಮಾಡುತ್ತದೆ" ಎಂಬುದಕ್ಕೆ "ನಿಮ್ಮ ತಲೆ ನೋವುಂಟಾಗುತ್ತದೆ ಎಂದು ನೀವು ಏಕೆ ಹೇಳುತ್ತೀರಿ?". ನೈಸರ್ಗಿಕ ಭಾಷೆಯ ಮೇಲೆ ರಾಸ್ ಕ್ವಿಲಿಯನ್ ಅವರ ಯಶಸ್ವಿ ಕೆಲಸವನ್ನು ಕೇವಲ ಇಪ್ಪತ್ತು ಪದಗಳ ಶಬ್ದಕೋಶದೊಂದಿಗೆ ಪ್ರದರ್ಶಿಸಲಾಯಿತು, ಏಕೆಂದರೆ ಆ ಸಮಯದಲ್ಲಿ ಕಂಪ್ಯೂಟರ್ ಮೆಮೊರಿಯಲ್ಲಿ ಅದು ಹೊಂದಿಕೊಳ್ಳುತ್ತಿತ್ತು.