ಸದಸ್ಯ:Ananth subray/sandbox1/Bsc/2
ಡೇಟಾ ಅನಲ್ಯ್ಸಿಸ್
[ಬದಲಾಯಿಸಿ]
ಡೇಟಾ ಅನಲ್ಯ್ಸಿಸ್ ಉಪಯುಕ್ತ ಮಾಹಿತಿಯನ್ನು ಪತ್ತೆಹಚ್ಚುವ ಗುರಿ, ತೀರ್ಮಾನಗಳನ್ನು ಸೂಚಿಸುವ ಮತ್ತು ನಿರ್ಧಾರ ತೆಗೆದುಕೊಳ್ಳುವಿಕೆಯನ್ನು ಬೆಂಬಲಿಸುವ ಗುರಿಯೊಂದಿಗೆ ಡೇಟಾವನ್ನು ಪರಿವೀಕ್ಷಿಸುವುದು, ಶುದ್ಧೀಕರಿಸುವುದು, ಮಾರ್ಪಡಿಸುವುದು ಮತ್ತು ಮಾರ್ಪಡಿಸುವ ಪ್ರಕ್ರಿಯೆ.ಡೇಟಾ ಅನಲ್ಯ್ಸಿಸ್ ಅನ್ನು ವಿವಿಧ ದೃಷ್ಟಿಕೋನಗಳು ಮತ್ತು ವಿಧಾನಗಳು, ವಿಭಿನ್ನ ಹೆಸರುಗಳ ಅಡಿಯಲ್ಲಿ ವಿವಿಧ ವ್ಯವಹಾರ, ವಿಜ್ಞಾನ, ಮತ್ತು ಸಾಮಾಜಿಕ ವಿಜ್ಞಾನ ಡೊಮೇನ್ಗಳಲ್ಲಿ ಉಪಯೋಗಿಸುತ್ತಾರೆ.
ಡೇಟಾ ಪ್ರಕ್ರಿಯೆ ಒದಗಿಸಿದ ಮಾಹಿತಿಯ ಪ್ರತಿಯೊಂದು ಘಟಕವನ್ನು ಪರೀಕ್ಷಿಸಲು ವಿಶ್ಲೇಷಣಾತ್ಮಕ ಮತ್ತು ತಾರ್ಕಿಕ ತರ್ಕವನ್ನು ಬಳಸಿಕೊಂಡು ಮೌಲ್ಯಮಾಪನ ಮಾಡುವುದು.ಸಂಶೋಧನಾ ಪ್ರಯೋಗ ನಡೆಸುವಾಗ ಈ ರೀತಿ ಅನಲ್ಯ್ಸಿಸ್ ಪೂರ್ಣಗೊಳ್ಳಬೇಕಾದ ಅನೇಕ ಹಂತಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ.ವಿವಿಧ ಮೂಲಗಳಿಂದ ಪಡೆದ ಮಾಹಿತಿಯು ಸಂಗ್ರಹಣೆ, ವಿಮರ್ಶೆ ಮತ್ತು ನಂತರ ವಿಶ್ಲೇಷಣೆಗೆ ಕೆಲವು ರೀತಿಯ ಶೋಧನೆ ಅಥವಾ ತೀರ್ಮಾನವನ್ನು ರೂಪಿಸುತ್ತದೆ.
ವಿವಿಧ ನಿರ್ದಿಷ್ಟ ದತ್ತಾಂಶ ವಿಶ್ಲೇಷಣೆ ವಿಧಾನಗಳಿವೆ, ಅವುಗಳಲ್ಲಿ ಕೆಲವು
೧. ಡೇಟಾ ಮೈನಿಂಗ್
೨. ಟೆಕ್ಸ್ಟ್ ಅನಲಿಟಿಕ್ಸ್
೩. ಬಿಸಸ್ನೆಸ್ ಇಂಟೆಲಿಜೆನ್ಸ್
೪. ಡೇಟಾ ವಿಶ್ಯುವಲೈಜೆಶನ್
ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಅನ್ವಯಿಕೆಗಳಲ್ಲಿ ಡೇಟಾ ಅನಲ್ಯ್ಸಿಸ್ಯನ್ನು ವಿವರಣಾತ್ಮಕ ಅಂಕಿಅಂಶಗಳು, ಪರಿಶೋಧನಾತ್ಮಕ ಡೇಟಾ ಅನಲ್ಯ್ಸಿಸ್ (ಇಡಿಎ), ಮತ್ತು ದೃಢೀಕರಣ ಡೇಟಾ ಅನಲ್ಯ್ಸಿಸ್ (ಸಿಡಿಎ) ಎಂದು ವಿಂಗಡಿಸಬಹುದು.ಇಡಿಎಯು ಹೊಸ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಪತ್ತೆಹಚ್ಚುವಲ್ಲಿ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ ಮತ್ತು ಸಿಡಿಎ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಸಿದ್ಧಾಂತಗಳನ್ನು ದೃಢೀಕರಿಸುವುದು ಅಥವಾ ತಪ್ಪಾಗಿ ನಿರೂಪಿಸುವುದು.ಪ್ರಿದಿಕ್ಟಿವ್ ಅನಲ್ಯ್ಸಿಸ್ ಮುಖ್ಯವಾಗಿ ವರ್ಗೀಕರಣಕ್ಕೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ ಹಾಗು ಆದರೆ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಮಾದರಿಗಳನ್ನು ವಿವರಿಸುತ್ತದೆ.
ಡೇಟಾ ಅನಲ್ಯ್ಸಿಸ್ ಪ್ರಕ್ರಿಯೆಗಳು
[ಬದಲಾಯಿಸಿ]ಅನಲ್ಯ್ಸಿಸ್ ಪ್ರತ್ಯೇಕ ಪರೀಕ್ಷೆಗೆ ಸಂಬಂಧಿಸಿದಂತೆ ಅದರ ಸಂಪೂರ್ಣ ಅಂಶಗಳನ್ನು ವಿಭಜಿಸಲು ಸೂಚಿಸುತ್ತದೆ.ಡೇಟಾ ಅನಲ್ಯ್ಸಿಸ್ ಎಂಬುದು ಕಚ್ಚಾ ಡೇಟಾವನ್ನು ಪಡೆಯುವ ಪ್ರಕ್ರಿಯೆ ಮತ್ತು ಬಳಕೆದಾರರಿಂದ ನಿರ್ಧಾರ ತೆಗೆದುಕೊಳ್ಳುವಲ್ಲಿ ಉಪಯುಕ್ತವಾಗುವಂತೆ ಅದನ್ನು ಪರಿವರ್ತಿಸುವ ಪ್ರಕ್ರಿಯೆಯಾಗಿದೆ.ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸಲು, ಊಹೆಗಳನ್ನು ಪರೀಕ್ಷಿಸಲು ಅಥವಾ ಸಿದ್ಧಾಂತಗಳನ್ನು ತಳ್ಳಿಹಾಕಲು ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ವಿಶ್ಲೇಷಿಸಲಾಗುತ್ತದೆ.
೧೯೬೧ರಲ್ಲಿ ಸಂಖ್ಯಾಶಾಸ್ತ್ರಜ್ಞರಾದ್ದ ಜಾನ್ ಟುಕಿಯವರು ಅ೦ಕಿ-ಅಂಶಗಳನ್ನು ವಿಶ್ಲೇಷಿಸುವ ಕಾರ್ಯವಿಧಾನಗಳು, ಅಂತಹ ಕಾರ್ಯವಿಧಾನಗಳ ಫಲಿತಾಂಶಗಳನ್ನು ಅರ್ಥೈಸಿಕೊಳ್ಳುವ ತಂತ್ರಗಳು, ಡೇಟಾವನ್ನು ಒಟ್ಟುಗೂಡಿಸುವ ಯೋಜನೆಗಳನ್ನು ಅದರ ವಿಶ್ಲೇಷಣೆಯನ್ನು ಸುಲಭವಾಗಿಸಲು, ಹೆಚ್ಚು ನಿಖರವಾದ ಹಾಗು ಎಲ್ಲಾ ಯಂತ್ರೋಪಕರಣಗಳು ಮತ್ತು ಫಲಿತಾಂಶಗಳನ್ನು ವ್ಯಾಖ್ಯಾನಿಸುವ ವಿಧಾನಗಳು ಎ೦ದು ವ್ಯಾಖ್ಯಾನಿಸಿದಾರೆ.
===ಡೇಟಾ ಅವಶ್ಯಕತೆಗಳು===. ಅನಲ್ಯ್ಸಿಸ್ಯನ್ನು ನಿರ್ದೇಶಿಸುವ ಅಗತ್ಯತೆಗಳ ಆಧಾರದ ಮೇಲೆ ವಿಶ್ಲೇಷಣೆಗೆ ಒಳಹರಿಸಿ ಡೇಟಾವನ್ನು ನಿರ್ದಿಷ್ಟಪಡಿಸುತ್ತದೆ.ಡೇಟಾ ಸಂಗ್ರಹಿಸಲ್ಪಡುವ ಘಟಕದ ಸಾಮಾನ್ಯ ಪ್ರಕಾರವನ್ನು ಪ್ರಾಯೋಗಿಕ ಘಟಕ ಎಂದು ಉಲ್ಲೇಖಿಸಲಾಗುತ್ತದೆ (ಉದಾ: ಜನರ ವ್ಯಕ್ತಿ ಅಥವಾ ಜನಸಂಖ್ಯೆ).ಸಂಖ್ಯೆಗೆ (ಉದಾ: ವಯಸ್ಸು ಮತ್ತು ಆದಾಯ) ಕುರಿತು ನಿರ್ದಿಷ್ಟ ಅಸ್ಥಿರಗಳನ್ನು ನಿರ್ದಿಷ್ಟಪಡಿಸಬಹುದು ಮತ್ತು ಪಡೆಯಬಹುದು.ಡೇಟಾ ಸಂಖ್ಯಾತ್ಮಕ ಅಥವಾ ವರ್ಗೀಯವಾಗಿರಬಹುದು.
ಡೇಟಾ ಸಂಗ್ರಹಣೆ
[ಬದಲಾಯಿಸಿ]ಡೇಟಾವನ್ನು ವಿವಿಧ ಮೂಲಗಳಿಂದ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ.ಅಗತ್ಯತೆಗಳು ಮಾಹಿತಿಯ ರಕ್ಷಕರಿಗೆ ವಿಶ್ಲೇಷಕರಿಂದ ಸಂವಹನ ನಡೆಸಬಹುದು.ಟ್ರಾಫಿಕ್ ಕ್ಯಾಮೆರಾಗಳು, ಉಪಗ್ರಹಗಳು, ರೆಕಾರ್ಡಿಂಗ್ ಸಾಧನಗಳು ಮುಂತಾದ ಪರಿಸರದಲ್ಲಿ ಸಂವೇದಕಗಳಿಂದ ಕೂಡಾ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಬಹುದು. ಇದನ್ನು ಇಂಟರ್ವ್ಯೂ, ಆನ್ಲೈನ್ ಮೂಲಗಳಿಂದ ಡೌನ್ಲೋಡ್ಗಳು ಅಥವಾ ಓದುವಿಕೆಯ ಮೂಲಕ ಪಡೆಯಬಹುದು.
ಡೇಟಾ ಸಂಸ್ಕರಣೆ
[ಬದಲಾಯಿಸಿ]ಆರಂಭದಲ್ಲಿ ಪಡೆದುಕೊಂಡಿರುವ ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಣೆಗಾಗಿ ಸಂಸ್ಕರಿಸಬೇಕು ಅಥವಾ ಆಯೋಜಿಸಬೇಕು.ಉದಾಹರಣೆಗೆ: ಸ್ಪ್ರೆಡ್ಷೀಟ್ ಅಥವಾ ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ ಸಾಫ್ಟ್ವೇರ್ನಂತಹ ಹೆಚ್ಚಿನ ವಿಶ್ಲೇಷಣೆಗಾಗಿ ಡೇಟಾವನ್ನು ಕೋಷ್ಟಕ ಸ್ವರೂಪದಲ್ಲಿ (ಅಂದರೆ, ರಚನಾತ್ಮಕ ಡೇಟಾ) ಸಾಲುಗಳನ್ನು ಮತ್ತು ಕಾಲಮ್ಗಳಾಗಿ ಇರಿಸುವುದು.
ಪರಿಶೋಧನಾತ್ಮಕ ಡೇಟಾ ಅನಲ್ಯ್ಸಿಸ್
[ಬದಲಾಯಿಸಿ]ಡೇಟಾವನ್ನು ಸ್ವಚ್ಛಗೊಳಿಸಿದ ನಂತರ, ಅದನ್ನು ವಿಶ್ಲೇಷಿಸಬಹುದು.ಡೇಟಾದಲ್ಲಿ ಒಳಗೊಂಡಿರುವ ಸಂದೇಶಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಪ್ರಾರಂಭಿಸುವ ಪರಿಶೋಧನಾತ್ಮಕ ಡೇಟಾ ಅನಲ್ಯ್ಸಿಸ್ ಎಂದು ಕರೆಯಲ್ಪಡುವ ವಿವಿಧ ತಂತ್ರಗಳನ್ನು ವಿಶ್ಲೇಷಕರು ಅನ್ವಯಿಸಬಹುದು.ಪರಿಶೋಧನೆಯ ಪ್ರಕ್ರಿಯೆ ಹೆಚ್ಚುವರಿ ಡೇಟಾವನ್ನು ಸ್ವಚ್ಛಗೊಳಿಸುವ ಅಥವಾ ಹೆಚ್ಚುವರಿ ವಿನಂತಿಗಳಿಗೆ ಕಾರಣವಾಗಬಹುದು, ಆದ್ದರಿಂದ ಈ ಚಟುವಟಿಕೆಗಳು ಪ್ರಕೃತಿಯಲ್ಲಿ ಪುನರಾವರ್ತನೆಯಾಗಬಹುದು.ಡೇಟಾವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸಹಾಯವಾಗುವಂತೆ ಸರಾಸರಿ ಅಥವಾ ಮಧ್ಯದಂತಹ ವಿವರಣಾತ್ಮಕ ಅಂಕಿಅಂಶಗಳನ್ನು ರಚಿಸಬಹುದು.ಡೇಟಾ ವಿಶ್ಯುವಲೈಜೆಶನ್ ಇ೦ದ ಚಿತ್ರಾತ್ಮಕ ಸ್ವರೂಪದಲ್ಲಿ ಡೇಟಾವನ್ನು ಪರೀಕ್ಷಿಸಲು ಸಹ ಬಳಸಬಹುದು.
ಮಾಡೆಲಿಂಗ್ ಮತ್ತು ಅಲ್ಗೊರಿದ೦
[ಬದಲಾಯಿಸಿ]ಗಣಿತದ ಸೂತ್ರಗಳು ಅಥವಾ ಮಾದರಿಗಳಿಗೆ ಅಲ್ಗೊರಿದ೦ ಎನ್ನುತ್ತಾರೆ. ವೇರಿಯಬಲ್ಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಗುರುತಿಸಲು ಅಲ್ಗೊರಿದ೦ ಅನ್ನು ಡೇಟಾಕ್ಕೆ ಅನ್ವಯಿಸಬಹುದು. ಸಾಮಾನ್ಯ ಪರಿಭಾಷೆಯಲ್ಲಿ, ಮಾದರಿ ನಿಖರತೆ (ಅಂದರೆ, ಡೇಟಾ = ಮಾಡೆಲ್ + ಎರರ್) ಅವಲಂಬಿಸಿ ಕೆಲವು ಉಳಿದಿರುವ ಎರರ್ದೊಂದಿಗೆ ಡೇಟಾದಲ್ಲಿ ಇತರ ವೇರಿಯಬಲಗಳ ಆಧಾರದ ಮೇಲೆ ನಿರ್ದಿಷ್ಟ ವೇರಿಯೇಬಲ್ ಮೌಲ್ಯಮಾಪನ ಮಾಡಲು ಅಭಿವೃದ್ಧಿಪಡಿಸಬಹುದು.
ತಾರ್ಕಿಕ ಸಂಖ್ಯಾಶಾಸ್ತ್ರವು ನಿರ್ದಿಷ್ಟ ಅಸ್ಥಿರ ನಡುವಿನ ಸಂಬಂಧಗಳನ್ನು ಅಳೆಯಲು ತಂತ್ರಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಗಣಿತದ ಪರಿಭಾಷೆಯಲ್ಲಿ, Y (ಮಾರಾಟ) ಎನ್ನುವುದು X (ಜಾಹೀರಾತಿನ) ಕಾರ್ಯವಾಗಿದೆ. ಇದನ್ನು Y = aX + b + ಎರರ್ ಎ೦ದು ವಿವರಿಸಬಹುದು, ಉದಾಹರಣೆಗೆ ಒಂದು ಮಾಡೆಲ್ X'ಗೆ ಮೌಲ್ಯವನ್ನು ನಿರ್ದಿಷ್ಟಪಡಿಸಿದ ಶ್ರೇಣಿಯ Y ಗೆ ಮುನ್ಸೂಚನೆ ನೀಡಿದಾಗ ದೋಷವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ.ವಿಶ್ಲೇಷಕರ ಸರಳ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಫಲಿತಾಂಶಗಳನ್ನು ಸಂವಹನ ಮಾಡಲು ಡೇ ವಿವರಣಾತ್ಮಕ ಮಾಡೆಲಿಂಗ್ ಅನ್ನು ಪ್ರಯತ್ನಿಸಬಹುದು.
ಡೇಟಾ ಉತ್ಪನ್ನ
[ಬದಲಾಯಿಸಿ]ಡೇಟಾ ಉತ್ಪನ್ನವು ಡೇಟಾ ಇನ್ಪುಟ್ಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ ಮತ್ತು ಉತ್ಪನ್ನಗಳನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ.ಇದು ಮಾಡೆಲಿಂಗ್ ಮತ್ತು ಅಲ್ಗೊರಿದ೦ಗಳ ಮೇಲೆ ಆಧರಿಸಿರಬಹುದು.
ಸ೦ಪರ್ಕ
[ಬದಲಾಯಿಸಿ]ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸಿದ ನಂತರ, ಅದರ ಅವಶ್ಯಕತೆಗಳನ್ನು ಬೆಂಬಲಿಸಲು ವಿಶ್ಲೇಷಣೆಯ ಬಳಕೆದಾರರಿಗೆ ಅನೇಕ ಸ್ವರೂಪಗಳಲ್ಲಿ ಅದನ್ನು ವರದಿ ಮಾಡಬಹುದು.ಬಳಕೆದಾರರು ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಹೊಂದಿರಬಹುದು, ಇದು ಹೆಚ್ಚುವರಿ ವಿಶ್ಲೇಷಣೆಗೆ ಕಾರಣವಾಗುತ್ತದೆ.
ಫಲಿತಾಂಶಗಳನ್ನು ಸಂವಹನ ಮಾಡುವುದು ಹೇಗೆ ಎಂದು ನಿರ್ಧರಿಸುವಾಗ, ವಿಶ್ಲೇಷಕನು ಸಂದೇಶವನ್ನು ಸಂವಹನಕ್ಕೆ ಸ್ಪಷ್ಟವಾಗಿ ಮತ್ತು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಸಂವಹಿಸಲು ಸಹಾಯ ಮಾಡಲು ಡೇಟಾ ವಿಶ್ಯುವಲೈಜೆಶನ್ ತಂತ್ರಗಳನ್ನು ಪರಿಗಣಿಸಬಹುದು.ಸಂಖ್ಯೆಗಳನ್ನು ಹುಡುಕುವಂತಹ ಬಳಕೆದಾರರಿಗೆ ಕೋಷ್ಟಕಗಳು ಸಹಾಯಕವಾಗುತ್ತವೆ, ಆದರೆ ಪಟ್ಟಿಯಲ್ಲಿ (ಉದಾ: ಬಾರ್ ಚಾರ್ಟ್ಗಳು ಅಥವಾ ಲೈನ್ ಚಾರ್ಟ್ಗಳು) ಡೇಟಾದಲ್ಲಿ ಒಳಗೊಂಡಿರುವ ಪರಿಮಾಣಾತ್ಮಕ ಸಂದೇಶಗಳನ್ನು ವಿವರಿಸಲು ಸಹಾ ಉಪಯೋಗಿಸಬಹುದು.
ಉಲ್ಲೇಖಗಳು
[ಬದಲಾಯಿಸಿ]- ↑ https://en.wikipedia.org/wiki/Data_analysis
- ↑ www.businessdictionary.com/definition/data-analysis.html
- ↑ https://www.ngdata.com/what-is-data-analysis/
- ↑ https://study.com/academy/lesson/what-is-data-analysis-definition-overview.html