ಸದಸ್ಯ:Ashwini2001/ನನ್ನ ಪ್ರಯೋಗಪುಟ: ಪರಿಷ್ಕರಣೆಗಳ ನಡುವಿನ ವ್ಯತ್ಯಾಸ

ವಿಕಿಪೀಡಿಯದಿಂದ, ಇದು ಮುಕ್ತ ಹಾಗೂ ಸ್ವತಂತ್ರ ವಿಶ್ವಕೋಶ
Content deleted Content added
No edit summary
No edit summary
೩೮ ನೇ ಸಾಲು: ೩೮ ನೇ ಸಾಲು:
OCR4 Wikisource
OCR4 Wikisource


OCR4 Wikisource ಎಂಬುದು ಟಿ. ಶ್ರೀನಿವಾಸನ್ ಅವರು ಲಿನಕ್ಸ್ OS ಗಾಗಿ ತಯಾರಿಸಿದ ಒಂದು ಉಚಿತ ಮತ್ತು ಮುಕ್ತತಂತ್ರಾಂಶ. ಇದರಲ್ಲಿ ಗೂಗಲ್ ಡ್ರೈವ್ API ಬಳಸಿಕೊಂಡು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದಲ್ಲಿ (mass) ಗೂಗಲ್ OCR ಮಾಡಬಹುದು.
OCR4 Wikisource ಎಂಬುದು ಟಿ. ಶ್ರೀನಿವಾಸನ್ ಅವರು ಲಿನಕ್ಸ್ OS ಗಾಗಿ ತಯಾರಿಸಿದ ಒಂದು ಉಚಿತ ಮತ್ತು ಮುಕ್ತತಂತ್ರಾಂಶ. ಇದರಲ್ಲಿ ಗೂಗಲ್ ಡ್ರೈವ್ API ಬಳಸಿಕೊಂಡು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದಲ್ಲಿ (mass) ಗೂಗಲ್ OCR ಮಾಡಬಹುದು. ಈ ತಂತ್ರಾಂಶವು ಹೀಗೆ ಕಾರ್ಯ ನಿರ್ವಹಿಸುತ್ತದೆ.
1. ವಿಕಿಮೀಡಿಯಾ ಕಾಮನ್ಸ್ನಿಂದ ಪುಸ್ತಕವನ್ನು ಡೌನ್ಲೋಡ್ ಮಾಡುವುದು.
2. ಆ ಫೈಲನ್ನು ಪ್ರತ್ಯೇಕ ಒಂದೊಂದು ಪುಟಗಳಂತೆ ತುಂಡರಿಸುವುದು.
3. ಅದನ್ನು OCR ಮಾಡಲು ಒಂದೊಂದಾಗಿ ಗೂಗಲ್ ಡ್ರೈವ್ಗೆ ಅಪ್ಲೋಡ್ ಮಾಡುವುದು.
4. OCR ಆದ ಪಠ್ಯವನ್ನು ಡೌನ್ಲೋಡ್ ಮಾಡುವುದು.
5. ಆಯಾ ವಿಕಿಸೋರ್ಸ್ ಪುಟಕ್ಕೆ ಅದನ್ನು ಅಪ್ಲೋಡ್ ಮಾಡುವುದು.
ಈ ಪ್ರೋಗ್ರಾಮ್ ಬಳಸಲು bot ಖಾತೆಯನ್ನು ಸೃಷ್ಟಿ ಮಾಡಿಕೊಳ್ಳುವುದನ್ನು ಶಿಫಾರಸ್ಸು ಮಾಡಲಾಗಿದೆ.

೧೭:೫೫, ೨೪ ಆಗಸ್ಟ್ ೨೦೨೦ ನಂತೆ ಪರಿಷ್ಕರಣೆ

ಪರಿವಿಡಿ ರಚನೆ (NS:Index)

1. ಮುಂದಿನ ಹಂತವೆಂದರೆ, ಆಯಾ ವಿಕಿಸೋರ್ಸಿನಲ್ಲಿ ಆ ಫೈಲಿನ ಪರಿವಿಡಿ ಪುಟಗಳನ್ನು ರಚಿಸುವುದು. (ಅಂದರೆ ಪರಿವಿಡಿ ನೇಮ್ ಸ್ಪೇಸ್ವುಳ್ಳ ಒಂದು ಪುಟ :- Index:)

2. ನೀವು ಟೆಂಪ್ಲೇಟು:Book ಟೆಂಪ್ಲೇಟ್ ಬಳಸಿದ್ದಲ್ಲಿ, ಫೈಲಿನ ವಿವರಣೆಯ ಬಲ ಮೇಲ್ಭಾಗದ ಮೂಲೆಯಲ್ಲಿ ಒಂದು ವಿಕಿಸೋರ್ಸ್ ಲೋಗೊ ನೋಡಬಹುದು. ಅದನ್ನು ಕ್ಲಿಕ್ಕ್ ಮಾಡಿದರೆ ಅದು ನಿಮ್ಮನ್ನು ನಿಮ್ಮ ಭಾಷೆಯ ವಿಕಿಸೋರ್ಸ್ ಪರಿವಿಡಿ ಪುಟಕ್ಕೆ ಕರೆದೊಯ್ಯುತ್ತದೆ.

3. ಅರ್ಜಿಯನ್ನು (form) ತುಂಬಿ ಮತ್ತು ಬಳಸಿ.

ವಿಕಿಸೋರ್ಸಿನ ಹಿನ್ನಲೆಯಲ್ಲಿ ಕೆಲಸ ಮಾಡುವ ಕರಡು ಪರೀಕ್ಷಕರಿಗೆ (proofreaders) ಈ ಪರಿವಿಡಿ ಪುಟಗಳು ಮುಖ್ಯವಾಗಿರುತ್ತವೆ. ಆ ಪರಿವಿಡಿ ಪುಟವು ಆ ಪುಸ್ತಕದ ಎಲ್ಲಾ ಪುಟಗಳಿಗೆ ಕೊಂಡಿಯನ್ನು ತೋರಿಸುತ್ತದೆ. ವಿವಿಧ ಬಣ್ಣಗಳ ಕೋಡ್ ಮೂಲಕ proofreading ಕೆಲಸದ ಸ್ಥಿತಿಗತಿಯನ್ನು ಮತ್ತು ಆ ಪಠ್ಯದ ಕಿರು ಸಾರಾಂಶವನ್ನು ( ಹೆಸರು, ಲೇಖಕ ಇತ್ಯಾದಿ) ತೋರಿಸುತ್ತದೆ. ಬೇರೆ ಬೇರೆ ಭಾಷೆಯ ವಿಕಿಸೋರ್ಸ್ನನಲ್ಲಿ ಪರಿವಿಡಿ ಪುಟದ ಕ್ಷೇತ್ರಗಳು (parameters) ಬೇರೆ ಬೇರೆ ಇರಬಹುದು. ಅದು ಮೀಡಡಿಯಾ ವಿಕಿಯ ಈ ಪುಟದಲ್ಲಿ ಬಳಕೆಯಾದ variables ಮೇಲೆ ಆಧರಿತವಾಗಿದೆ.

Mediawiki: - - - -

Mediawiki:- - - -

ಆದರೆ ಮೂಲಭೂತ ಕ್ಷೇತ್ರಗಳಾದ ಶೀರ್ಷಿಕೆ, ಸಂಪುಟ, ಲೀಖಕ, ಅನುವಾದಕ, ಸಂಪಾದಕ, ಪ್ರಕಾಶಕ, ಪ್ರಕಟಣೆಯ ವರ್ಷ, ಮುಖಪುಟ ಚಿತ್ರ, ಸ್ಥಿತಿಗತಿ, ಪುಟಗಳು ಮತ್ತು Table of content ಎಲ್ಲಾ ವಿಕಿಸೋರ್ಸ್ ಯೋಜನೆಗಳಲ್ಲಿ ಇರಬೇಕು. ಹೆಚ್ಚಿನ ಕ್ಷೇತ್ರಗಳನ್ನು ಸೇರಸಲು ಬಯಸಿದಲ್ಲಿ ನಿಮ್ಮ ವಿಕಿ ಸಮುದಾಯದೊಂದಿಗೆ ಚರ್ಚಿಸಿ ನಂತರ ನಿರ್ವಾಹಕ (admin) ರಲ್ಲಿ ಕೋರಿಕೆ ಸಲ್ಲಿಸಬಹುದು.

ಮೇಲೆ ಕೇಳಿದಂತಹ ಮೂಲಭೂತ ಕ್ಷೇತ್ರಗಳ ಪಟ್ಟಿ (parameters) ಪಟ್ಟಿ ಈ ಕೆಳಕಂಡಂತಿದೆ.

ಶೀರ್ಷಿಕೆ ಆವೃತ್ತಿ ಲೀಖಕ ಅನುವಾದಕ ಸಂಪಾದಕ ಪ್ರಕಾಶಕ ಪ್ರಕಟಣೆಯ ವರ್ಷ ಮೇಲ್ಪುಟದ ಚಿತ್ರ ಸ್ಥಿತಿಗತಿ ಪುಟಗಳು Table of content

ಕೃತಿಯ ಶೀರ್ಷಿಕೆ, ವಿಕಿಲಿಂಕ್ ಆಗಿರಬೇಕು ಕೃತಿಯ ಆವೃತ್ತಿ (ಇದ್ದಲ್ಲಿ) ಕೃತಿಯ ಲೇಖಕ, - ಲೇಖಕರ ನೇಮ್ ಸ್ಪೇಸ್ಗೆ ವಿಕಿಲಿಂಕ್ ಮಾಡಿರಬೇಕು ಕೃತಿಯ ಸಂಪಾದಕ (ಇದ್ದಲ್ಲಿ) ಕೃತಿಯ ಪ್ರಕಾಶಕರು ಕಡ್ಢಾಯ ಪರಿವಿಡಿ ಪುಟದಲ್ಲಿ ಕಾಣಬಯಸುವಂತಹ ಪುಟದ ಚಿತ್ರ ( ಇದು ಪುಟ ಸಂಖ್ಯೆ ೧ ಎಂದು ಪರಿಗಣಿತವಾಗುತ್ತದೆ) ಕರಡು ಪರಿಶೀಲನೆ (proofreading) ಸ್ಥಿತಿಗತಿಯನ್ನು ತೋರಿಸುತ್ತದೆ. (ಮುಂದಿನ ಕೋಷ್ಟಕ ಗಮನಿಸಿ) <pagelist> ಎಂಬ ಟ್ಯಾಗ್ ಸೇರಿಸಿ ಪುಟದ ಪಟ್ಟಿ ಪಡೆಯಿರಿ. ಕೆಳಗೆ ಉದಾಹರಣೆ [2] ನೋಡಿ. T of C ಸೇರಿಸಿ ಸಾಧ್ಯವಾದರೆ.

1. ಸ್ಥಿತಿಗತಿ (progress)

ಪೂರ್ಣಗೊಂಡಿದೆ ದೃಢೀಕರಿಸಬೇಕಿದೆ ಕರಡು ಪರಿಶೀಲಿಸಬೇಕಿದೆ ಮೂಲ ಫೈಲ್ನಲ್ಲಿ ತಪ್ಪುಗಳಿವೆ ಪುಟಪಟ್ಟಿ (pagelist) ಅಗತ್ಯವಿದೆ. ಪ್ರತಿಯೊಂದು ಪುಟದ ದೃಢೀಕರಣ (validation) ಮುಗಿದಿದೆ. ಎಲ್ಲಾ ಪುಟಗಳ ಪರಿಶೀಲನೆ (proofreading) ಮುಗಿದಿದ್ದು ದೃಢೀಕರಿಸಬೇಕಿದೆ. ಪುಸ್ತಕವು ಸಿದ್ಧವಾಗಿದ್ದು ಅದನ್ನು OCR ಮಾಡಬೇಕಿದೆ. ಯಾವುದಾದರೂ ಪುಟಗಳು ಕಾಣೇಯಾಗಿರುವುದು, ಪುಟಗಳ ಕ್ರಮಸಂಖ್ಯೆ ಸರಿಯಿಲ್ಲದಿರುವುದು, ನಕಲಿ ಪುಟಗಳಿರುವುದು ಇತ್ಯಾದಿ. ಪುಟಪಟ್ಟಿಯನ್ನು ತಯಾರಿಸಬೇಕು. ಉದಾಹರಣೆ[೭]ರಲ್ಲಿ ವಿವರಿಸಿದಂತೆ ಮಾಡಿ ಪೂರ್ಣಪಟ್ಟಿ ಪರಿಶೀಲಿಸಬೇಕು.

2. ಪುಟಗಳ ಪಟ್ಟಿಯನ್ನು (pagelist) ತಯಾರಿಸುವುದು ಹೀಗೆ? (ಉದಾಹರಣೆ)

ಒಂದು ಪುಸ್ತಕದಲ್ಲಿ ಮೊದಲ ಪುಟ ರಕ್ಷಾಪುಟ, 2ನೇ ಪುಟದಲ್ಲಿ ಒಂದು ಚಿತ್ರ , 3ನೇ ಪುಟದಲ್ಲಿ ಖಾಲಿ, ಹಾಗೂ 4ನೇ ಪುಟದಿಂದ ಪುಸ್ತಕದ 1ನೇ ಪುಟಸಂಖ್ಯೆ ಶುರುವಾಗಿದ್ದರೆ, ಆ pagelist ಕೋಡಿಂಗ್ ಈ ಕೆಳಗಿನ ರೀತಿ ಇರುತ್ತದೆ. ಪರಿವಿಡಿ ಪುಟಗಳಲ್ಲಿನ ಪುಟಗಳ ಪಟ್ಟಿಯು, ನಾಲ್ಕನೇ ಪುಟದಲ್ಲಿ ಪುಟಸಂಖ್ಯೆ 1, ಐದನೇ ಪುಟದಲ್ಲಿ ಪುಟಸಂಖ್ಯೆ 2..... ಹೀಗೆ ತೋರಿಸುತ್ತದೆ. ಯಾವುದಾದರೂ ಪುಟಸಂಖ್ಯೆ ಇಲ್ಲವಾ, ಅಥವಾ ಎರಡು ಬಾರಿ ಒಂದೇ ಸಂಖ್ಯೆ ಇದೆಯಾ, ಅಥವಾ ಸಂಖ್ಯೆಗಳ ಕ್ರಮ ತಪ್ಪಾಗೆದೆಯಾ ಎಂದು ಪರಿಶೀಲಿಸಿ. ಹಾಗೇನಾದರೂ ಆಗಿದ್ದಲ್ಲಿ progress to source file ಎಂಬಲ್ಲಿ Incorrect (ತಪ್ಪಿದೆ) ಎಂದು ಆಯ್ಕೆಮಾಡಿ. (ಹಿಂದಿನ ಕೋಷ್ಟಕವನ್ನು ಗಮನಿಸಿ)

OCR (NS:Page ಅಲ್ಲಿ)

ಆಪ್ಟಿಕಲ್ ಕ್ಯಾರಕ್ಟರ್ ರೆಕಾಗ್ನಿಷನ್ (OCR) ಅಂದರೆ pdf\djvu\jpg ಮುಂತಾದ ಮಾದರಿಗಳಲ್ಲಿ ಸ್ಕ್ಯಾನ್ ಮಾಡಿರುವ ಇಮೇಜ್ನಲ್ಲಿ ಇರುವಂತಹ ಪಠ್ಯವನ್ನು ಯುನಿಕೋಡ್ ಅಕ್ಷರಗಳನ್ನಾಗಿ ಪರಿವರ್ತಿಸುವ ಒಂದು ಪ್ರಕ್ರಿಯೆ. 2015ರ ನಡುವಿನವರೆಗೆ ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೆ ಸರಿಯಾಗಿ ಹೊಂದುವಂತಹ OCR ಇರಲಿಲ್ಲ.ಅನಂತರ ಗೂಗಲ್ ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೆ OCR ಸೇವೆಯನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿತು. ಅಲ್ಲಿಂದ ವಿಕಿಸೋರ್ಸ್ ಸಮುದಾಯವು ಆ OCR ಸೇವೆಯನ್ನು ಬಳಸಿಕೊಳ್ಳುತ್ತಿದೆ.

OCR4 Wikisource

OCR4 Wikisource ಎಂಬುದು ಟಿ. ಶ್ರೀನಿವಾಸನ್ ಅವರು ಲಿನಕ್ಸ್ OS ಗಾಗಿ ತಯಾರಿಸಿದ ಒಂದು ಉಚಿತ ಮತ್ತು ಮುಕ್ತತಂತ್ರಾಂಶ. ಇದರಲ್ಲಿ ಗೂಗಲ್ ಡ್ರೈವ್ API ಬಳಸಿಕೊಂಡು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದಲ್ಲಿ (mass) ಗೂಗಲ್ OCR ಮಾಡಬಹುದು. ಈ ತಂತ್ರಾಂಶವು ಹೀಗೆ ಕಾರ್ಯ ನಿರ್ವಹಿಸುತ್ತದೆ. 1. ವಿಕಿಮೀಡಿಯಾ ಕಾಮನ್ಸ್ನಿಂದ ಪುಸ್ತಕವನ್ನು ಡೌನ್ಲೋಡ್ ಮಾಡುವುದು. 2. ಆ ಫೈಲನ್ನು ಪ್ರತ್ಯೇಕ ಒಂದೊಂದು ಪುಟಗಳಂತೆ ತುಂಡರಿಸುವುದು. 3. ಅದನ್ನು OCR ಮಾಡಲು ಒಂದೊಂದಾಗಿ ಗೂಗಲ್ ಡ್ರೈವ್ಗೆ ಅಪ್ಲೋಡ್ ಮಾಡುವುದು. 4. OCR ಆದ ಪಠ್ಯವನ್ನು ಡೌನ್ಲೋಡ್ ಮಾಡುವುದು. 5. ಆಯಾ ವಿಕಿಸೋರ್ಸ್ ಪುಟಕ್ಕೆ ಅದನ್ನು ಅಪ್ಲೋಡ್ ಮಾಡುವುದು. ಈ ಪ್ರೋಗ್ರಾಮ್ ಬಳಸಲು bot ಖಾತೆಯನ್ನು ಸೃಷ್ಟಿ ಮಾಡಿಕೊಳ್ಳುವುದನ್ನು ಶಿಫಾರಸ್ಸು ಮಾಡಲಾಗಿದೆ.