ਸੰਗਣਕ ਭਾਸ਼ਾ ਵਿਗਿਆਨ ( ਸੀ ਐੱਲ ) ਭਾਸ਼ਾ ਵਿਗਿਆਨ ਅਤੇ ਕੰਪਿਊਟਰ ਵਿਗਿਆਨ ਜਾਂ ਸੰਗਣਕ ਵਿਗਿਆਨ ਦਾ
ਅੰਤਰ-ਵਿਸ਼ਾ ਖੇਤਰ ਹੈ ਜਿਸ ਦਾ ਸਬੰਧ ਮਾਨਵ ਭਾਸ਼ਾ ਸ਼ਕਤੀ ਦੇ ਸੰਗਣਕ ਪੱਖ ਤੋਂ ਹੈ। ਇਸ ਦਾ ਸਬੰਧ
ਸੰਗਿਆਨਕ ਵਿਗਿਆਨਾਂ ਅਤੇ ਯੰਤਰਕ ਬੁੱਧੀ ਨਾਲ ਵੀ ਹੈ। ਯੰਤਰਕ ਬੁੱਧੀ ਸੰਗਣਕ ਵਿਗਿਆਨ ਦੀ ਇਕ ਸ਼ਾਖ਼ਾ
ਹੈ ਜਿਸ ਦਾ ਸਬੰਧ ਮਾਨਵ ਵਿਗਿਆਨ ਦੇ ਸੰਗਿਆਣਕ ਮਾਡਲਾਂ ਨਾਲ ਹੈ। ਸੰਗਣਕ ਭਾਸ਼ਾ ਵਿਗਿਆਨ ਦੇ ਦੋ
ਸੰਘਟਕ ਹਨ, ਵਿਹਾਰਕ ਅਤੇ ਸਿਧਾਂਤਕ। ਸੰਗਣਕ ਭਾਸ਼ਾ ਵਿਗਿਆਨ ਦੀ ਵਿਹਾਰਕ ਸ਼ਾਖਾ ਮਾਨਵ ਭਾਸ਼ਾ ਪ੍ਰਯੋਗ
ਦੇ ਮਾਡਲੀਕਰਨ ਦੇ ਵਿਵਹਾਰਕ ਨਤੀਜਿਆਂ ਵਿਚ ਵੱਧ ਰੁਚੀ ਰੱਖਦੀ ਹੈ। ਇਸ ਦਾ ਉਦੇਸ਼ ਅਜਿਹੇ ਸਾਫ਼ਟਵੇਅਰ
ਤਿਆਰ ਕਰਨਾ ਹੈ ਜਿਹਨਾਂ ਦਾ ਸਬੰਧ ਮਾਨਵ ਭਾਸ਼ਾ ਦੇ ਗਿਆਨ ਤੋਂ ਹੈ। ਅਜਿਹੇ ਉਤਪਾਦਾਂ ਦੀ ਜ਼ਰੂਰਤ
ਮਾਨਵ ਮਸ਼ੀਨ ਅੰਤਰਸਬੰਧਾਂ ਵਿਚ ਸੁਧਾਰ ਲਿਆਣ ਲਈ ਹੈ ਕਿਉਂਕਿ ਮਾਨਵ ਅਤੇ ਕੰਪਿਊਟਰ ਦੇ ਅੰਤਰਸਬੰਧ
ਵਿਚ ਮੁੱਖ ਰੁਕਾਵਟ ਸੰਪ੍ਰ੍ਰੇਸ਼ਣ ਹੀ ਹੁੰਦਾ ਹੈ।
ਵਾੱਕ ਸੰਸ਼ਲੇਸ਼ਣ ਪ੍ਰੋਗਰਾਮ ਸਵੈਚਾਲਿਤ ਸੰਸਲੇਸ਼ਣ ਵਾੱਕ ਪ੍ਰਜਨਨ ਦੁਆਰਾ ਲਿਖਿਤ ਇੰਨਪੁਟ ਨੂੰ
ਬੋਲਚਾਲ ਵਾਲੀ ਆਊਟਪੁਟ ਵਿਚ ਤਬਦੀਲ ਕਰਦਾ ਹੈ। ਵਾੱਕ ਸੰਸ਼ਲੇਸ਼ਣ ਨੂੰ ਅਕਸਰ ਟੈਕਸਟ ਤੋਂ ਸਪੀਚ
(ਟੀਟੀਐੱਸ) ਵਿਚ ਪ੍ਰਵਰਤਣ ਦੇ ਨਾਂ ਨਾਲ ਵੀ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ।
ਇਸ ਦੇ ਕਈ ਕ੍ਰਮਬੱਧ ਆਦੇਸ਼ ਹਨ। ਚੋਣ ਸਬੰਧਤ ਕਾਰਜ ਨੂੰ ਮੁੱਖ ਰੱਖ ਕੇ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਸਭ ਨਾਲੋਂ ਆਸਾਨ ਤਰੀਕਾ ਹੁੰਦਾ ਹੈ ਬੋਲਣ ਵਾਲੇ ਵਿਅਕਤੀ ਦੇ ਬੋਲੇ ਗਏ ਲੋੜੀਂਦੇ ਵਾੱਕ ਅੰਸ਼ਾਂ ਨੂੰ ਰੀਕਾਰਡ ਕਰਨਾ। ਕੁਝ ਸੀਮਤ ਵਾਕਾਂ ਨੂੰ ਹੀ ਵਰਤੋਂ ਵਿਚ ਲਿਆਣ ਨਾਲ ਇਹ ਉਪਯੋਗੀ ਸਿੱਧ ਹੋ ਸਕਦੇ ਹਨ ਜਿਵੇਂ ਰੇਲਗੱਡੀ ਸਟੇਸ਼ਨਾਂ ਵਿਚ ਸੰਦੇਸ਼ਾਂ ਦਾ ਭੇਜਣਾ ਜਾਂ ਫ਼ੋਨ ਰਾਹੀਂ ਸੂਚੀਬੱਧ ਸੂਚਨਾ ਭੇਜਣੀ। ਇਸ ਦੀ ਗੁਣਵੱਤਾ ਭੇਜੇ ਜਾਣ ਵਾਲੇ ਸੰਦੇਸ਼ ਦੀ ਰੀਕਾਡਿੰਗ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ। ਬਹੁਤ ਜ਼ਿਆਦਾ ਸੂਖ਼ਮ ਪਰ ਗੁਣਵੱਤਾ ਦੀ ਦ੍ਰਿਸ਼ਟੀ ਤੋਂ ਖ਼ਰਾਬ ਉਹ ਏਲਗੋਰਿਦਮ ( ਕ੍ਰਮਬੱਧ ਆਦੇਸ਼) ਹਨ, ਜਿਹੜੇ ਵਾੱਕ ਨੂੰ ਬਹੁਤ ਛੋਟੀਆਂ ਵਿਭਾਜਤ ਇਕਾਈਆਂ ਵਿਚ ਬਦਲ ਦਿੰਦੇ ਹਨ; ਜਿੰਨੀ ਛੋਟੀ ਇਕਾਈ ਹੋਵੇਗੀ ਓਨੀ ਹੀ ਉਹਨਾਂ ਦੀ ਗੁਣਵੱਤਾ ਘੱਟ ਹੋਵੇਗੀ। ਅਕਸਰ ਇਸ ਦੀ ਇਕਾਈ ਫ਼ੋਨੀਮ ਹੁੰਦੀ ਹੈ ਜਿਹੜੀ ਸਭ ਤੋਂ ਛੋਟੀ ਭਾਸ਼ਕ ਇਕਾਈ ਹੈ। ਵਰਤੀ ਜਾ ਰਹੀ ਭਾਸ਼ਾ ਦੇ ਆਧਾਰ ਅਨੁਸਾਰ ਪੱਛਮੀ ਯੂਰਪੀ ਭਾਸ਼ਾਵਾਂ ਵਿਚ ਕੋਈ ੩੫-੫੦ ਫ਼ੋਨੀਮ ਹਨ ਜਿਸ ਦਾ ਭਾਵ ਹੈ ਕਿ ਕੋਈ ੩੫-੫੦ ਅਕਿਹਰੀਆਂ ਰੀਕਾਰਡ ਗਿਣਤੀਆਂ ਹਨ। ਸਮੱਸਿਆ ਇਹ ਹੈ ਕਿ ਇਹਨਾਂ ਨੂੰ ਤੇਜ਼ ਰਫ਼ਤਾਰ ਬੋਲਚਾਲ ਵਿਚ ਕਿਵੇਂ ਸੰਜੋਇਆ ਜਾਵੇ ਕਿਉਂਕਿ ਇਸ ਦੇ ਤੱਤਾਂ ਵਿਚਕਾਰ ਬਹੁਤ ਤੇਜ਼ ਤਬਦੀਲੀ ਦੀ ਲੋੜ ਹੈ। ਇਸ ਵਿਚ ਸਮਝਣਸ਼ੀਲਤਾ ਘੱਟ ਹੁੰਦੀ ਹੈ ਪਰ ਇਸ ਲਈ ਮੁਕਾਬਲਤਨ ਘੱਟ ਯਾਦ-ਦਾਸ਼ਤ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਸ ਦੁਵਿਧਾ ਦਾ ਹੱਲ ਦੁ-ਫ਼ੋਨੀਮਾਂ ਦੀ ਵਰਤੋਂ ਹੈ। ਪਰਿਵਰਤਨਾਂ ਦੀ ਦੋਫਾੜ ਕਰਨ ਦੀ ਬਜਾਏ ਫ਼ੋਨੀਮ ਨੂੰ ਅੱਧ-ਵਿਚਕਾਰੋਂ ਕਟ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ ਅਤੇ ਪਰਿਵਰਤਨਾਂ ਨੂੰ ਉਵੇਂ ਰਹਿਣ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ। ਇਸ ਤੋਂ ੪੦੦ ਤੱਤ (੨੦ x ੨੦) ਮਿਲ ਜਾਂਦੇ ਹਨ ਅਤੇ ਇਸ ਨਾਲ ਗੁਣਵੱਤਾ ਵੱਧ ਜਾਂਦੀ ਹੈ। ਜਿੰਨੀਆਂ ਵਧ ਇਕਾਈਆਂ ਹੋਣਗੀਆਂ ਓਨੇ ਵਧ ਤੱਤ ਹੋਣਗੇ। ਪਰ ਗੁਣਵੱਤਾ ਸਿਮਰਤੀ ਦੇ ਨਾਲ ਵਧਦੀ ਰਹਿੰਦੀ ਹੈ। ਜਿਹੜੀਆਂ ਹੋਰ ਇਕਾਈਆਂ ਵਰਤੀਆਂ ਜਾਂਦੀਆਂ ਹਨ ਉਹਨਾਂ ਵਿਚ ਅਰਧ-ਅੱਖਰ, ਅੱਖਰ, ਸ਼ਬਦ ਅਤੇ ਇਨ੍ਹਾਂ ਦੇ ਸੰਜੋਗ ਆਉਂਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਸ਼ਬਦ ਧਾਤੂ ਅਤੇ ਇਹਨਾਂ ਦੇ ਝੁਕਾਅ-ਯੁਕਤ ਅੰਤਲੇ-ਅੱਖਰ। ਵਾੱਕ ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਸੰਸਲੇਸ਼ਣ ਦੇ ਅਜਾਇਬਘਰਾਂ ਵਿਚ ਪਿਛਲੇ ੧੫੦ ਵਰ੍ਹਿਆਂ ਦੇ ਨਕਲੀ ਬੋਲਚਾਲ ਸਿਸਟਮਾਂ ਦੇ ਚਿੱਤਰ ਪਏ ਹਨ ਜਿਹੜੇ ਵੇਖਣਯੋਗ ਹਨ।
ਭਾਸ਼ਕ ਡੇਟਾ ਕੰਨਸੋਰਟੀਅਮ ਦੁਆਰਾ ਵਿਆਪਕ ਰੂਪ ਵਿਚ ਭਾਸ਼ਾ ਵਿਵਸਥਾ ਸਬੰਧੀ ਉਪਕਰਣ ਇਸ ਵੈੱਬ-ਪੇਜ਼
'ਤੇ ਦਿੱਤੇ ਗਏ ਹਨ।
http://
www.1dc.upenn.edu/annotation
ਭਾਸ਼ਾ ਤਕਨਾਲੋਜੀ ਕੰਪਿਊਟਰ ਪ੍ਰਣਾਲੀਆਂ ਦੇ ਬਾਰੇ ਖੋਜ ਕਰਦੀ ਹੈ ਜਿਹੜੀ ਮੌਖਿਕ ਅਤੇ ਲਿਖਿਤ ਮਾਨਵੀ
ਭਾਸ਼ਾਵਾਂ ਦੇ ਬੋਧਣ ਅਤੇ/ਜਾਂ ਸੰਸਲੇਸ਼ਣ ਦਾ ਕੰਮ ਕਰਦੀ ਹੈ। ਇਸ ਖੇਤਰ ਵਿਚ ਵਾੱਕ ਸੰਸਾਧਨ
(ਪਹਿਚਾਣ, ਬੋਧਣ ਤੇ ਸੰਸਲੇਸ਼ਣ), ਸੂਚਨਾ ਨਿਸ਼ਕਰਸ਼ਣ, ਹੱਥ-ਲਿਖਿਤ ਪਹਿਚਾਣ, ਮਸ਼ੀਨੀ ਅਨੁਵਾਦ, ਪਾਠ
ਸੰਸਲੇਸ਼ਣ ਅਤੇ ਭਾਸ਼ਾ ਪ੍ਰਜਨਨ ਸ਼ਾਮਿਲ ਹੈ।
ਭਾਰਤੀ ਮਾਨਕ ਬਿਊਰੋ ਨੇ ਇਸਕੀ (ਸੂਚਨਾ ਦੇ ਆਦਾਨ ਪ੍ਰਦਾਨ ਲਈ ਭਾਰਤੀ ਲਿਪੀ ਕੋਡ) ਨਾਂ ਨਾਲ ਇਕ
ਮਾਨਕ ਨਿਰਮਤ ਕੀਤਾ ਹੈ ਜਿਸ ਦੇ ੭ ਜਾਂ ੮ ਬਿਟ ਅੱਖਰਾਂ ਦੀ ਵਰਤੋਂ ਸਾਰੇ ਕੰਪਿਊਟਰਾਂ ਅਤੇ ਸੰਚਾਰ
ਮਾਧਿਅਮਾਂ ਲਈ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ। ੮ ਬਿਟ ਪਰਿਵੇਸ਼ ਵਿਚ ਹੇਠਾਂ ਦੇ ੧੨੮ ਅੱਖਰ ਉਹੀ ਹਨ ਜਿਹੜੇ
ਸੂਚਨਾ ਵਿਨਮਏ ਲਈ ੧੦੩੧੫: ੧੯੮੨ ( ਆਈ.ਐੱਸ.ਓ. ੬੪੬ ਆਈ.ਆਰ.ਵੀ.) ੭ ਬਿਟ ਕੋਡਿਤ ਅੱਖਰ ਸੈੱਟ ਨਾਲ
ਪਰਿਭਾਸ਼ਿਤ ਹਨ, ਜਿਹਨਾਂ ਨੂੰ ਇਸਕੀ ਅੱਖਰ ਸੈੱਟ ਦੇ ਰੂਪ ਵਿਚ ਵੀ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ. ਉਪਰੋਕਤ ੧੨੮
ਅੱਖਰ ਸੈੱਟ ਪ੍ਰਾਚੀਨ ਬ੍ਰਹਮੀ ਲਿਪੀ ਉੱਤੇ ਅਧਾਰਤ ਭਾਰਤੀ ਲਿਪੀਆਂ ਦੀ ਜ਼ਰੂਰਤ ਪੂਰਾ ਕਰਦੇ ਹਨ।
੭ ਬਿਟ ਪਰਿਵੇਸ਼ ਵਿਚ ਨਿਯੰਤਰਕ ਕੋਡ ਐੱਸ.ਆਈ. ਨੂੰ ਇਸਕੀ (ISCII) ਕੋਡ ਸੈੱਟ ਨਾਲ ਵਟਾਇਆ ਜਾ
ਸਕਦਾ ਹੈ ਅਤੇ ਨਿਯੰਤਰਕ ਕੋਡ ਐੱਸ ਓ ਨੂੰ (ASCII) ਕੋਡ ਸੈੱਟ ਦੀ ਚੋਣ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।
ਭਾਰਤ ਵਿਚ ਸਰਕਾਰੀ ਤੌਰ 'ਤੇ ਮੰਨੀਆਂ ਜਾਂਦੀਆਂ ਕੁਲ 22 ਭਾਸ਼ਾਵਾਂ ਹਨ। ਫ਼ਾਰਸੀ-ਅਰਬੀ ਲਿਪੀਆਂ ਤੋਂ
ਬਗ਼ੈਰ, ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਵਰਤੀਆਂ ਜਾਂਦੀਂਆਂ ਹੋਰ ਸਾਰੀਆਂ ਦਸ ਲਿਪੀਆਂ ਪੁਰਾਤਨ ਬ੍ਰਹਮੀ ਲਿਪੀ
ਤੋਂ ਵਿਗਸੀਆਂ ਹਨ ਅਤੇ ਇਹਨਾਂ ਸਾਰੀਆਂ ਦਾ ਇਕ ਸਾਂਝਾ ਧੁਨੀਆਤਮਿਕ ਢਾਂਚਾ ਹੈ ਜਿਸ ਨਾਲ ਸਾਂਝਾ
ਅੱਖਰ ਸੈੱਟ ਸੰਭਵ ਹੋ ਸਕਿਆ ਹੈ। ਸਾਰੀਆਂ ਭਾਰਤੀ ਲਿਪੀਆਂ ਦੇ ਅੱਖਰਾਂ ਨੂੰ ਚੁਣ ਕੇ ਇਕ ਅਜਿਹਾ
ਵਿਆਪਕ ਪ੍ਰਬੰਧ ਖਾਕਾ ਉਲੀਕਿਆ ਗਿਆ ਹੈ ਜਿਸ ਦਾ ਪ੍ਰਯੋਗ 'ਇਸਕੀ' ਕੋਡ ਵਿਚ ਅਤੇ ਇਸ ਤੋਂ ਇਲਾਵਾ
ਵੀ ਹੋ ਸਕਦਾ ਹੈ। 'ਇਸਕੀ' ਕੋਡ ਮਾਨਕ ਬ੍ਰਹਮੀ ਅਧਾਰਤ ਸਾਰੀਆਂ ਲਿਪੀਆਂ ਦੇ ਵਰਣਾਂ ਦਾ ਸੁਪਰ ਸੈੱਟ
ਹੈ। ਸੌਖ ਲਈ ਸਰਕਾਰੀ ਮਾਨਤਾ ਵਾਲੀ ਦੇਵਨਾਗਰੀ ਲਿਪੀ ਦੀ ਵਰਣਮਾਲਾ ਨੂੰ ਮਾਨਕ ਬਣਾਇਆ ਗਿਆ ਹੈ।
ਮਾਨਕ ਸੰਖਿਆ IS੧੩੧੯:੧੯੯੧ ਜਿਸ ਨੂੰ Bureau of Indian Standards ਨੇ ਜਾਰੀ ਕੀਤਾ ਹੈ ਸੂਚਨਾ
ਲੈਣ ਅਤੇ ਦੇਣ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਸਭ ਤੋ ਨਵੀਨਤਮ ਭਾਰਤੀ ਮਾਨਕ ਹੈ ਅਤੇ ਇਸ ਨੂੰ ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ
ਵਿਚ ਸੂਚਨਾ ਤਕਨਾਲੋਜੀ ਦੇ ਉਤਪਾਦਾਂ ਦੀ ਪ੍ਰਗਤੀ ਲਈ ਵੱਡੀ ਪੱਧਰ 'ਤੇ ਵਰਤਿਆ ਜਾ ਰਿਹਾ ਹੈ।
ਇਸਫੋਕ ਲਿਪੀ ਵਰਣ ਸੈੱਟ ਉਹ ਪ੍ਰਮੁੱਖ ਵਰਣ-ਸੈੱਟ ਹੈ ਜਿਸ ਵਿਚ
ਜ਼ਿਆਦਾਤਰ ਭਾਸ਼ਾਵਾਂ ਦੇ ਵਰਣ, ਚਿਹਨ, ਸੰਖਿਆਵਾਂ ਸੰਮਿਲਤ ਹੁੰਦੀਆਂ ਹਨ। ਕੁਝ ਅਪਵਾਦਾਂ ਨੂੰ ਛੱਡ
ਕੇ ਚਿਹਨਾਂ ਦਾ ਇਹ ਸੈੱਟ ਸਾਰਿਆਂ ਇਸਫੋਕ ਵਰਣ-ਸੈੱਟਾਂ ਵਿਚ ਸਮਾਨ ਹੋਵੇਗਾ। ਮੈਚਿੰਗ ਅੰਗਰੇਜ਼ੀ
ਵਰਣ ਸੈੱਟ ਇਹ ਵਰਣ ਸੈੱਟ ਹੇਠਲੇ ਅੱਧੇ ਹਿੱਸੇ ਵਿਚ 'ਇਸਕੀ' ਵਰਣਾਂ ਨਾਲ ਲੈਸ ਮੈਚਿੰਗ ਅੰਗਰੇਜ਼ੀ
ਫ਼ੌਂਟਾਂ ਲਈ ਸਹਾਇਕ ਵਰਣ-ਸੈੱਟ ਹੁੰਦੇ ਹਨ ਅਤੇ ਉੱਪਰ ਦੇ ਅੱਧੇ ਹਿੱਸੇ ਵਿਚ ਰੋਮਨ ਲਿਪੀਅੰਤਰਣ ਲਈ
ਵਰਤੇ ਜਾਂਦੇ ਹਨ। ਅਨੁਪੂਰਕ ਵਰਣ ਸੈੱਟ ਇਹ ਵਰਣ ਸੈੱਟ ਮੁੱਢਲੀ ਲਿਪੀ ਵਰਣਾਂ ਦੇ ਸੈੱਟ ਦਾ ਇਕ
ਵਿਸਤ੍ਰਿਤ ਸੈੱਟ ਹੈ ਜਿਸ ਵਿਚ ਅਜਿਹੇ ਸੰਯੁਕਤ ਅੱਖਰ ( ਵਰਣ) ਅਤੇ ਚਿਹਨ ਸ਼ਾਮਿਲ ਹੁੰਦੇ ਹਨ ਜਿਹੜੇ
ਆਮ ਵਰਤੋਂ ਵਿਚ ਨਹੀਂ ਆਉਂਦੇ।
ਸੂਚਨਾ ਦੇ ਆਦਾਨ-ਪ੍ਰਦਾਨ ਦੇ ਰੂਪ ਵਿਚ ਯੂਨੀਕੋਡ ਦੀ ਸਵੀਕ੍ਰਿਤੀ ਸਾਰੇ ਵਿਸ਼ਵ ਵਿਚ ਵੱਧ ਰਹੀ ਹੈ।
ਸੂਚਨਾ ਤਕਨਾਲੋਜੀ ਖੇਤਰ ਵਿਚ ਜ਼ਿਆਦਾਤਰ ਕੰਪਨੀਆਂ ਨੇ ਇਸ ਦੇ ਪੱਖ ਵਿਚ ਆਪਣੇ ਸਹਿਯੋਗ ਦੀ ਰਾਏ ਦਾ
ਐਲਾਨ ਕਰ ਦਿੱਤਾ ਹੈ। ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਯੂਨੀਕੋਡ 'ਆਇਸਕੀ ੯੧' ਦਾ ਪ੍ਰਯੋਗ ਨਾ ਕਰਕੇ 'ਇਸਕੀ
੮੮' ਦਾ ਪ੍ਰਯੋਗ ਕਰਦਾ ਹੈ ਜਿਹੜਾ ਇਕ ਸਰਕਾਰੀ ਮਾਨਕ ਹੈ। ਇਹ ਜ਼ਰੂਰੀ ਸਮਝਿਆ ਗਿਆ ਹੈ ਕਿ ਭਾਰਤ
ਸਰਕਾਰ, ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਇਸ ਕੋਡ ਵਿਚ ਲੋੜੀਂਦੇ ਸੰਸ਼ੋਧਨ ਲਈ ਯੂਨੀਕੋਡ ਕਨਸੋਰਟੀਅਮ ਦੇ
ਸਾਹਮਣੇ ਆਪਣਾ ਪੱਖ ਰੱਖੇ। ਇਸ ਉਦੇਸ਼ ਨਾਲ ਸੂਚਨਾ ਤਕਨਾਲੋਜੀ ਮੰਤਰਾਲਾ ਯੂਨੀਕੋਡ
ਕਨਸੋਰਟੀਅਮ ਸਮੇਤ, ਆਪਣੇ ਮੱਤਅਧਿਕਾਰ ਦੇ ਪੂਰਣ ਮੈਂਬਰ ਬਣ ਗਿਆ ਹੈ।
੧੬ ਬਿਟ (੨ ਬਾਇਟ) ਯੂਨੀਕੋਡ ਯੂਨੀਕੋਡ ਮਾਨਕ ਕੰਪਿਊਟਰ ਸੰਸਥਾਨ ਦੇ ਉਦੇਸ਼ ਨਾਲ ਪਾਠ ਨਿਰੂਪਣ ਲਈ
ਇਕ ਸਰਵਆਦੇਸ਼ਕ ਵਰਣ ਕੋਡਅੰਤਰਣ ਮਾਨਕ ਹੈ। ਯੂਨੀਕੋਡ ਮਾਨਕ ਵਿਸ਼ਵ ਦੀਆਂ ਲਿਖਤ ਭਾਸ਼ਾਵਾਂ ਵਿਚ
ਪ੍ਰਯੁਕਤ ਸਾਰੇ ਵਰਣਾਂ ਦੇ ਕੋਡਅੰਤਰਣ ਦੀ ਸਮਰੱਥਾ ਰੱਖਦਾ ਹੈ। ਯੂਨੀਕੋਡ ਮਾਨਕ ਵਰਣ ਅਤੇ ਉਸ ਦੇ
ਪ੍ਰਯੋਗ ਦੇ ਸੰਬੰਧ ਵਿਚ ਸੂਚਨਾ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਬਹੁਭਾਸ਼ੀ ਪਾਠਾਂ ਨਾਲ ਸੰਬੰਧ ਰੱਖਣ ਵਾਲੇ
ਵਪਾਰਕ ਲੋਕ, ਭਾਸ਼ਾ ਵਿਗਿਆਨੀ, ਖੋਜਕਰਤਾ, ਵਿਗਿਆਨੀ, ਗਣਿਤ ਵਿਗਿਆਨੀ ਅਤੇ ਤਕਨੀਕੀ ਮਾਹਰ ਵਰਗੇ
ਸਾਰੇ ਕੰਪਿਊਟਰ ਪ੍ਰਯੋਗੀਆਂ ਲਈ ਯੂਨੀਕੋਡ ਬਹੁਤ ਉਪਯੋਗੀ ਹੈ। ਯੂਨੀਕੋਡ ੧੬ ਬਿਟ ਕੋਡਅੰਤਰਣ ਦਾ
ਉਪਯੋਗ ਕਰਦਾ ਹੈ ਜਿਸ ਵਿਚ ੬੫੦੦੦ ਵਰਣ ( ੬੫੫੩੬) ਹਨ। ਯੂਨੀਕੋਡ ਮਾਨਕ ਹਰ ਵਰਣ ਦਾ ਇਕ ਸੰਖਿਆਤਮਕ
ਮੁੱਲ ਜਾਂ ਨਾਂ ਨਿਰਧਾਰਤ ਕਰਦਾ ਹੈ। ਇਸ ਵੇਲੇ ਯੂਨੀਕੋਡ ਮਾਨਕ ੪੯੧੯੪ ਵਰਣਾਂ ਲਈ ਕੋਡ ਪ੍ਰਦਾਨ
ਕਰਦਾ ਹੈ।
ਯੂਨੀਕੋਡ ੧੬ ਬਿਟ ਕੋਡਿੰਗ ਦਾ ਪ੍ਰਯੋਗ ਕਰਦੇ ਹੋਏ ੬੫੦੦੦ ਨਾਲੋਂ ਵੀ ਵੱਧ ਵਰਣਾਂ ( ਕੁੱਲ ੬੫੫੩੬)
ਲਈ ਕੋਡ-ਬਿੰਦੂ ਨਿਸ਼ਚਿਤ ਕਰਦਾ ਹੈ। ਯੂਨੀਕੋਡ ਮਾਨਕ ਹਰੇਕ ਵਰਣ ਨੂੰ ਇਕ ਵਿਸ਼ੇਸ ਸੰਖਿਆਤਮਕ ਮੁੱਲ
ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਯੂਨੀਕੋਡ ਮਾਨਕ ਸੰਸਾਰ ਭਰ ਦੀਆਂ ਸਾਰੀਆਂ ਲਿਖਿਤ ਭਾਸ਼ਾਵਾਂ ਵਿਚ ਪਾਏ ਜਾਣ
ਵਾਲੇ ਸਾਰੇ ਵਰਣਾਂ ਨੂੰ ਕੋਡਿਤ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਰੱਖਦਾ ਹੈ। 'ਇਸਕੀ' ੮ ਬਿਟ ਕੋਡ ਹੈ ਜਿਹੜੀ
'ਏ.ਕੀ.' ਦੇ ੭ ਬਿਟ ਕੋਡ ਦਾ ਵਿਸਤ੍ਰਿਤ ਰੂਪ ਹੈ ਜਿਸ ਵਿਚ ਬ੍ਰਹਮੀ ਲਿਪੀ ਨਾਲ ਸੰਬੰਧਤ ੧੦ ਭਾਰਤੀ
ਲਿਪੀਆਂ ਦੇ ਮੁੱਢਲੇ ਵਰਣ ਸ਼ਾਮਿਲ ਹਨ। ਭਾਰਤ ਵਿਚ ਅੱਜ 22 ਮਾਨਤਾ ਪ੍ਰਾਪਤ ਭਾਸ਼ਾਵਾਂ ਹਨ। ਫ਼ਾਰਸੀ
ਅਰਬੀ ਤੋਂ ਇਲਾਵਾ ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਪ੍ਰਯੁਕਤ ਹੋਰ ਸਾਰੀਆਂ ਦਸ ਲਿਪੀਆਂ ਪ੍ਰਾਚੀਨ ਬ੍ਰਹਮੀ
ਲਿਪੀ ਵਿਚੋਂ ਨਿਕਲੀਆਂ ਹਨ ਅਤੇ ਇਹਨਾਂ ਦੀ ਧੁਨੀਆਤਮਕ ਸੰਰਚਨਾ ਵਿਚ ਸਮਾਨਤਾ ਪਾਈ ਜਾਂਦੀ ਹੈ ਜਿਸ
ਕਾਰਣ ਸਮਾਨ ਵਰਣ ਸੈੱਟ ਸੰਭਵ ਹੋ ਸਕਦਾ ਹੈ। ਅੱਜ 'ਇਸਕੀ' ਕੋਡ ਸਾਰਣੀ ਬ੍ਰਹਮੀ ਅਧਾਰਤ ਭਾਰਤੀ
ਲਿਪੀਆਂ ਲਈ ਜ਼ਰੂਰੀ ਇਕ ਪ੍ਰਕਾਰ ਦਾ ਸੁਪਰ ਸੈੱਟ ਹੈ। ਆਸਾਨੀ ਲਈ ਮਾਨਤਾ ਪ੍ਰਾਪਤ ਦੇਵਨਾਗਰੀ ਲਿਪੀ
ਦੇ ਵਰਣਾਂ ਨੂੰ ਮਾਨਕ ਦੇ ਰੂਪ ਵਿਚ ਪ੍ਰਯੋਗ ਕੀਤਾ ਗਿਆ ਹੈ।
ਤਿੰਨ ਕੀ-ਬੋਰਡ ਵਿੰਨਿਆਸ ਹਨ :
੧. ਰੋਮਨੀ ਵਿੰਨਿਆਸ ਰੋਮਨੀ ਵਿੰਨਿਆਸਾਂ ਵਿਚ ਹਿੰਦੀ ਪਾਠ ਦੇ ਟੰਕਣ ਵਿਚ ਅੰਗਰੇਜ਼ੀ ਧੁਨੀਆਤਮਕ
ਮੈਪਿੰਗ ਦਾ ਪ੍ਰਯੋਗ ਕੀਤਾ ਗਿਆ ਹੈ। ਉਦਾਹਰਣ ਲਈ 'ਰਾਮ' ਟੰਕਤ ਕਰਨ ਲਈ raama ਜਾਂ rAmA ਦਾ
ਪ੍ਰਯੋਗ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।
੨. ਟਾਈਪਰਾਈਟਰ ਵਿੰਨਿਆਸ ਇਹ ਵਿੰਨਿਆਸ ਹਿੰਦੀ ਟਾਈਪਰਾਈਟਰ ਵਿੰਨਿਆਸ ਦੇ ਸਮਾਨ ਹੈ ਅਤੇ ਇਹ
ਵਿੰਨਿਆਸ ਹਿੰਦੀ ਟੰਕਣਾਂ ਅਤੇ ਹਿੰਦੀ ਟਾਈਪਰਾਈਟਰ ਵਿੰਨਿਆਸ ਤੇ ਕੀ-ਬੋਰਡ ਚਾਰਟ ਤੋਂ ਜਾਣੂ ਲੋਕਾਂ
ਲਈ ਲਾਭਦਾਇਕ ਹੈ।
੩. ਇਲੈੱਕਟਰੋਨਿਕੀ ਵਿਭਾਗ ਧੁਨੀਆਤਮਕ : ਇਹ ਵਿੰਨਿਆਸ ਇਲੈੱਕਟਰੋਨਿਕੀ ਵਿਭਾਗ, ਭਾਰਤ ਸਰਕਾਰ
ਦੁਆਰਾ ਮਾਨਕੀਕ੍ਰਿਤ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਸ ਵਿੰਨਿਆਸ ਦਾ ਲਾਭ ਇਹ ਹੈ ਕਿ ਇਹ ਸਾਰੀਆਂ ਭਾਰਤੀ
ਭਾਸ਼ਾਵਾਂ ਦੇ ਲਈ ਸਮਾਨ ਹੈ। ਉਦਾਹਰਣ ਲਈ 'K' ਕੀ ਦਾ ਪ੍ਰਯੋਗ ਸਾਰੀਆਂ ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਵਿਚ 'ਕ'
ਵਰਣ ਦੇ ਕੁੰਜੀਕਰਨ ਲਈ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।
ਡੀ.ਪੀ. ਚਿਰਾਨੀਆ ਭਾਸ਼ਾਵਾਂ: ਦੇਵਨਾਗਰੀ, ਗੁਜਰਾਤੀ, ਪੰਜਾਬੀ, ਮਰਾਠੀ, ਬੰਗਾਲੀ, ਅਸਮੀਆ, ਉੜੀਆ,
ਤਮਿਲ, ਤੇਲਗੂ, ਕੰਨੜ, ਮਲਿਆਲਮ, ਨੇਪਾਲੀ। ਸੰਪਰਕ :
chiraniadp@yahoo.com
'ਗਣਪਤੀ' ਡੇਟਾਬੇਸ ਪੈਕਜ ਇਹਨਾਂ ਭਾਸ਼ਾਵਾਂ ਵਿਚ ਉਪਲਬਧ ਹੈ : ਹਿੰਦੀ, ਗੁਜਰਾਤੀ,
ਪੰਜਾਬੀ, ਮਰਾਠੀ, ਬੰਗਾਲੀ, ਉੜੀਆ, ਤਮਿਲ, ਤੇਲਗੂ, ਕੰਨੜ, ਮਲਿਆਲਮ, ਨੇਪਾਲੀ। ਸੰਪਰਕ :
chiraniadp@yahoo.com
ਇਸਕੀ ਪਲੱਗ-ਇਨ ਦਾ ਉਦੇਸ਼ ਕਿਸੇ ਲਿਪੀ, ਫ਼ੌਂਟ,ਪਲੇਟਫ਼ਾਰਮ (ਪਰਿਵੇਸ਼) ਬਰਾਊਜ਼ਰ ਨੂੰ ਪ੍ਰਯੋਗ
ਕਰਨ ਦੀ ਸੁਤੰਤਰਤਾ ਪ੍ਰਦਾਨ ਕਰਨੀ ਅਤੇ ਨਿਪੁੰਨਤਾ, ਬਲੀਦਾਨ ਜਾਂ ਬਗ਼ੈਰ ਕਿਸੇ ਅਲੱਗ ਲਾਗਤ ਦੇ
ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਵਿਚ ਵੈੱਬ ਖੋਜ ਨੂੰ ਸੰਭਵ ਬਣਾਉਣਾ ਹੈ। ਇਸ ਦਾ ਵਰਤਮਾਨ ਰੂਪ ਇਹ ਪ੍ਰਦਰਸ਼ਿਤ
ਕਰਦਾ ਹੈ ਕਿ ਜੇਕਰ ਭਾਰਤੀ ਸਮੁਦਾਇ ਦਾ ਸਹਿਯੋਗ ਮਿਲ ਜਾਵੇ ਤਾਂ ਅਸੀਂ ਇਸ ਲਖ਼ਸ਼ ਤੋਂ ਦੂਰ ਨਹੀਂ
ਹਾਂ।
ਜਦ ਕਲਾਇੰਟ ਦੀ ਸਤਰ ਉੱਤੇ ਬਰਾਊਜ਼ਰ ਸਰਵਰ ਨੂੰ 'ਆਸਕੀ' ਫ਼ਾਈਲ (extension.isc) ਦਾ ਅਨੁਰੋਧ
ਕਰਦਾ ਹੈ, ਤਾਂ ਸਰਵਰ 'ਮਾਈਮ ਟਾਈਪ' ਦੇ ਨਾਲ ਡੇਟਾ ਭੇਜ ਦਿੰਦਾ ਹੈ। (text/iscii) ਕਲਾਇੰਟ ਦੀ
ਸਤਰ 'ਤੇ ਬਰਾਊਜ਼ਰ ਤੇ 'ਇਨਪੁਟ' ਧਾਰਾ ਦੀ ਵਿਵਸਥਾ ਲਈ ਪਲੱਗ-ਇਨ ਚਲਾਉਂਦਾ ਹੈ। 'ਇਸਕੀ' ਪਲੱਗ ਇਨ,
ਆਣ ਵਾਲੀ 'ਇਸਕੀ ਧਾਰਾ' ਨੂੰ ਫ਼ੌਂਟ ਗਲਿਫ ਕ੍ਰਮ ਵਿਚ ਪ੍ਰਵਰਤਿਤ ਕਰਦਾ ਹੈ ਤਾਂਕਿ ਪ੍ਰਯੋਗਕਰਤਾ
ਦੁਆਰਾ ਪਰਿਭਾਸ਼ਿਤ ਫ਼ੌਂਟ ਦਾ ਪ੍ਰਯੋਗ ਕੀਤਾ ਜਾ ਸਕੇ। ਆਕਾਰ ਦੇ ਸੰਬੰਧ ਵਿਚ 'ਇਸਕੀ ਪਲੱਗ ਇਨ'
ਪ੍ਰਯੋਗਕਰਤਾ ਦੁਆਰਾ ਪਰਿਭਾਸ਼ਿਤ ਫ਼ੌਂਟ ਦੇ ਨਾਂ ਪ੍ਰਛੰਨ ਖੇਤਰ ਨੂੰ ਜੋੜ ਦਿੰਦਾ ਹੈ ਤਾਂਕਿ ਫ਼ਾਰਮ
ਪ੍ਰਸਤੁਤ ਕਰਨ ਸਮੇਂ ਸਰਵਰ ਦਾ ਪਤਾ ਲੱਗ ਸਕੇ ਜਿਸ ਵਿਚ 'ਫ਼ੀਲਡ ਵੈਲਿਊ' ਕੋਡ ਕੀਤੀ ਗਈ ਹੈ।
 |
ਇਹ ਕਿਥੋਂ ਪ੍ਰਾਪਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ?
|
 |