మాట్లాడే భాషను, లిఖితపూర్వకమైన భాషను అర్ధంచేసుకొని, సమన్వయం జరిపే కంప్యూటర్ వ్యవస్ధలపై భాషా సాంకేతిక విజ్ఞానం పరిశోధన జరుపుతుంది. సంభాషణను గుర్తించడం, అవగాహన చేసుకోవడం, సమన్వయం చేయడం, సమాచారాన్ని గ్రహించడం చేతిరాతను గుర్తించడం, మెషిన్ ద్వారా అనువాదం, మూలపాఠాన్ని సంక్షిప్తీకరించడం. భాషను సృష్టించడం ఇందులో చేరుతాయి.
కంప్యూటర్ భాషా శాస్త్రం (సి.ఎల్) అన్నది భాషా శాస్త్రానికి , కంప్యూటర్ విజ్ఞానానికి , మధ్య ఉండే అధ్యయన శాస్త్రం. మానవ భాషలో కంప్యూటర్ వినియోగానికి అనువుగా ఉండే అంశాల గురించి కంప్యూటర్ భాషా శాస్త్రం వివరిస్తుంది. ఇది అవగాహనా శాస్త్రాల పరిధిలోకి వచ్చే శాస్త్రం. మావన మేధస్సును అనుకరించే కంప్యూటర్ తయారీని గురించి తెలిపే ‘ ఆర్టిఫిషియల్ ఇంటలిజెన్స్ ’ రంగం తో కూడా దీనికి సంబంధం ఉంది. కంప్యూటర్ భాషా శాస్త్రం లో రెండు విభాగాలు ఉంటాయి. మానవ భాష వినియోగానికి సంబంధించిన నమూనాలు తయారు చేయడం పైన అప్లైడ్ కంప్యూటర్ భాషా శాస్త్రం తన దృష్టిని కేంద్రీకరిస్తుంది. మానవ భాషల గురించిన అవగాహనగల సాఫ్ట్ వేర్ ను తయారు చేయడమే లక్ష్యంగా ఈ శాస్త్రం కృషిచేస్తుంది.
ఎవరైన యూజర్, కంప్యూటర్ ద్వారా జర్మన్, ఇంగ్లీషు లేక ఏ భాషలో అయినా సమాచారం అందించేందుకు సహజ భాషకు సంబంధించిన కంప్యూటర్ ప్రోగ్రామ్ అవసరం. కంప్యూటర్ నుంచి సమాచారం పొందడం (డేటాబేస్ క్వేరీస్), సమాచారం వెనక్కి తీనుకోవడం (రిట్రీవల్) వంటి ప్రక్రియలు కంప్యూటర్ ప్రోగ్రామ్ కు సంబంధించినవే. మాట్లాడే భాషను గుర్తుపట్టడం లాంటి విషయాల్లో జరిగిన అభివృద్ధి కారణంగా అనేకరకాల సహజ భాషా కంప్యూటర్ సిస్టమ్స్ యొక్క వినియోగ సామర్ధ్యం మరింత మెరుగైంది.
మానవులకు, యంత్రాలకు మధ్య పరస్పర సమాచార వినిమయానికి సంబంధించిన సమస్య రాకముందే వివిధ మాతృభాషలు మాట్లాడే ప్రజల మధ్య సమాచార మార్పిడి సమస్యలు ఉన్నాయి. వివిధ మానవ భాషల పరస్పర ఆటోమాటిక్ అనువాదమే తొలి లక్ష్యంగా వినియోగ ప్రధానమైన కంప్యూటర్ భాషా శాస్త్రం రంగ ప్రవేశం చేసింది. అనువాదకులైన వారి పనిని సరళ తరంచేసి వారి ఉత్పాదనను మెరుగుపరిచే సాఫ్ట్ వేర్ వ్యవస్ధలను కంప్యూటర్ భాషా శాస్త్రం సృష్టించింది. మానవ భాషకున్న సామర్ధ్యాన్ని త్వరలోనే అందుకొనే శక్తి కంప్యూటర్ భాషా శాస్త్రం కు లేక పోయినప్పటికీ, అది మరెన్నో ఇతర లక్ష్యాలను సాధించబోతోంది. డిజైన్, సిస్టమ్స్ నిర్వహణ, వ్యాకరణ పరిశీలన వంటి అనేక ప్రయోజనాలను కంప్యుటేషనల్ లింగ్విస్టిక్స్ సాధించ బోతోంది.
సిద్ధాంత పరమైన కంప్యూటర్ భాషా శాస్త్రం: ఒక భాషను అవగాహన చేసుకోవడానికి అవసరమైన భాషా నిర్మాణ శాస్త్ర సిద్ధాంతాలను ఇది వివరిస్తుంది. మానవ భాషకు సంబంధించిన అంశాల నమూనాలను కంప్యూటర్ భాషా శాస్త్రం రూపొందించి వాటిని కంప్యూటర్ ప్రోగ్రాములు గా అమలు జరుపుతుంది. ఆ తర్వాత వచ్చే సిద్ధాంతాలను అంచనావేయడానికి, అభివృద్ధి చేయడానికి ఈ ప్రోగ్రాములు ప్రాతిపదికగా ఉపయోగపడతాయి. భాషా నిర్మాణ శాస్త్ర సిద్ధాంతాల సామర్ధ్యాన్ని సాధించడంలో అవగాహనా ప్రక్రియకు సంబంధించిన మనస్తత్త్వధోరణి కూడా ప్రముఖ పాత్ర వహిస్తుంది. మానవీయ శాస్త్రాలనుండి, సామాన్య శాస్త్రాలనుండి, ప్రవర్తనా శాస్త్రాలనుండి, ఇంజనీరింగ్ నుండి రూపొందిచబడిన వివిధ పద్ధతుల, వ్యూహాల సమాహారం కావడం, కంప్యూటర్ భాషా శాస్త్రం లో ఉన్న గొప్ప ఆకర్షణ.
భాషా సంబంధమైన వివరణలతో కూడిన ఉపకరణాలను అందరికీ అందుబాటులోకి తెచ్చేందుకు సమగ్రమైన వెబ్ పేజీ ఒకటి ఉంది. భాషా సంబంధమైన సమాచారాన్ని కలిగిన సహ వ్యవస్ధ (కన్సార్టియం) ఈ వెబ్ పేజీని అందజేస్తుంది. చిరునామా : ttp://www.ldc.upenn.edu/annotation
.
ఈ వెబ్ సైట్ మౌఖికం పై (భాషణ పై) దృష్టి కేంద్రీకరించడం తో పాటు టెక్స్ట్ తో పని చేయడానికి అవసరమైన వనరులను కూడా అందిస్తుంది.
భాషణ సమన్వయ వ్యవస్ధలు లిఖిత సమాచారాన్ని సంభాషణ రూపంలోకి మార్చుతాయి. భాషణ సమన్వయ వ్వవస్ధలు వాటంతట అవే భాషణను తయారుచేసుకోవడంద్వారా ఈ ప్రకియను నిర్వహిస్తాయి. భాషణ సమన్వయ వ్యవస్థను తరచుగా టెక్స్ట్ టు స్పీచ్ మార్పిడి (టి.టి.ఎస్.) కు అందిస్తారు.
ఈ ప్రక్రియ నిర్వహణకు పలు పద్ధతులు ఉన్నాయి. అవసరాన్ని, ఉపయోగాన్నిబట్టి ఆయా పద్ధతిని ఎంపిక చేసుకొంటారు. అన్నిటికంటే సులభమైన మార్గం ఇచ్చిన పదజాలాన్నిఉపయోగించి మాట్లాడే మనిషి కంఠ స్వరాన్నిరికార్డు చేయడం. వ్యక్తి వాడే పదాలు, వాక్యాలు ఒక పరిమితిలో నియంత్రించ బడి ఉన్నప్పుడే ఈ ప్రక్రియ ప్రయోజనకరంగా ఉంటుంది. ఉదాహరణకు రైల్వేస్టేషన్లో సందేశాలను రికార్డుచేయడం, ఫోన్ ద్వారా కార్యక్రమాల షెడ్యూలును నిర్ణయించడం ఈ ప్రక్రియ క్రిందికి వస్తాయి. అయితే రికార్డుచేసిన పద్ధతిపైన దీని నాణ్యత ఆధారపడి ఉంటుంది. అయితే ప్రసంగాన్ని చిన్న చిన్న ముక్కలుగా విభజించి అధునాతన శైలిలో కూడా రికార్డు చేయవచ్చు. అయితే ఈ రికార్డింగ్ నాణ్యత లేకుండా నాసిరకంగా ఉంటుంది. ప్రసంగంలో తరచుగా వాడబడే అతి చిన్న పద శబ్దాన్ని ‘ఫోనీమ్’ (phoneme) అంటారు. మాట్లాడేటపుడు వాడే పదాలనును బట్టి పశ్చిమ యూరప్ భాషల్లో 35నుంచి 50 ఫోనిమ్ లున్నాయి. అంటే 35 నుంచి 50 వరకు పదశబ్దాల రికార్డింగులు ఉన్నాయి అన్న మాట. అయితే వీటిని కలిపివేసి ధారాళమైన ప్రసంగంగా రూపొందించాలంటే, పద శబ్దాల మధ్య సులభమైన మార్పిడి అవసరం. అయితే వీటి రికార్డింగుకు అవసరమైన మెమరీ చాలా తక్కువగా ఉంటుంది. అర్థమయ్యేస్థాయి కూడా చాలా తక్కువగా ఉంటుంది. ఈ సమస్య పరిష్కారానికి డైఫోన్స్ అనబడే భాషా శబ్దాలను వాడటం మంచిది. పదశబ్దాలను మధ్య భాగంలో విభజించే పద్ధతిని పాటించడంవల్ల దాదాపు 400 మూల ధాతువులు ఏర్పడతాయి, నాణ్యత కూడా పెరుగుతుంది. ఈ పద్ధతిలో మనకు అవసరమైన మెమరీ పెరగడంతోబాటు నాణ్యత కూడా పెరుగుతూవుంటుంది. ప్రసంగ విశ్లేషణ, భాషణ సమన్వయానికి సంబంధించిన మ్యూజియంలో 150 సంవత్సరాల కృత్రిమ సంభాషణా వ్యవస్థల చిత్రాలున్నాయి. ఈ మ్యూజియం ఒక సారి సందర్శించతగిందే. వెబ్ చిరునామా (http://mambo.ucsc.edu/psl/smus/smus.html)
అన్ని రకాల కంప్యూటర్ మాధ్యమాలలో, కమ్యూనికేషన్ మాధ్యమాలలో, వినియోగంకోసం భారతీయ భాషల లిపికి సంబంధించిన సంకేతాన్ని (ఐ.ఎస్.సి.ఐ.ఐ.)ని భారతీయ ప్రమాణాల బ్యూరో ఏర్పాటు చేసింది. ఈ సంకేత వ్యవస్థ ద్వారా 7 లేదా 8 బిట్ల కేరెక్టర్స్ ను ఉపయోగించుకొనే వీలుంటుంది. 8 బిట్ల పద్ధతి పరిధిలో కీబోర్డ్ లో 128 కీలు ఉంటాయి. ఐ.ఎస్. 10315 : 1982 (ఐఎస్ఒ 646 ఐఆర్వీ) సర్టిఫికెట్ ప్రకారం వీటిని నిర్వహించారు. ఏడు బిట్ల సంకేత వ్యవస్థను ఎ.ఎస్.సి.ఐ.ఐ. క్యారెక్టర్ సెట్టుగా పేర్కొంటారు. పురాతన బ్రాహ్మీలిపి ప్రాతిపదికన ఉన్న అన్ని భారతీయ భాషల లిపులకు 128 క్యారెక్టర్లు ఉపయోగపడతాయి. ఏడు బిట్ల పరిధిలో 1511 సంకేత వ్యవస్థకోసం కంట్రోల్ కోడ్ 51ని ఉపయోగించవచ్చు. ASC11 కోడ్ సెట్ కోసం కంట్రోల్ కోడ్ 50ని వాడుకోవచ్చు. భారతదేశంలో ఆధికారికంగా గుర్తింపు పొందిన భాషలు 15 ఉన్నాయి. వీటిలో పర్షియన్ , అరబిక్ లిపులు కాక, భారతీయ భాషలకుగాను వాడబడే మిగతా10 లిపులు బ్రాహ్మీ లిపినుంచి పరిణామం చెందినవే. అన్ని లిపులకూ ఒకేరకమైన ధ్వని, ఆకృతి ఉన్నాయి. దీనిలో లిపులన్నింటికి ఉమ్మడిగా ఒక క్యారెక్టర్ను ఏర్పాటు చేసుకోవడం వీలవుతుంది. వివిధ భారతీయ భాషల లిపులకు ఫాంట్ల ఎంపికకు ఒక ప్రత్యేకమైన వ్యవస్థను ఏర్పాటు చేశారు. ISC11 కోడ్ తోపాటు మరిన్ని క్యారెక్టర్లు ఉపయోగించుకొనేందుకు కూడా ఈ వ్యవస్థలో వీలుకల్పించారు. బ్రాహ్మీ లిపి ప్రాతిపదికగల భారతీయ లిపులకు అవసరమైన క్యారెక్టర్లన్నింటికీ ISC11 కోడ్ పట్టిక ఒకే మాతృవ్యవస్థలా ఉపయోగపడుతుంది. వినియోగంలో సౌలభ్యంకోసం దేవనాగరి ఆధికారిక లిపి అక్షరమాలను ఉపయోగించారు. ఐ.ఎస్. 1319 : 1991 నంబర్లో భారతీయ ప్రమాణాల సంస్థ జారీ చేసిన సర్టిఫికేట్ సమాచార మార్పిడిలో తాజా ప్రమాణానికి ప్రతీక. భారతీయ భాషల్లో ఇన్ఫర్మేషన్ టెక్నాలజీ (ఐ.టి.) ఉత్పత్తుల కోసం ఈ ప్రామాణిక సంఖ్యనే విస్తృతంగా వాడుతున్నారు.
సమాచార మార్పిడికోసం రూపొందించిన అక్షరమాల కోడ్ ను ఎసిఐఐగా వ్యవహరిస్తారు. (దీన్ని ఏకీ Ae-kee )గా ఉచ్చరిస్తారు. ఈ కోడ్ 8 విభాగలతో కూడి ఉంటుంది. కింది అడుగుభాగంలో ఏకీ క్యారెక్టర్ సెట్ ఉంటుంది. పై సగభాగంలో ‘ఏకీ’ అక్షరాల క్యారెక్టర్లు ఉంటాయి. ఐ.బి.ఎం. పర్సనల్ కంప్యూటర్లో వినియోగించుకొనేందుకు వీలుగా పై భాగంలో ఉన్న అక్షరాల లక్షణాలను విభజించి ఉపయోగించుకొంటారు. ‘ఏకీ’ లిపి కోడ్ ను పిసి. ‘ఏకీ’ లిపికోడ్ గా వాడుకుంటారు.
సంక్లిష్టమైన లిపులను సక్రమపద్ధతిలో రూపొందించడానికి ఈ కింది వ్యవస్థలు అవసరమవుతాయి:
‘ఏకీ’ (ఎసిఐఐ ) (ACII) - ఇది సమాచార మార్పిడికోసం రూపొందించిన అక్షరమాల కోడ్. దీని ద్వారా మౌలికమైన అక్షరమాల లిపులను రూపొందించవచ్చు. చాలావరకు లిపులలో అవసరమైన సంకేతాలు (చైనా లిపిలో ఉండే చిహ్నాల పద్ధతిని ఇక్కడ చర్చించడంలేదు) 96 కంటే తక్కువ గానే ఉంటాయి. ఈ లిపులలో వచ్చే అన్ని ఆకృతులను ఈ మౌలిక అక్షరాలద్వారానే రూపొందించవచ్చు. ఏకీ’ కోడ్ను ‘ఏకీ’ కీబోర్డ్ ఓవర్లే ద్వారానే టైప్ చేయవచ్చు. ‘ఏకీ’ కీబోర్డ్ ఓవర్లే కూడా ప్రామాణికమైన ఇంగ్లీష్ కీ బోర్డ్లో ఇమిడిపోతుంది. కీబోర్డ్ ఓవర్లేలో ప్రతి ఎఎస్సీఐఐ క్యారెక్టర్కూ ఒక ప్రత్యేక మైన స్ధానం ఉంటుంది.
ఐ.ఎస్.ఎఫ్.ఒ.సి. (ISFOC) - ఇంటలిజెన్స్ బేస్డ్ స్క్రిప్ట్ ఫాంట్ కోడ్ (ISFOC) ఒక లిపిని రూపొందించేందుకు అవసరమైన అన్ని మౌలిక ఆకృతులు ఈ కోడ్ లోఉంటాయి. ఏ పదమైనా లిపిరూపంలో కంపోజ్ చేయడానికి ఈ ఆకృతులను ఒక వరసలో ఉపయోగించుకోవచ్చు. (ISFOC) లోని ప్రతి క్యారెక్టర్ అడ్డదిడ్డంగా ఒక పజిల్లాగా ఉంటుంది. ఏదీ తనంతటతానుగా అక్షరం కాలేదు. ప్రతి (ISFOC) వ్యవస్థలో ఉండే క్యారెక్టర్ల గరిష్ట పరిమితి 188 . చాలావరకు అన్ని లిపులకు ఈ క్యారెక్టర్లు సరిపోతాయి. అయితే కొన్ని లిపులకు మాత్రం ఎక్కువ క్యారెక్టర్లు అవసరమవుతాయి.
(ISFA) ఐ.ఎస్.ఎఫ్.ఎ.- ఇంటలిజెన్స్ బేస్డ్ స్క్రిప్ట్స్ టు ఫాంట్ అల్గోరిథమ్. ఏదైనా ఒక పదాన్ని మౌలికమైన ఏ కీ క్యారెక్టర్లతో టైప్ చేయడం జరుగుతుంది. అయితే దాన్ని మానిటర్ పై డిస్ప్లే చేయడానికి (ISFOC) వ్యవస్థలోని ఆకృతులను ఉపయోగించుకోవలసి ఉంటుంది. అయితే ‘ఏకీ’ కోడ్స్ను (సంకేతాలను) (ISFOC) కోడ్లోకి మార్చాలంటే ఒక క్రమ పద్ధతి అల్గోరిథమ్ అవసరం. దీనినే (ISFA) అల్గోరిథమ్ అంటారు.
సమాచార మార్పిడికి ఉపకరించే అక్షరమాల కోడ్ అయిన ‘ఏకీ’ కోడ్ (ACII CODE) లో ‘ఏకీ’ కీబోర్డ్ లోని అన్ని మౌలిక క్యారెక్టర్లు ఉంటాయి. ఉదాహరణకు ‘ఏకీ’ ఇండియన్ కోడ్, కీబోర్డ్ లో పది భారతీయ భాషల లిపుల అవసరాలు ఇమిడిపేయే అవకాశం ఉంటుంది. అవి అస్సామి,బెంగాలి, దేవనాగరి, గుజరాతి, కన్నడ, మలయాళం, ఒరియా, పంజాబి, తమిళం, తెలుగు. ఈ లిపులలో మౌలిక లక్షణాలన్ని ఒకే విధంగా ఉంటాయి. అయితే డిస్ల్పే కోసం ‘ఏకీ’ కోడ్లను (ISFOC) వ్యవస్థలోకి మార్చుకోవలసివుంటుంది. ఎంపిక చేసుకున్న స్క్రిప్ట్ కు గాను (ISFA) అల్గోరిథమ్ ద్వారా ఈ పని చేయవచ్చు. ‘ఏకీ’ (ACII) లో ఉన్న ఏదైనా టెక్స్ట్ ను ఏ లిపి రూపంలో అయినా డిస్ప్లే చేయవచ్చు. ఏ లిపిను ఎంపిక చేసుకొంటే ఆ లిపిలోకి టెక్స్ట్ మారిపోతుంది. ‘ఏకీ’ కోడ్ను టెలెక్స్ లాంటి కమ్యూనికేషన్ మాధ్యమంలో ఉపయోగిస్తారు. అక్షరాల స్ధాయిలో టెక్స్ట్ ను సక్రమంగా ఎడిట్ చేయడానికి, స్పెల్లింగ్ లేఖన క్రమాన్ని పరిశీలించడానికి ఎ.ఎల్.పి. వర్డ్స్ ప్రాసెసర్ ‘ఏకీ’ కోడ్ ను అంతర్గతంగా ఉపయోగించుకుంటుంది. ప్రస్తుతం అందుబాటులో ఉన్న విండో అప్లికేషన్లు ‘ఏకీ’ కోడ్ ను నేరుగా ఉపయోగించుకోలేవు. ఎందుకంటే సమాచారాన్ని నిక్షిప్తం చేసుకుని కొత్త పరిస్ధి తులలో ఉపయోగించుకోగలిగే ఒక క్రమ పద్ధతి ఇందుకు అవసరం కాబట్టి. అయితే అవే విండో అప్లికేషన్లు (ISFOC) కోడ్ లను ఉపయోగించుకోగలవు. అంటే ఏదైనా టెక్స్ట్ ను ఎ.ఎల్.పి. ప్రాసెసర్నుంచి విండో అప్లికేషన్ కు బదిలీ చేసుకోవాలంటే ‘ఏకీ’ కోడ్ (ISFOC) వ్యవస్థల మధ్య మార్పు అవసరం అన్న మాట. ISFOC వ్యవస్థలోని టెక్స్ట్ ను విండో అప్లికేషన్ పరిథిలో ‘ఏకీ’ కీబోర్డ్ సహాయంతో టైప్ చేయడం సాధ్యమవుతుంది. ‘ఏకీ’ కోడ్ ను ISFOC కి అంతర్గతంగా మార్చగల కీబోర్డ్ డ్రైవర్ అనే సాఫ్ట్ వేర్ ద్వారా ఈ పని జరుగుతుంది.
స్క్రిప్ట్ క్యారెక్టర్ సెట్ ఇది తరచుగా వాడే అనేక భాషాపదాల, అంకెల చిహ్నాలతోకూడిన వ్యవస్థ. ఏవో కొన్ని మినహాయింపులు తప్ప ఇవి ISFOC అక్షరాల సెట్ లాగే ఉంటాయి.
ది మ్యాచింగ్ ఆఫ్ ఇంగ్లీష్ క్యారెక్టర్ సెట్సరిపోల్చడానికి ఉపయోగపడే ఇంగ్లీష్ అక్షరాల, చిహ్నాల సెట్ ఇది. కొద్ది భాగంలో ఇంగ్లీష్ ఫాంట్స్ కు సంబంధించిన ఎ.ఎస్.సి.ఐ.ఐ. వ్యవస్థ ఉంటుంది. రోమన్ లిపిలోకి మార్పుకోసం పైభాగంలో ఉచ్చారణకు సంబంధించిన క్యారెక్టర్లు ఉంటాయి.
అనుబంధ క్యారెక్టర్ సెట్ మౌలికమైన లిపికి సంబంధించిన అక్షరాల, చిహ్నాల, అంకెల వ్యవస్థకు ఇది అనుబంధ వ్యవస్థ. వివిధ పదాలను కలిపే అక్షరాలు, చిహ్నాలు ఇందులో ఉంటాయి. అయితే సాధారణంగా వీటి ఉపయోగం ఉండదు.
లిపులను అందించేందుకు అవసరమైన సంక్లిష్టమైన మౌలిక పద్ధతుల జాబితా ఈ అధ్యాయంలో ఉంటుంది.
లిపులను అందించే పద్ధతి
ఏదైనా పదం టైప్ చేయాలంటే ఆ పదంలో ఇమిడివుండే అక్షరాలు ఏమిటో తెలుసుకొని టైప్ చేయడం సహజంగా జరిగేపని. రాతలో పదాల అక్షరక్రమం అక్షరాల ఉచ్చారణ క్రమాన్ని అనుసరించి ఉంటుది. మౌలికమైన అక్షరమాల , ప్రత్యేకమైన చిహ్నాల , గుర్తుల ఉచ్చారణ వంటి అంశాలతో కూడుకున్నదే ‘ ఏకీ ’ వ్యవస్థ. అంటే సమాచార మార్పడికి అవసరమైన మౌలిక కోడ్ ( Alphabet Code for information Interchange – ACII) అన్న మాట. ఈ వ్యవస్థలో అక్షరాలు వర్ణమాల క్రమంలో ఏర్పాటుచేయబడి ఉంటాయి. ‘ ఏకీ ’ వ్యవస్థలో ASCII అక్షరాల, చిహ్నాల వ్యవస్థ కూడా ఉంటుంది.
· లిపిలో లభించే మౌలికమైన అకృతులను కలుపుకుంటూ ఏదైనా ఒక పదాన్ని కంపోజ్ చేయవచ్చు.
· (ISFOC) వ్యవస్థలో మౌలికమైన ఈ ఆకృతులు ఉంటాయి. అయితే వీటిని నేరుగా టైప్ చేసుకోవడానికి వీలు ఉండదు.
• లిపిలో లభించే మౌలికమైన అకృతులను కలుపుకుంటూ ఏదైనా ఒక పదాన్ని కంపోజ్ చేయవచ్చు.
(ISFOC) వ్యవస్థలో మౌలికమైన ఈ ఆకృతులు ఉంటాయి. అయితే వీటిని నేరుగా టైప్ చేసుకోవడానికి వీలు ఉండదు.
• అయితే లిపిని ఫాంట్ల ను మార్చుకోగలిగే ISFA (Intelligent script to font Algorithm) వ్యవస్థను ఉపయోగించి ‘ఏకీ’ స్పెల్లింగు ను అర్ధంచేసుకొని (ISFOC) సంకేతాన్ని రూపొందించవచ్చు. తద్వారా పదాన్ని స్క్రీను పైన డిస్ ప్లే చేయవచ్చు
• ఇంగ్లీషు వంటి సాధారణ లిపులకైతే ‘ఏకీ’ (ISFOC) వ్యవస్థల పని కూడా ASCII కోడ్ వ్యవస్థే చేస్తుంది.
• అయితే ఒకే వరుసలో ఉండని భారతీయ లిపులవంటి సంక్లిష్టమైన లిపులు చాలావాటికి సంబంధించి‘ఏకీ’ (ISFOC) ISFAల ప్రత్యేక మైన కోడ్ అవసరం.
ISFOC ప్రమాణాలు
·
మౌలిక ఆకృతులు, అవి ఏర్పడిన తీరుకు సంబంధించిన లిపుల ప్రమాణాలు వివిధ ఫాంట్లు రూపొందించడానికి అనువుగా ఉంటాయి.
·
అవసరమైన మౌలిక ఆకృతులను నిర్ణయించడంద్వారా (ISFOC వ్యవస్థ లిపిని అధునాతన శైలిలో అందిస్తుంది.)
·
లిపిలో పలురకాల ఫాంట్లను తెలియజేసేలా మౌలికమైన ఆకృతులను ఎంపిక చేసుకోవచ్చు.
·
లిపికోసం రూపొందిన (ISFOC వ్యవస్థ ISFA వ్యవస్థతో కూడుకొన్నది. మౌలికమౌన ఆకృతులను ఉపయోగించి ఒక పదాన్ని కంపోజ్ చేయడానికి ప్రమాణబద్ధమైన మార్గాన్ని (ISFOC) నిర్ణయిస్తుంది.
·
లిపికోసం రూపొందించిన ఫాంట్లన్నీ ఒక దానికొకటి పరస్పరం అనుగుణంగా ఉంటాయి. ఎవరైనా యూజర్ తాను ఎంపిక చేసుకొన్న ఫాంట్ను స్క్రీన్ పై చూడగలుగుతాడు.
·
ISFOC వ్యవస్థలోని ఫాంట్లన్నీ ఒక వరుసలో అమరి ఉంటాయికాబట్టి, ప్రస్తుతం అందుబాటులో ఉన్న ఇంగ్లీషు ప్రోగ్రామ్ అప్లకేషన్స్ను ఉపయోగించుకోవచ్చు. లేజర్ ప్రింటర్లు, టైప్ సెట్టర్ల మీద వాటిని ముద్రించవచ్చు.
·
గ్రాఫిక్స్ ఎక్కువగా ఉండే ఎం.ఎస్. విండోస్, మసింటాష్ పరిధిలోని సంక్లిష్టమైన సంకేతాల వ్యవస్ధను ISFOC అందిస్తుంది.
·
ISFOC అతి చక్కని లిపులను అందిస్తుంది. ‘ఎకీ’(ACII) కీబోర్డ్ ద్వారా కంప్యూటర్ ప్రోగ్రామ్ ను పొందేందుకు వీలు కల్పిస్తుంది
ప్రపంచవ్యాప్తంగా సమాచార మార్పిడికి అనువైన ప్రమాణబద్ధమైన వ్యవస్థగా యూని కోడ్ ను ఆమోదించారు. ప్రపంచంలోని చాలావరకు ఇన్ఫర్మేషన్ టెక్నాలజీ కంపెనీలు (ఐ.టి. కంపెనీలు) యూని కోడ్ కు మద్దతు ఇస్తున్నాయి. భారతీయ భాషల కోసం యూని కోడ్ ఐ.ఎస్.ఐ.ఐ.-91 ను కాకుండా, ఐ.ఎస్.ఐ.ఐ.-88 ను సంబంధించిన కోడ్లో అవసరమైన మార్పులకోసం భారత ప్రభుత్వం యూనికోడ్ కన్సార్టియమ్ కు పంపడం అవసరమైంది. దీనితో కేంద్ర ఇన్ఫర్మేషన్ టెక్నాలజీ శాఖ, యూనికోడ్ కన్సార్టియంలో పూర్తికాలం ఓటింగ్ హక్కుతో కూడిన సభ్యత్వాన్ని పొందింది.
16.విభాగాల (2 బైట్) యూనికోడ్
అక్షరాలు, చిహ్నాలు, అంకెలను సంకేతాలుగా రూపొందించడంలో యూనికోడ్ రూపొందించిన ప్రమాణం ప్రపంచవ్యాప్తంగా ఆమోదయోగ్యమైనది. టెక్ట్స్ ను కంప్యూటర్ లో ప్రాసస్ చేయడానికి యూనికోడ్ ప్రమాణాన్ని ఉపయోగిస్తారు. ప్రపంచంలోని అన్ని లిఖిత భాషల అక్షరాలు, చిహ్నాలు, అంకెలను సంకేతరూపంలో నిర్మించేందుకు కావలసిన సామర్థ్యాన్ని యూనికోడ్ ప్రమాణాలు అందజేస్తాయి. బహుభాషల టెక్ట్స్ కోసం కంప్యూటర్ వినియోగించే వారికి యూనికోడ్ ప్రమాణాలు ఎంతో ఉపయోగకరంగా ఉంటాయి. కంప్యూటర్ వినియోగించే వ్యాపార వర్గాలు, బాషా వేత్తలు, పరిశోధకులు, శాస్త్రవేత్తలు, గణిత శాస్త్ర నిపుణులు, సాంకేతిక నిపుణులకు కూడా యూనికోడ్ ప్రమాణాలు ఎంతో ఉపయోగకరం. యూనికోడ్ 16 విభాగాల సంకేత నిర్మాణ ప్రక్రియను ఉపయోగిస్తుంది. 65 వేలకుపైగా (65536) అక్షరాలకు, చిహ్నాలకు, అంకెలకు యూనికోడ్ సంకేతరూపం (నోడ్ పాయింట్) కల్పిస్తుంది. యూనికోడ్ స్టాండర్డ్, ఐ.ఎస్.ఓ-10646 స్టాండర్డ్ కలసి ‘యుటిఎఫ్-16’ అనే అదనపు వ్యవస్థను అందిస్తాయి. దాదాపు పదిలక్షల అక్షరాలు, చిహ్నాలు, అంకెలను సంకేతాలుగా రూపొందించేందుకు ఈ వ్యవస్థ వీలు కల్పిస్తుంది. ప్రస్తుతం యూనికోడ్ స్టాండర్డ్ 49 వేల 194 అక్షరాలకు, చిహ్నాలు, అంకెలకు సంకేతరూపం (క్యారెక్టర్ ఎన్ కోడింగ్) కల్పిస్తూంది.
వివిధ భాషల అక్షరాలు, చిహ్నాలు, అంకెలను సంకేతాలుగా రూపోందించడంలో స్ధిరత్వం కోసం యూనికోడ్ కన్సార్టియం ఒక విధానాన్ని ఏర్పరిచింది. ఈ విధానం ప్రకారం ఏదైనా అక్షరాన్ని తొలగంచడానికీ లేదా మార్చడానికి వీలు కాదు.
1. ఏదైనా అక్షరాన్ని లేదా గుర్తును ఎన్ కోడ్ చేస్తే దాన్ని కదిలించడంగాని, తొలగించడంగాని కుదరదు.
2. ఒక సారి ఒక అక్షరాన్ని ఎన్ కోడ్ చేస్తే దాని పేరును మార్చడం కుదరదు.
3. ఏదైన అక్షరాన్ని ఎన్ కోడ్ చేస్తే అది సహజమైన లక్షణాలను కోల్పోయేలా ముక్కలుగా విడగొట్టడం సాధ్యం కాదు.
4. అక్షరం లేదా గుర్తు ప్రాథమిక అస్ధిత్వం మారిపోయేలా దాన్ని లక్షణాలను మార్చేందుకు వీలులేదు.
5. యూనికోడ్ క్యారక్టర్ డాటా బేస్ లోని కొన్ని ప్రాపర్టీల విలువల నిర్మాణాన్ని కూడా మార్చడానికి వీలుకాదు.
యూనికోడ్ 16 విభాగాల ఎన్ కోడింగ్ పద్ధతిని ఉపయోగిస్తుంది. ఇది 65000 కు పైగా అక్షరాలకు గర్తులకు తగిన సంకేతలను (కోడ్ పాయింట్) అందజేస్తుంది. ప్రతి అక్షరానికి అందేలా యూనికోడ్ ప్రమాణం తగిన పేరును, సంఖ్య విలువను ఆపాదిస్తుంది. ప్రపంచంలోని అన్ని లిఖిత భాషల అక్షరాలకు, గుర్తులకు సంకేతాన్ని అందించే సామర్ధ్యాన్ని యూనికోడ్ స్టాండర్డ్ కలుగజేస్తుంది.
ISCIIవ్యవస్ధ, 8బిట్ల కోడ్ ను ఉపయోగించు కుంటుంది. ఇది 7బిట్ల ASII కోడ్ కు విస్తరణ వ్యవస్ధగా పనిచేస్తుంది. బ్రాహ్మిలిపి నుంచి వికసించిన పది భారతీయ భాషల లిపులకు అవసరమైన అక్షర మాలను ఈ వ్యవస్ధ అందిస్తుంది. పర్షియన్, అరబిక్ లిపులను మినహాయించి,అన్ని భారతీయ భాషలు ఉపయోగించే 10 రకాల లిపులు బ్రాహ్మ లిపినుంచే పరిణామంచెందాయి. అన్నిటికి ఒకే రకమైన ధ్వని నిర్మాణం ఉంది. అందువల్ల ఈ భాషలన్నిటికీ ఉమ్మడిగా అక్షరాల, అంకెల, గుర్తుల సంకేతాలను రూపొందించేందుకు సాధ్యమైంది. బ్రాహీ లిపి ప్రాతిపదికగాగల భారతీయ భాషలకు అవసరమైన అక్షరాలు, చిహ్నాలు, అంకెలకు ISCII సంకేత పట్టిక (కోడ్ టేబుల్) ఒక మాతృకగా పనిచేస్తుంది. వినియోగంలో సౌలభ్యం కోసం దేవనాగరి ఆధికారిక అక్షరములను ISCII కోడ్ లో ప్రమాణంగా ఉపయోగించారు.
 |
భారతీయ భాషలలో టైప్ చేయడానికి అందుబాటులో ఉన్న మూడురకాల కీ బోర్డ్ లేఅవుట్లు ఏమిటి?? |
 |
1. రోమన్ తరహా లేఅవుట్:రోమన్ తరహా కీ బోర్డ్ లేఅవుట్లో హిందీ టేక్ట్స్ ను కంపోజ్ చేయడానికి ఇంగ్లీష్ శబ్ధాల సూచనలను ఉపయోగిస్తారు ‘రమ’ పదాన్నిే టైప్ చేయడానికి ‘raama’ లేదా rama అక్షరాలను ఉపయోగిస్తారు.
2. టైప్ రైటర్ లేఅవుట్ :ఇది కూడా హిందీ టైప్ రైటర్ లేఅవుట్ ను పోలి ఉంటుంది. హిందీ టైపిస్టులకు, టైప్ రైటర్ లేఅవుట్ గురించి తెలిసిన వారికి ఇది ఉపయోగపడుతుంది.
3. డి.డి.ఇ. ఫోనెటిక్ లేఅవుట్ :భారతదేశపు ఎలక్ట్రానిక్స్ శాఖ ఈ లేఅవుటు ను ప్రమాణీకరించింది. ఇందులో అనుకూలమైన అంశం ఏమంటే అన్ని భారతీయ భాషలకు ఒకే రకమైన లేఅవుట్ ఉంటుంది. ఉదాహరణకు అన్ని భారతీయ భాషల్లోను ‘క’ అక్షరాన్ని సూచించడానికి ఇంగ్లీష్ లో ‘కె’ అక్షరాన్ని ఉపయోగిస్తారు. అక్షరాలను ఖచ్చితంగా టైప్ చేయడానికి ఉపయోగించవలసిన ‘కీ’ లను గురించి కీ బోర్డ్ లేఅవుట్, కీ సీక్వెన్స్ చార్ట్ ల నుంచి తెలుసు కొంటారు.