
MADHURAVANI TELUGU MAGAZINE
త్రైమాస అంతర్జాల పత్రిక
ISSN 2471-688X
వ్యాస మధురాలు
తెలుగు - సాంకేతికీకరణ

డా.కె.గీత
ప్రపంచ వ్యాప్తంగా నానాటికీ మారుతున్న సాంకేతిక అవసరాలకు సరిపడా భాషలని మనం సాంకేతీకరించుకోవలసిన అవసరం ఉంది. ప్రపంచ భాషల్లో కంప్యూటర్ పరంగా గొప్ప వృద్ధిని సాధించిన భాషల దిశగా తెలుగు భాష గత దశాబ్ది కాలంగా వేగంగా ప్రయాణం సాగించడం చెప్పుకోదగిన విషయం.
ప్రపంచంలోని ఇతరభాషలతో పోలిస్తే తెలుగుభాష సాంకేతికీకరణలో వెనుకంజలో ఉంది. అయినప్పటికీ ఇప్పుడు సోషల్ మీడియా, స్మార్ట్ ఫోన్ల పుణ్యమా అని తెలుగులో కమ్యూనికేషను అందరికీ అవసరమైనందువల్ల తెలుగు భాషా సాంకేతీకరణ రోజురోజుకీ ముందంజ వేస్తూంది.
వాయిస్ అసిస్టెంట్లు ఇప్పుడిప్పుడే ప్రాధాన్యతని సంతరించుకుంటున్న నేపథ్యంలో ఈ దిశలోనూ తెలుగుభాషకి సంబంధించిన సాంకేతిక అభివృద్ధి కోసం కృషి అక్కడక్కడా జరుగుతూ ఉంది. అటువంటి ప్రాజెక్టుల్లో ప్రపంచ ప్రసిద్ధి చెందిన కంపెనీల్లో గత అయిదేళ్లుగా పనిచేస్తూ ఉండడం నాకు లభించిన అరుదైన అవకాశం. ఆ అనుభవాలతో మీతో కొన్ని విషయాలు పంచుకుంటాను.
అసలు తెలుగుభాష సాంకేతికీకరణ అంటే ఏవిటి అని ఆలోచిస్తే ఇప్పుడు మనం కంప్యూటర్లలో సాధారణంగా ఇంగ్లీషుని ఎక్కడెక్కడ వాడుతున్నామో అదంతా తెలుగులోకి మార్చుకోవడం అని ఒక అర్థం చెప్పుకోవచ్చు.
ఇక ఇప్పటి వరకు తెలుగు సాంకేతికతలో జరిగిన అభివృద్ధిని గురించి ఒకసారి చూస్తే-
తెలుగుభాష కంప్యూటర్ల మీద వాడుకలోకి 1991-92 ప్రాంతంలో వచ్చింది. అప్పటివరకు ఇంగ్లీషు మాత్రమే అన్ని టెక్నాలజీలకీ మొదటి మాధ్యమమైనట్టే కంప్యూటర్ రంగంలోనూ ఇంగ్లీషుతోనే సరిపెట్టుకోవాల్సి వచ్చేది. అప్పట్లోనే WWW (World Wide Web) కొత్తగా ప్రపంచానికి పరిచయమైంది. ఈ 'వరల్డ్ వైడ్ వెబ్' లో వెబ్ సైట్సు, బ్లాగులు, మొదలయిన ఎన్నో పేజీలు మనకు అందుబాటులో ఉంటాయన్న సంగతి మనందరికీ తెలుసు కదా!
ఇక ఇంటర్నెట్టు సమాచార ప్రచార రంగంలో ఒక విప్లవాన్నే తీసుకువచ్చింది. ఇంచుమించు గత రెండు దశాబ్దాలుగా ప్రచార సాధనంగా ఇంటర్నెట్టు విస్తృతి పొందుతూ వస్తూంది. ప్రత్యేకించి ఇంటర్నెట్లో తెలుగు వాడుక గత పదేళ్లలో ప్రపంచవ్యాప్తంగా పెరిగింది. తెలుగు సైట్లు, పోర్టల్స్, ఈ-పత్రికలు, బ్లాగులు, యాప్ లు గణనీయంగా పెరిగాయి.
తెలుగులో కంప్యూటరు పరిజ్ఞానాన్ని కలిగించే వెబ్సైట్లు, బ్లాగులు, వీడియోలు అనేకం దర్శనమివ్వడం గత దశాబ్దిలో జరిగిన గొప్ప పరిణామం.
డెస్క్ కంప్యూటర్ల స్థానే పర్సనల్ లాప్ టాపులు, వాటిని కూడా తలదన్నిన టాబ్లెట్లు, అన్నిటినీ మించిన స్మార్ట్ ఫోనులు గత దశాబ్దిగా కొనసాగిన పెనుమార్పులు.
స్మార్ట్ ఫోనులు కమ్యూనికేషను రంగంలో సృష్టించిన అలజడి అంతా ఇంతా కాదు.
దానితో బాటే వెంటవెంటే పుట్టుకొచ్చి మనుషుల మధ్య కమ్యూనికేషనుని రికార్డు స్థాయికి తీసుకెళ్లిన ఫేసుబుక్కు, ట్విట్టర్, ఇన్స్టాగ్రామ్ వంటి సోషల్ మీడియాలు.
టెక్నాలజీ అత్యధికశాతం జనానీకానికి అందుబాటులోకి వచ్చిన ఇప్పటి రోజుల్లో ప్రాంతీయ భాషలకు గిరాకీ ఇందువల్లే ఏర్పడింది. మనిషికీ మనిషికీ మధ్య సంభాషణలో మాటకి బదులు రాత (టెక్స్ట్) కి ప్రాధాన్యం పుట్టుకురావడం వల్ల, డిమాండ్ ని అనుసరించే ఉత్పత్తి ఉంటుంది కాబట్టి ఇప్పటి కాలానికి తప్పనిసరి మొదటి తక్షణ అవసరం సులభ సాధ్యమైన కీబోర్డు లేదా టైపింగు సాధనం అయికూచుంది.
మరో అడుగు ముందుకేసి వాయిస్ అసిస్టెంట్ (దీనిని “మాటమర” అని అంటున్నాను నేను) తో ఎన్నో పనులు సాధించగలిగే టెక్నాలజీ భవిష్యదవసరంగా ఆవిష్కరించబడింది.
ప్రపంచవ్యాప్తంగా టెక్ దిగ్గజాలైన గూగుల్, యాపిల్, అమెజాన్, మైక్రో సాఫ్ట్ వంటివి
తెలుగుభాష వైపు మొగ్గుచూపడానికి రోజురోజుకీ అధికమవుతున్న తెలుగు వాడుకదారుల సంఖ్యే ముఖ్యకారణం. అమెరికాలో అయితే తెలుగు అత్యధికంగా వృద్ధి చెందుతున్న భాషగా పేరుగాంచింది కూడా.
ఈ రోజుల్లో కంప్యూటర్ల చేత మనం చేయించలేని పనులు లేవు. కంప్యూటర్ల సహాయం లేకుండా రైల్వే రిజర్వేషన్లు జరగవు, విమానాలు నడవవు, రాకెట్లు ఎగరవు, బేంకులో డబ్బు ధరావత్తు కాదు, కార్లు నడవవు, కర్మాగారాలు నడవవు, టెలిఫోనులు పని చెయ్యవు, ఆఖరికి కంప్యూటర్ల సహాయం లేకుండా కొన్ని శస్త్ర చికిత్సలు కూడా జరగవు. కంప్యూటర్లు ఆగిపోతే ఆధునిక సమాజం ఆగిపోతుంది.
మరి ఇంతగా కంప్యూటర్ వ్యవస్థ మీద ఆధార పడిపోయిన మనం తెలుగు భాషలో లావాదేవీల కోసం అర్రులు చాచడంలో అతిశయోక్తి లేదు.
ఇక కంప్యూటర్లో తెలుగులో టైపు చెయ్యడానికి టైపు మిషన్లలా ఇంగ్లీషు అక్షరాల స్థానే తెలుగు అక్షరాలు ఉంచితే సరిపోదు.
తలకట్లు, ఒత్తులు ఎక్కడివక్కడ ఎగిరిపోకుండా పనిచెయ్యగలిగే పద్ధతి కూడా అవసరం.
తెలుగు అక్షరాలే కీ బోర్డు మీద ముద్రితమై ఉండేలా “ఇన్స్క్రిప్టు కీ బోర్డు“ తెలుగు కీ బోర్డుకి ప్రాథమిక దశ.
తర్వాత వచ్చిన పద్ధతి ఫోనెటిక్ ఇన్పుట్. మొదట్లో వచ్చిన తెలుగుటెక్ వంటి ఫోనెటిక్ ఇన్పుట్ పద్ధతులు కొంత అనియతంగా, కష్టతరంగా ఉన్నా కానీ ఇప్పటికి లేఖిని వంటి సులభసాధ్యమైన సాధనాల వల్ల తెలుగు టైపు అందరికీ అందుబాటులోకి వచ్చింది.
“ఫోనెటిక్ ఇన్పుట్” అంటే తెలుగుని ఎలా పలుకుతామో టైపు చెయ్యడం అన్నమాట. అంటే తెలుగుని పలికే పద్ధతిలో ఇంగ్లీషు లిపిలో టైపు చేస్తూ తద్వారా తిరిగి తెలుగు అక్షరాల్ని పొందగలగడం అన్నమాట. ఇక్కడ కీబోర్డు మీద తెలుగు అక్షరాలు ఉండవు. ఉన్న ఇంగ్లీషు అక్షరాలు సంకేతాల తోనే తెలుగు అక్షరాలు సృష్టించబడతాయి.
అయితే ఇందులో బోల్డు చిక్కులున్నాయి. ఆంగ్లభాషలో లేనివి, తెలుగుభాషకే ప్రత్యేకమైనవీ అయిన అక్షరాలని సృష్టించాలంటే మరేదైనా సులభమైన మార్గాంతరం అవసరం.
ఇక తెలుగు టైపుకి లోకల్ ఫాంట్లు వేరు, ఎక్కడైనా సులభంగా ఉపయోగించగలిగిన యూనికోడ్ వేరు.
“ఫాంట్” అంటే రాత పద్ధతిలో స్టైల్ అని చెప్పవచ్చు. ఉదాహరణకి 80’లలో ప్రభంజనమైన బాపూగారి చేతిరాత ఒక స్టైల్ .
అందంగా, గుండ్రంగా, పొందిగ్గా రాయడం మరో స్టైల్ . కుడివైపుకో, ఎడమ వైపుకో అక్షరాలు వాల్చి రాయడం మరో స్టైల్. ఇలా రకరకాల పద్ధతుల్లో స్టైల్స్ తో రూపొందించిన కంప్యూటర్ రాతపద్ధతే “ఫాంట్” అన్నమాట.
యూనికోడ్ అంటే ఏమిటి, అవసరం ఏమిటి అనేది చూస్తే తెలుగు లిపిని టైపు రైటర్ల మీద టైపు కొట్టినట్టు కంప్యూటర్ లో టైపు కొట్టగలిగినా ఇంతకు ముందు చెప్పినట్లు ఒక చోట టైపు చేసి ఫైళ్లలో దాచుకున్నది మరో చోట చదవాలంటే అన్ని చోట్లా తెలుగు లిపికి సంబంధించిన సపోర్టు ఉండాలి. అంతెందుకు టైపు కొట్టినది మార్జిన్లు వగైరా ఏ మాత్రం చెడకుండా ఉండేందుకు వాడే పిడిఎఫ్(PDF-Portable Document Format) రూపంలోకి తెలుగు లిపిలో టైపు కొట్టిన ఫైలుని మార్చాలన్నా సపోర్టు ఉండాలి.
యూనికోడ్ టెక్నాలజీ ని ఉపయోగించి ఏ భాషలోనైనా టైపు చెయ్యవచ్చు, దానిని ఇతర కంప్యూటర్లకు పంపించవచ్చు, వెబ్ పేజీలు తయారు చెయ్యవచ్చు. సూక్ష్మంగా చెప్పాలంటే యూనీకోడ్ అంటే అన్ని చోట్లా పనిచేసే స్థిరీకరణ కోడ్ అన్న మాట. దీన్నే తెలుగులో సర్వ సంకేత పద్ధతి అని, ఏకరూప సంకేత పద్ధతి అని అంటున్నాం.
తొలినాళ్లలో తెలుగు లిపిలో ఒక చోట టైపు కొట్టగలిగినా ప్రింటు తీసుకోవడానికి, కంప్యూటరులోనే మరే చోటి నుంచయినా తిరిగి ఫైలు తెరిచి చదవడానికి కుదిరేది కాదు. అంటే తలకట్లు దీర్ఘాలే కాదు అసలు ఏ భాషో తెలీని వింత రాతలు, డబ్బాలు కనిపించేవి. ఇందుకు కారణం ఏవిటంటే ఒక కంప్యూటర్ నుండి ఇంకొక కంప్యూటర్కు డేటా ఇచ్చి పుచ్చుకొనేందుకు వీలుగా ఉండేందుకు ఒక్కొక్క అక్షరానికి ఇవ్వవలసిన స్థిరీకరణ కోడ్ అన్ని చోట్లా పనిచేసే కోడ్ కాదన్న మాట.
ఇక తెలుగు టైపుకి లోకల్ ఫాంట్ల విషయానికి వస్తే ఈ ఫాంట్లని ఉపయోగించి ప్రచురణ చేసే డీటీపీ సాఫ్టువేర్ లో కీబోర్డ్ కొంచెం క్లిష్టంగా వుండటం వల్ల అందులో టైపు చెయ్యడం అందరికీ సాధ్యమయ్యేపనికాదు. ఇప్పటి పుస్తక ప్రచురణ రంగంలోనే కాక, మొదట్లో తెలుగు వెబ్ సైట్లలో ఇవే వాడేవారు. పేజ్ మేకర్ వంటి డీటీపీ సాఫ్టువేర్లు వాడి, సదరు పేజిని ఒక చిత్ర రూపంలో గానీ, పిడీఎఫ్ ఫైలుగా గానీ సేవ్ చేసి అప్పుడు వెబ్ పేజీలో పెట్టేవారు. అయితే ఇలా ప్రతీది చిత్ర రూపంలోనో, పీడిఎఫ్ లోనో పెట్టడం వల్ల ఫైలు సైజు విపరీతంగా పెరిగిపోయి పాఠకులకు ఆ పేజీలు చాలా ఆలస్యంగా డౌన్ లోడ్ అవ్వడం, ఒకసారి చిత్రంలా మార్చిన దానిలో ఇక మార్పులు చేర్పులు చేసే అవకాశం వుండకపోవడం వంటి సమస్యలుంటాయి.
ఇక తరువాతి కాలంలో తెలుగు వార్తా పత్రికలు ఎవరికి వారు డైనమిక్ ఫాంట్లు అభివృద్ధి పరచుకోవడం మొదలుపెట్టారు. వీటి వల్ల సమస్య కొంచెం పరిష్కారం అయినా, అందరికీ ఈ డైనమిక్ ఫాంట్లు వాడే వీలు లేకపోవడం, కీబోర్డ్ అంతగా సులువుగా లేకపోవడం వల్ల ఈ టెక్నాలజీ కొన్ని ఇంటర్నెట్ పత్రికల దగ్గరే ఆగిపోయింది.
ఒక విధంగా ఆలోచిస్తే యూనీకోడ్ అనేది కంప్యూటర్ చరిత్రలో భాషలకు సంబంధించి ఒకానొక గొప్ప మైలురాయిగా చెప్పదగిన విప్లవం.
తెలుగులో ఈ మెయిళ్ళు రాసుకోవడానికి, తెలుగు లిపిని ఉపయోగించి వెబ్సైట్లను నిర్మించడానికి, తెలుగు చర్చావేదికలకు, ఇంటర్నెట్టులోనే వెతకగలిగే తెలుగు డిక్షనరీల నిర్మాణానికి తెలుగు బ్లాగులు, కొత్త తరం తెలుగు పత్రికలు, తెలుగు వికీపీడియా వంటి వాటికి యూనీకోడ్ సరికొత్త ద్వారాలను తెరిచింది.
“లేఖిని” వంటి సాధనాలతో ఆన్ లైన్ లో తెలుగు రాయడం సులభతరమయ్యింది. తర్వాత వచ్చిన “గూగుల్ ఇన్ పుట్ టూల్స్” తెలుగు వంటి అనేక భాషల్లో యూనికోడ్ టైపు సమస్యల్ని దాదాపుగా పరిష్కరించింది. మొబైల్ లో తెలుగు టైపుకు ఇండిక్ కీ-బోర్డు వంటివి సులభమార్గం పరిచేయి.
ఇప్పుడు తెలుగులో రాయడమే కాదు. తెలుగులో సమాచార ప్రసారానికీ అనేక ఆడియో, వీడియో సాధనాలు, యాప్ లు ఉన్నాయి.
అమిత వేగంగా వృద్ధి చెందుతున్న టెక్నాలజీలలో ఈ వేళ తెలుగు సులభంగా ఇమడడం వెనుక ఎంతో మంది కృషి దాగి ఉంది. తెలుగులో భాషా శాస్త్ర పరంగాను, వ్యాకరణ పరంగాను యూనివర్సిటీ స్థాయిలో కృషి చేసిన ఆచార్య భద్రిరాజు కృష్ణమూర్తి గారి “A Grammar of Modern Telugu” , ఆచార్య చేకూరి రామారావు “తెలుగు వాక్యం”, ఆచార్య బూదరాజు రాధాకృష్ణ గారి “వ్యావహారిక భాషా వికాసం”, ఆచార్య పి. ఎస్. సుబ్రమణ్యం గారి ద్రావిడ భాషలు, వీరందరితో బాటూ ఆచార్య తూమాటి దొణప్ప, తిరుమల రామచంద్ర వంటి వారి భాషాశాస్త్ర వ్యాస సంకలనం “తెలుగుభాషా చరిత్ర” వంటివి ఎన్నదగినవి. ఆచార్య గారపాటి ఉమామహేశ్వరరావు తెలుగులో మార్ఫలాజికల్ ఎనలైజర్ వంటివి రూపొందించి భాషా శాస్త్ర పరంగానే కాక, టెక్నాలజీ పరంగా కూడా కంప్యూటరు రంగం లో తెలుగు భాషా వికాసానికి బాటలు వేశారు.
అనేక ముద్రిత నిఘంటువుల సమాహారంగా ఆన్లైన్ లో పరిపూర్తి నిఘంటువుగా వాడపల్లి శేషతల్పసాయి సారధ్యంలో ఆంధ్రభారతి రూపుదిద్దుకుంటూ ఉంది. ఆచార్య వేమూరి వేంకటేశ్వర్రావు రూపొందించిన వేమూరి నిఘంటువు ఆధునిక అవసరాలకు కొంతవరకు ఉపయుక్తమైనది.
ముందు చెప్పుకున్న కీబోర్డులు, చాట్ బాట్లు, వాయిస్ అసిస్టెంట్లు వంటి భాషా సాధనాల్ని తయారుచెయ్యడానికి ప్రపంచ దిగ్గజ సంస్థలు NLP (Natural Language Processing) అంటే సహజ భాషా సంవిధానాన్ని ఉపయోగించి భాషలని Machine Learning, Artificial Intelligence కు ఉపయోగిస్తారు. అంటే మనం మాతృభాష నేర్చుకున్నంత సహజంగా మెషిన్ కి భాషని నేర్పించడం అన్నమాట. మానవులు సహజంగా భాషని ఎలా నేర్చుకుంటారంటే మానవ మెదడు భాషని సహజంగా ప్రాసెస్ చేసుకోగలిగిన కెపాసిటీ కలిగి ఉంటుంది. పుట్టినప్పటి నించి పదాల్ని వింటూ ఉండడం, అలా మెదడులో పోగు చేసుకున్న పెద్ద పదజాల లైబ్రరీ నుంచి మాట్లాడేటప్పుడు సరైన పదాన్ని ఎన్నుకోవడం, సందర్భోచితంగా (contextual speech) మాట్లాడగలగడం జరుగుతుంది. ఇదంతా మెషిన్ వల్ల సాధ్యం కావాలంటే ఏమేం అవసరం?
బయట ప్రపంచం నుంచి మనిషి సహజంగా వినేదంతా, నేర్చుకునేదంతా, తనలో తను అవలోకించుకునేదంతా మెషిన్ వల్ల సాధ్యం కావాలంటే ఏమేం అవసరం?
1. పదజాల లైబ్రరీ (కార్పస్)
2. పదాలని సందర్భానుసారంగా ఎన్నుకునే సామర్థ్యం (ప్రాసెస్)
3. తిరిగి భాషని ఉత్పత్తి చేసే సామర్థ్యం (అవుట్ పుట్)
ఇవన్నింటికీ భాషకి సరైన సాధనాలు అవసరం. సాధనాలని తయారుచేసి, ఉపయోగపరచగలిగే నిపుణులు అవసరం. తెలుగు భాషలో చాట్ బాట్స్, వాయిస్ అసిస్టెంట్స్ నిర్మాణం జరుగుతూ ఉన్న ఇప్పటి కాలంలో భాషని కంప్యూటీకరించడం కోసం కాలంతో బాటూ మారుతూన్న భాషకి, భాషా స్వరూపానికి అనుగుణంగా ఆధునిక అవసరాలకి సరిపోయే తెలుగు నిఘంటువులు, పర్యాయపద కోశాలు, శైలి లక్షణ గ్రంథాలు , ఆధునిక వ్యాకరణం లాంటివి తప్పనిసరిగా ఉండాలి.
ఈవేళ తెలుగు భాషని కూలంకషంగా నేర్చుకున్నవారికి కంప్యూటరు రంగంలో Data Annotator, Data Evaluator, Modeler, Linguist, Asst Linguist, Language Analyst, Creative Strategist, Creative Writer, Content writer, Translator, Transcriptors, Language Specialist, Linguist Lead, Linguistic Project Manager, Machine Learning Engineer వంటి ఎన్నో ఉద్యోగావకాశాలు ఉన్నాయి.
అయితే పైన చెప్పిన అన్ని అంశాల్లో నిష్ణాతులు కావాలంటే కంప్యూటరు రంగంలో, ఆంగ్లభాషలో కూడా తప్పనిసరి ప్రావీణ్యత అవసరం.
నానాటికీ మారుతున్న సోషల్ మీడియా, స్మార్ట్ ఫోన్ల సాంకేతిక అవసరాలకు సరిపడా ఈ రంగంలో ప్రగతి సాధిస్తున్న ఇతరభాషలతో ధీటుగా తెలుగుభాషని సాంకేతికీకరించుకోవాలంటే మనం నిపుణుల్ని తయారుచేసుకోవాలి. విశ్వవిద్యాలయాలు ఈ దిశగా ముందడుగు వెయ్యాలి.
*****