top of page
manaillu2.jpg
kathaamadhuralu-new.jpg
kavitamadhuralu.jpg
vyaasamadhuralu.jpg
adhyatmika.jpg
pustaka-parichayaalu.jpg
vanguripi.pa.jpg
deepthi-muchatlu.jpg
bhuvanollasam.jpg
nri-column.jpg
saahiteesourabhaalu.jpg
tappoppula.jpg
alanati.jpg
paatasanchikalu.jpg

సంపుటి 7  సంచిక  4

అక్టోబరు-డిసెంబరు 2022 సంచిక

maagurinchi.jpg
rachanalu.jpg

వ్యాస​ మధురాలు

తెలుగు - సాంకేతికీకరణ

geetha.jpg

డా.కె.గీత

ప్రపంచ వ్యాప్తంగా నానాటికీ మారుతున్న సాంకేతిక అవసరాలకు సరిపడా భాషలని మనం సాంకేతీకరించుకోవలసిన  అవసరం ఉంది. ప్రపంచ భాషల్లో  కంప్యూటర్ పరంగా గొప్ప వృద్ధిని  సాధించిన భాషల దిశగా తెలుగు భాష గత దశాబ్ది కాలంగా వేగంగా  ప్రయాణం సాగించడం చెప్పుకోదగిన విషయం. 

 

ప్రపంచంలోని ఇతరభాషలతో పోలిస్తే తెలుగుభాష సాంకేతికీకరణలో వెనుకంజలో ఉంది. అయినప్పటికీ  ఇప్పుడు సోషల్ మీడియా, స్మార్ట్ ఫోన్ల పుణ్యమా అని తెలుగులో కమ్యూనికేషను అందరికీ అవసరమైనందువల్ల తెలుగు భాషా సాంకేతీకరణ రోజురోజుకీ ముందంజ వేస్తూంది. 

 

వాయిస్ అసిస్టెంట్లు ఇప్పుడిప్పుడే ప్రాధాన్యతని సంతరించుకుంటున్న నేపథ్యంలో ఈ దిశలోనూ తెలుగుభాషకి సంబంధించిన సాంకేతిక అభివృద్ధి కోసం కృషి అక్కడక్కడా జరుగుతూ ఉంది. అటువంటి ప్రాజెక్టుల్లో ప్రపంచ ప్రసిద్ధి చెందిన కంపెనీల్లో గత అయిదేళ్లుగా పనిచేస్తూ  ఉండడం  నాకు లభించిన అరుదైన అవకాశం. ఆ అనుభవాలతో మీతో కొన్ని విషయాలు పంచుకుంటాను. 

 

అసలు తెలుగుభాష సాంకేతికీకరణ అంటే ఏవిటి అని ఆలోచిస్తే ఇప్పుడు మనం కంప్యూటర్లలో సాధారణంగా ఇంగ్లీషుని ఎక్కడెక్కడ వాడుతున్నామో అదంతా తెలుగులోకి మార్చుకోవడం అని ఒక అర్థం చెప్పుకోవచ్చు. 

 

ఇక ఇప్పటి వరకు తెలుగు సాంకేతికతలో జరిగిన  అభివృద్ధిని గురించి ఒకసారి చూస్తే- 

 

తెలుగుభాష  కంప్యూటర్ల మీద వాడుకలోకి 1991-92 ప్రాంతంలో వచ్చింది. అప్పటివరకు ఇంగ్లీషు మాత్రమే అన్ని టెక్నాలజీలకీ మొదటి మాధ్యమమైనట్టే కంప్యూటర్ రంగంలోనూ ఇంగ్లీషుతోనే సరిపెట్టుకోవాల్సి వచ్చేది. అప్పట్లోనే  WWW (World Wide Web) కొత్తగా ప్రపంచానికి పరిచయమైంది. ఈ  'వరల్డ్ వైడ్ వెబ్' లో వెబ్ సైట్సు, బ్లాగులు, మొదలయిన ఎన్నో పేజీలు మనకు అందుబాటులో ఉంటాయన్న సంగతి మనందరికీ తెలుసు కదా! 

 

ఇక ఇంటర్నెట్టు సమాచార ప్రచార రంగంలో ఒక విప్లవాన్నే తీసుకువచ్చింది. ఇంచుమించు గత రెండు దశాబ్దాలుగా ప్రచార సాధనంగా ఇంటర్నెట్టు  విస్తృతి పొందుతూ వస్తూంది. ప్రత్యేకించి ఇంటర్నెట్లో తెలుగు వాడుక గత పదేళ్లలో ప్రపంచవ్యాప్తంగా  పెరిగింది. తెలుగు సైట్లు, పోర్టల్స్, ఈ-పత్రికలు,  బ్లాగులు, యాప్ లు గణనీయంగా పెరిగాయి.

 

తెలుగులో కంప్యూటరు పరిజ్ఞానాన్ని కలిగించే వెబ్సైట్లు, బ్లాగులు,  వీడియోలు అనేకం దర్శనమివ్వడం గత దశాబ్దిలో జరిగిన గొప్ప పరిణామం. 

 

డెస్క్ కంప్యూటర్ల స్థానే పర్సనల్ లాప్ టాపులు, వాటిని కూడా తలదన్నిన టాబ్లెట్లు, అన్నిటినీ మించిన స్మార్ట్ ఫోనులు గత దశాబ్దిగా  కొనసాగిన పెనుమార్పులు.

 

స్మార్ట్ ఫోనులు కమ్యూనికేషను రంగంలో సృష్టించిన అలజడి అంతా ఇంతా కాదు.

దానితో బాటే వెంటవెంటే పుట్టుకొచ్చి మనుషుల మధ్య  కమ్యూనికేషనుని రికార్డు  స్థాయికి తీసుకెళ్లిన ఫేసుబుక్కు, ట్విట్టర్, ఇన్స్టాగ్రామ్ వంటి సోషల్ మీడియాలు.

 

టెక్నాలజీ అత్యధికశాతం జనానీకానికి అందుబాటులోకి వచ్చిన ఇప్పటి రోజుల్లో ప్రాంతీయ భాషలకు గిరాకీ ఇందువల్లే ఏర్పడింది. మనిషికీ మనిషికీ మధ్య సంభాషణలో మాటకి బదులు రాత (టెక్స్ట్) కి ప్రాధాన్యం పుట్టుకురావడం వల్ల, డిమాండ్ ని అనుసరించే ఉత్పత్తి ఉంటుంది కాబట్టి ఇప్పటి కాలానికి తప్పనిసరి మొదటి తక్షణ అవసరం సులభ సాధ్యమైన కీబోర్డు లేదా టైపింగు సాధనం అయికూచుంది.

 

మరో అడుగు ముందుకేసి వాయిస్ అసిస్టెంట్ (దీనిని “మాటమర” అని అంటున్నాను నేను) తో ఎన్నో పనులు సాధించగలిగే టెక్నాలజీ భవిష్యదవసరంగా ఆవిష్కరించబడింది. 

 

ప్రపంచవ్యాప్తంగా టెక్ దిగ్గజాలైన గూగుల్, యాపిల్, అమెజాన్, మైక్రో సాఫ్ట్ వంటివి

తెలుగుభాష వైపు మొగ్గుచూపడానికి రోజురోజుకీ అధికమవుతున్న తెలుగు వాడుకదారుల సంఖ్యే ముఖ్యకారణం. అమెరికాలో అయితే తెలుగు అత్యధికంగా వృద్ధి చెందుతున్న భాషగా పేరుగాంచింది కూడా. 

 

ఈ రోజుల్లో కంప్యూటర్ల చేత మనం చేయించలేని పనులు లేవు. కంప్యూటర్ల సహాయం లేకుండా రైల్వే రిజర్వేషన్లు జరగవు, విమానాలు నడవవు, రాకెట్లు ఎగరవు, బేంకులో డబ్బు ధరావత్తు కాదు, కార్లు నడవవు, కర్మాగారాలు నడవవు, టెలిఫోనులు పని చెయ్యవు, ఆఖరికి కంప్యూటర్ల సహాయం లేకుండా కొన్ని శస్త్ర చికిత్సలు కూడా జరగవు. కంప్యూటర్లు ఆగిపోతే ఆధునిక సమాజం ఆగిపోతుంది.

 

మరి ఇంతగా  కంప్యూటర్ వ్యవస్థ మీద ఆధార పడిపోయిన మనం తెలుగు భాషలో లావాదేవీల కోసం అర్రులు చాచడంలో అతిశయోక్తి లేదు. 

 

ఇక కంప్యూటర్లో తెలుగులో టైపు చెయ్యడానికి టైపు మిషన్లలా ఇంగ్లీషు అక్షరాల స్థానే తెలుగు అక్షరాలు ఉంచితే సరిపోదు. 

 

తలకట్లు, ఒత్తులు ఎక్కడివక్కడ ఎగిరిపోకుండా పనిచెయ్యగలిగే పద్ధతి కూడా అవసరం. 

తెలుగు అక్షరాలే కీ బోర్డు మీద ముద్రితమై ఉండేలా “ఇన్‌స్క్రిప్టు కీ బోర్డు“ తెలుగు కీ బోర్డుకి  ప్రాథమిక దశ. 

 

తర్వాత  వచ్చిన పద్ధతి ఫోనెటిక్ ఇన్‌పుట్. మొదట్లో వచ్చిన  తెలుగుటెక్ వంటి ఫోనెటిక్ ఇన్‌పుట్ పద్ధతులు కొంత అనియతంగా, కష్టతరంగా ఉన్నా కానీ ఇప్పటికి లేఖిని వంటి సులభసాధ్యమైన సాధనాల వల్ల తెలుగు టైపు అందరికీ అందుబాటులోకి వచ్చింది. 

“ఫోనెటిక్ ఇన్‌పుట్”  అంటే  తెలుగుని ఎలా పలుకుతామో టైపు చెయ్యడం అన్నమాట. అంటే తెలుగుని పలికే పద్ధతిలో ఇంగ్లీషు లిపిలో టైపు చేస్తూ తద్వారా తిరిగి తెలుగు అక్షరాల్ని పొందగలగడం అన్నమాట. ఇక్కడ కీబోర్డు మీద తెలుగు అక్షరాలు ఉండవు.  ఉన్న ఇంగ్లీషు అక్షరాలు సంకేతాల తోనే తెలుగు అక్షరాలు సృష్టించబడతాయి. 

అయితే ఇందులో బోల్డు చిక్కులున్నాయి. ఆంగ్లభాషలో లేనివి, తెలుగుభాషకే ప్రత్యేకమైనవీ అయిన అక్షరాలని సృష్టించాలంటే మరేదైనా సులభమైన మార్గాంతరం అవసరం.

 

ఇక తెలుగు టైపుకి లోకల్ ఫాంట్లు వేరు, ఎక్కడైనా సులభంగా ఉపయోగించగలిగిన యూనికోడ్  వేరు. 

“ఫాంట్” అంటే రాత పద్ధతిలో స్టైల్ అని చెప్పవచ్చు. ఉదాహరణకి 80’లలో ప్రభంజనమైన బాపూగారి  చేతిరాత ఒక స్టైల్ . 

అందంగా, గుండ్రంగా, పొందిగ్గా రాయడం మరో స్టైల్ . కుడివైపుకో, ఎడమ వైపుకో అక్షరాలు వాల్చి రాయడం మరో స్టైల్. ఇలా రకరకాల పద్ధతుల్లో స్టైల్స్ తో రూపొందించిన కంప్యూటర్ రాతపద్ధతే “ఫాంట్” అన్నమాట.

 

యూనికోడ్ అంటే ఏమిటి, అవసరం ఏమిటి అనేది చూస్తే తెలుగు లిపిని టైపు రైటర్ల మీద టైపు కొట్టినట్టు కంప్యూటర్ లో టైపు కొట్టగలిగినా ఇంతకు ముందు చెప్పినట్లు ఒక చోట టైపు చేసి ఫైళ్లలో దాచుకున్నది మరో చోట చదవాలంటే అన్ని చోట్లా తెలుగు లిపికి సంబంధించిన సపోర్టు ఉండాలి. అంతెందుకు టైపు కొట్టినది మార్జిన్లు వగైరా ఏ మాత్రం చెడకుండా ఉండేందుకు వాడే పిడిఎఫ్(PDF-Portable Document Format) రూపంలోకి తెలుగు లిపిలో టైపు కొట్టిన ఫైలుని మార్చాలన్నా సపోర్టు ఉండాలి. 

 

యూనికోడ్‌ టెక్నాలజీ ని ఉపయోగించి ఏ భాషలోనైనా టైపు చెయ్యవచ్చు, దానిని ఇతర కంప్యూటర్లకు పంపించవచ్చు, వెబ్‌ పేజీలు తయారు చెయ్యవచ్చు. సూక్ష్మంగా చెప్పాలంటే యూనీకోడ్ అంటే అన్ని చోట్లా పనిచేసే  స్థిరీకరణ కోడ్‌ అన్న మాట. దీన్నే తెలుగులో సర్వ సంకేత పద్ధతి అని, ఏకరూప సంకేత పద్ధతి అని అంటున్నాం.

తొలినాళ్లలో తెలుగు లిపిలో ఒక చోట టైపు కొట్టగలిగినా ప్రింటు తీసుకోవడానికి, కంప్యూటరులోనే మరే చోటి నుంచయినా తిరిగి ఫైలు తెరిచి చదవడానికి  కుదిరేది కాదు. అంటే తలకట్లు దీర్ఘాలే కాదు అసలు ఏ భాషో తెలీని వింత రాతలు, డబ్బాలు కనిపించేవి. ఇందుకు కారణం ఏవిటంటే  ఒక కంప్యూటర్ నుండి ఇంకొక కంప్యూటర్‌కు డేటా ఇచ్చి పుచ్చుకొనేందుకు వీలుగా ఉండేందుకు ఒక్కొక్క అక్షరానికి ఇవ్వవలసిన స్థిరీకరణ కోడ్‌ అన్ని చోట్లా పనిచేసే కోడ్‌ కాదన్న మాట. 

 

ఇక తెలుగు టైపుకి లోకల్ ఫాంట్ల విషయానికి వస్తే ఈ ఫాంట్లని ఉపయోగించి ప్రచురణ చేసే  డీటీపీ సాఫ్టువేర్‌ లో కీబోర్డ్‌ కొంచెం క్లిష్టంగా వుండటం వల్ల అందులో టైపు చెయ్యడం అందరికీ సాధ్యమయ్యేపనికాదు. ఇప్పటి పుస్తక ప్రచురణ రంగంలోనే కాక, మొదట్లో  తెలుగు వెబ్‌ సైట్లలో ఇవే వాడేవారు. పేజ్‌ మేకర్‌ వంటి  డీటీపీ సాఫ్టువేర్లు వాడి, సదరు పేజిని ఒక చిత్ర రూపంలో గానీ, పిడీఎఫ్‌ ఫైలుగా గానీ  సేవ్‌ చేసి అప్పుడు వెబ్‌ పేజీలో పెట్టేవారు.  అయితే  ఇలా ప్రతీది చిత్ర రూపంలోనో, పీడిఎఫ్‌ లోనో పెట్టడం వల్ల ఫైలు సైజు విపరీతంగా పెరిగిపోయి పాఠకులకు ఆ పేజీలు  చాలా ఆలస్యంగా డౌన్‌ లోడ్‌ అవ్వడం, ఒకసారి చిత్రంలా మార్చిన దానిలో ఇక మార్పులు చేర్పులు చేసే అవకాశం వుండకపోవడం వంటి సమస్యలుంటాయి. 

 

ఇక తరువాతి కాలంలో తెలుగు వార్తా పత్రికలు ఎవరికి వారు డైనమిక్‌ ఫాంట్లు అభివృద్ధి పరచుకోవడం మొదలుపెట్టారు. వీటి వల్ల సమస్య కొంచెం పరిష్కారం అయినా, అందరికీ ఈ డైనమిక్‌ ఫాంట్లు వాడే వీలు లేకపోవడం, కీబోర్డ్‌ అంతగా సులువుగా లేకపోవడం వల్ల ఈ టెక్నాలజీ కొన్ని ఇంటర్నెట్‌ పత్రికల దగ్గరే ఆగిపోయింది.

 

ఒక విధంగా ఆలోచిస్తే  యూనీకోడ్ అనేది కంప్యూటర్  చరిత్రలో భాషలకు సంబంధించి ఒకానొక గొప్ప మైలురాయిగా  చెప్పదగిన విప్లవం.

 

తెలుగులో ఈ మెయిళ్ళు రాసుకోవడానికి, తెలుగు లిపిని ఉపయోగించి వెబ్‌సైట్లను నిర్మించడానికి, తెలుగు చర్చావేదికలకు, ఇంటర్నెట్టులోనే వెతకగలిగే తెలుగు డిక్షనరీల నిర్మాణానికి తెలుగు బ్లాగులు, కొత్త తరం తెలుగు పత్రికలు, తెలుగు వికీపీడియా వంటి వాటికి  యూనీకోడ్ సరికొత్త ద్వారాలను తెరిచింది.

 

“లేఖిని” వంటి సాధనాలతో ఆన్ లైన్ లో తెలుగు రాయడం సులభతరమయ్యింది. తర్వాత వచ్చిన “గూగుల్ ఇన్ పుట్ టూల్స్” తెలుగు వంటి అనేక భాషల్లో యూనికోడ్ టైపు సమస్యల్ని దాదాపుగా పరిష్కరించింది.  మొబైల్ లో తెలుగు టైపుకు ఇండిక్ కీ-బోర్డు వంటివి సులభమార్గం పరిచేయి.

 

ఇప్పుడు తెలుగులో రాయడమే కాదు. తెలుగులో సమాచార ప్రసారానికీ అనేక ఆడియో, వీడియో సాధనాలు, యాప్ లు ఉన్నాయి.

 

అమిత వేగంగా వృద్ధి చెందుతున్న టెక్నాలజీలలో ఈ వేళ తెలుగు సులభంగా ఇమడడం వెనుక ఎంతో మంది కృషి దాగి ఉంది. తెలుగులో భాషా శాస్త్ర పరంగాను, వ్యాకరణ పరంగాను యూనివర్సిటీ స్థాయిలో కృషి చేసిన ఆచార్య భద్రిరాజు కృష్ణమూర్తి గారి “A Grammar of Modern Telugu” , ఆచార్య చేకూరి రామారావు “తెలుగు వాక్యం”, ఆచార్య బూదరాజు రాధాకృష్ణ గారి “వ్యావహారిక భాషా వికాసం”, ఆచార్య పి. ఎస్. సుబ్రమణ్యం గారి ద్రావిడ భాషలు, వీరందరితో బాటూ ఆచార్య తూమాటి దొణప్ప, తిరుమల రామచంద్ర వంటి వారి భాషాశాస్త్ర వ్యాస సంకలనం “తెలుగుభాషా చరిత్ర” వంటివి ఎన్నదగినవి.  ఆచార్య గారపాటి ఉమామహేశ్వరరావు తెలుగులో మార్ఫలాజికల్ ఎనలైజర్ వంటివి రూపొందించి భాషా శాస్త్ర పరంగానే కాక, టెక్నాలజీ పరంగా కూడా కంప్యూటరు రంగం లో తెలుగు భాషా వికాసానికి బాటలు వేశారు. 

 

అనేక ముద్రిత నిఘంటువుల సమాహారంగా ఆన్లైన్ లో పరిపూర్తి నిఘంటువుగా  వాడపల్లి శేషతల్పసాయి సారధ్యంలో ఆంధ్రభారతి రూపుదిద్దుకుంటూ ఉంది.  ఆచార్య వేమూరి వేంకటేశ్వర్రావు రూపొందించిన  వేమూరి నిఘంటువు  ఆధునిక అవసరాలకు కొంతవరకు ఉపయుక్తమైనది. 

ముందు  చెప్పుకున్న కీబోర్డులు, చాట్ బాట్లు, వాయిస్ అసిస్టెంట్లు వంటి  భాషా సాధనాల్ని తయారుచెయ్యడానికి  ప్రపంచ దిగ్గజ సంస్థలు NLP (Natural Language Processing) అంటే సహజ భాషా సంవిధానాన్ని ఉపయోగించి భాషలని Machine Learning, Artificial Intelligence కు ఉపయోగిస్తారు. అంటే మనం మాతృభాష నేర్చుకున్నంత సహజంగా మెషిన్ కి భాషని నేర్పించడం అన్నమాట.   మానవులు సహజంగా భాషని ఎలా నేర్చుకుంటారంటే మానవ మెదడు భాషని సహజంగా ప్రాసెస్ చేసుకోగలిగిన కెపాసిటీ కలిగి ఉంటుంది. పుట్టినప్పటి నించి పదాల్ని వింటూ ఉండడం, అలా మెదడులో పోగు చేసుకున్న పెద్ద పదజాల లైబ్రరీ నుంచి మాట్లాడేటప్పుడు సరైన పదాన్ని ఎన్నుకోవడం, సందర్భోచితంగా (contextual speech) మాట్లాడగలగడం జరుగుతుంది. ఇదంతా మెషిన్ వల్ల సాధ్యం కావాలంటే ఏమేం అవసరం?

 

బయట ప్రపంచం నుంచి మనిషి సహజంగా వినేదంతా, నేర్చుకునేదంతా, తనలో తను అవలోకించుకునేదంతా మెషిన్ వల్ల సాధ్యం కావాలంటే ఏమేం అవసరం?

 

1. పదజాల లైబ్రరీ (కార్పస్) 

2. పదాలని సందర్భానుసారంగా ఎన్నుకునే సామర్థ్యం (ప్రాసెస్) 

3. తిరిగి భాషని ఉత్పత్తి చేసే సామర్థ్యం (అవుట్ పుట్) 

 

ఇవన్నింటికీ భాషకి సరైన సాధనాలు అవసరం. సాధనాలని తయారుచేసి, ఉపయోగపరచగలిగే నిపుణులు అవసరం. తెలుగు భాషలో చాట్ బాట్స్, వాయిస్ అసిస్టెంట్స్ నిర్మాణం జరుగుతూ ఉన్న ఇప్పటి కాలంలో భాషని కంప్యూటీకరించడం కోసం కాలంతో బాటూ మారుతూన్న భాషకి, భాషా స్వరూపానికి  అనుగుణంగా ఆధునిక అవసరాలకి సరిపోయే తెలుగు నిఘంటువులు, పర్యాయపద కోశాలు, శైలి లక్షణ గ్రంథాలు , ఆధునిక వ్యాకరణం లాంటివి తప్పనిసరిగా ఉండాలి.  

 

ఈవేళ తెలుగు భాషని కూలంకషంగా నేర్చుకున్నవారికి కంప్యూటరు రంగంలో  Data Annotator, Data Evaluator, Modeler, Linguist, Asst Linguist, Language Analyst, Creative Strategist, Creative Writer, Content writer, Translator, Transcriptors,  Language Specialist, Linguist Lead, Linguistic Project Manager, Machine Learning Engineer వంటి ఎన్నో ఉద్యోగావకాశాలు ఉన్నాయి.  

 

అయితే పైన చెప్పిన అన్ని అంశాల్లో  నిష్ణాతులు కావాలంటే కంప్యూటరు రంగంలో, ఆంగ్లభాషలో కూడా తప్పనిసరి ప్రావీణ్యత అవసరం.

 

నానాటికీ మారుతున్న సోషల్ మీడియా, స్మార్ట్ ఫోన్ల సాంకేతిక అవసరాలకు సరిపడా ఈ రంగంలో ప్రగతి సాధిస్తున్న  ఇతరభాషలతో ధీటుగా తెలుగుభాషని  సాంకేతికీకరించుకోవాలంటే  మనం నిపుణుల్ని తయారుచేసుకోవాలి. విశ్వవిద్యాలయాలు ఈ దిశగా ముందడుగు వెయ్యాలి. 

 

*****

bottom of page