' தொட்டனைத்து தூறும் மணற்கேணி மாந்தர்க்கு கற்றனைத்து தூறும் அறிவு. '

கணினி நிரலாக்கத் திறன் பெற்றவர்கள் தமிழுக்கு எவ்வாறெல்லாம் தொண்டாற்றலாம்?

 


நிரலாக்கத் திறன் (coding skills) இன்றைய பல்துறைப் பணிகளுக்கும் மிகமிகப் பயனுள்ள ஒன்று. மொழியியல் துறையிலும் அவ்வண்ணமே. தமிழ்மொழியை இலகு செய்யும் புள்ளிகளில் நிரலாக்கத் திறன் உள்ளவர்கள் என்னவெல்லாம் செய்யலாம்? என்பதை ஒரு பட்டியல் போலச் சொல்லி விடுகிறேன்.

  1. தமிழ் இலக்கணம் சார்ந்து அதை இலகு செய்யக்கூடிய பல நுட்பங்களைத் தமிழ்மொழிக்கு உருவாக்கிக் கொடுக்கலாம். குறிப்பாக எங்கெங்கெல்லாம் சந்தி மிகும்/சந்தி மிகாது, சந்திக்குப் பதிலாக நிறுத்தற் குறிகள்/ தரிப்புக் குறிகள் போன்றவற்றை எங்கு பயன்படுத்திக் கொள்ளலாம் என்பதற்கான தானியங்கு பிழைதிருத்தி (Auto Spellchecker) போல ஒரு செயலியை உருவாக்கிக் கொடுக்கலாம். இப்போதுள்ளவை அத்துணைப் போதுமானதாக இல்லை.
  2. வடமொழிச் சொற்களுக்கு இணையான நேரடித் தமிழ்ச் சொல்லை மாற்றித் தரும் செயலிகளை/ நிரல்களை உருவாக்கலாம் (Auto Sanskrit Remover).
    சான்றாக, உதாரணம்/ சந்தோஷம் என்று எழுதப்பட்டால் அதைச் சான்று/ மகிழ்ச்சி என்று தானே மாற்றித் தருவது போல ஒரு செயலி. இவ்வாறு வடசொற்களுக்கு இணையான தமிழ்ச் சொற்களை, நான்கு-ஐந்து முறை தானே மாற்றித் தரும்போது ஆறாவது முறை நாமே நேரடித் தமிழ்ச்சொல்லைப் பயன்படுத்தத் துவங்கி விடுவோம்.
  3. மக்கள் பேச்சு வழக்காகத் தமிழ் வாக்கியங்களுக்கு இடையில் சொல்லும் ஆங்கிலச் சொற்களைத் தமிழிலோ (அல்லது) அப்படியே ஆங்கிலத்திலோ மாற்றித் தருவது. (Auto Tanglish Adapter)
    சான்றாக, ‘மேட்னீ ஷோ’ என்று எழுதினால் அதனை ‘matinee show’ என்றோ அல்லது ‘நண்பகல் காட்சி’ என்றோ, (அல்லது) நண்பகல் காட்சி என்ற தமிழ்ச் சொல்லாகவும் கூடவே அடைப்புக் குறிக்குள் ஆங்கிலத்தில் (matinee show) என்றும் மாற்றித் தருவது போலச் செயலிகள் செய்யலாம்.
  4. தற்காலத்தில் தொழில்நுட்பக் காரணங்களுக்காக ஆங்கிலப் பயன்பாடு அதிகரித்துள்ளது. இங்கே ஆங்கிலத்தை ஆங்கிலத்திலேயே எழுதிவிட்டால் சிக்கல் இல்லை. சில நேரங்களில் தமிழாக்கம் புரிந்து கொள்ளக் கடினமாக உள்ளது என்றால், அந்தத் தமிழ்ச்சொல்லுக்கு அருகிலேயே ஆங்கிலச் சொல்லையும் அடைப்புக்குறிக்குள் எழுதுவது பயன் தரும். (Technical Terms Adapter).
    சான்றாக: பாட்காஸ்ட் என்று எழுதுவதை, ஒலியோடை (Podcast) என்பது போல் மாற்றித் தரும் செயலிகள்.

    இதுபோல பல பணிகளை நிரலாக்கத் திறன் உள்ளவர்கள் தமிழுக்காகச் செய்யலாம். இது போன்று பணிகளைச் செய்தாலே, மொழிநடையில் 50 விழுக்காடு வெற்றி கிட்டிவிடும். இவையெல்லாம் தான் தொழில்நுட்ப மொழித் தொண்டு.
  5. மொழியியல் அல்லாமல், மொழிசார்ந்த வரலாறு, பண்பாடு, தொல்லியல் போன்ற துறைகளுக்கும் கணினித் தொழில்நுட்பம் தேவைப்படுகிறது. ஒரு கல்வெட்டு படிப்பதற்கோ, தமிழ் பிராமி என்று சொல்லப்படும் தமிழி எழுத்துக்களை வாசிப்பதற்கோ, வட்டெழுத்துக்கள் வாசிப்பதற்கோ,‌ சுவடியில் உள்ள தொல் இலக்கிய இலக்கணங்களை வாசிப்பதற்கு உதவும் வகையில் கூட ஒரு Scanner செயலி செய்யலாம். (Tamil Epigraphy Reader)
  6. மேலும் பழங்கால இலக்கியங்களில் உள்ள வரிகள் சேர்த்துச் சேர்த்து எழுதப்பட்டிருக்கும். படிப்பதற்கு வசதியாகச் சொல் பிரித்துத் தருதல் என்பதும் ஒரு தொழில்நுட்பப் பணி. (Tamil Word Splitter)
    இதற்கு மொழியறிவும், சிறிது ஏரணமும் (logic) தேவைப்படும். சான்றாக: பொற்குடம் என்பதை (பொன்+குடம்) என்றும் மட்குடம் என்பதை (மண்+குடம்) என்றும் பிரிக்க வேண்டும். தொல்காப்பியரே விதிகளை ஒரு நிரல் போலத் தான் எழுதியிருக்கிறார். Exception Handling (அலங்கடை) கூடத் தொல்காப்பியத்தில் உண்டு.
  7. சங்கத்தமிழில்/ இலக்கியங்களில் ஒரு சொல், எங்கெங்கெல்லாம் வருகிறது என்று தேடுபொறி உருவாக்கித் தரலாம். (Tamil Literature Search Engine/ Tamil Concordance Tool)
    சான்றாக: யானை என்றோ களிறு (ஆண் யானை) என்றோ பிடி (பெண்யானை) என்றோ தேடினால், தமிழ் இலக்கியங்களில் எங்கெங்கெல்லாம் அச்சொல் இருக்கிறது? என்பதை எடுத்துக் கொடுப்பது போலச் சங்கத்தமிழ்த் தேடுபொறி, திருக்குறள் தேடுபொறி உருவாக்கலாம்.
  8. வெறும் அகராதி மட்டுமே அல்லாது, தொடர்புடைய சொற்கள் (Related Terms), நேர்ச்சொல்/எதிர்ச்சொல் (Synonym/Antonym), இயைபு ஒலிச்சொல் (Rhyming words) - ஒரு சொல்லில் இருந்தே பல சொல் பிடித்துக் கொண்டு போகும் Visual Thesaurus.
  9. ஆவண மாற்றிகள், அச்சுநூல் மாற்றிகள், ஒளிவருடல் கோப்புகளில் இருந்து எழுத்து அறுவடை செய்தல் (Pdf to Unicode Converter for Tamil)
  10. தமிழ் ஒலிப்புப் பயிற்றுநர்கள் மற்றும் பெண்-ஆண் பல்குரல் தமிழ் ஒலிப்பான்கள் (Tamil Voice Assistants)
  11. குழந்தைகளுக்கான தமிழ்ப் பெயர்கள் வழங்கு பொறி (Tamil Baby Names Provider).
    வெறும் முதலெழுத்து கொடுத்துப் பெயர்கள் பரிந்துரைப்பது மட்டுமன்றி, சான்றாக: அழகு என்று பொருளுடைய பெயர்கள், சங்கப் புலவர் பெயர்கள், சமூகநீதிப் பெயர்கள் என்று பல குறிச்சொல் சார்ந்த பெயர் தேடுபொறிகள்.

இவ்வாறு தமிழ்த் தொழில்நுட்பக் களத்தில் இயங்குபவர்கள், தனி ஒரு தளமாக மட்டும் இயங்கித் தேங்கிப் போய்விடாது, ஒன்றிணைப்புத் தளங்களில் (Integrated Platforms) இயங்க வேண்டும்.

எழில் நிரலாக்க மொழி, அண்மையில் பெருங்கவனத்தைப் பெற்றுள்ளது.
INFITT (International Forum for Information Technology in Tamil-INFITT, உலகத் தமிழ் தகவல் தொழில்நுட்ப மன்றம்-உத்தமம்), கார்க்கி ஆய்வு மையம், Natural Language Processing, Tamil Robotics என்றும் இன்னும் மீயுயர் (Advanced) தளங்களிலும் இயங்கலாம். எப்படி இயங்கினாலும்,

*நுட்பவியல் வளமாக்கல் (technical enrichment)
*மக்களுக்கு அன்றாடப் பயனாக்கல் (utility enrichment)

என்று இரண்டு விதமாகவும் இயங்க வேண்டும். "தொண்டு செய்க தமிழுக்கு, துறைதோறும் துறைதோறும் துடித்தெழுந்தே!" என்ற பாவேந்தரின் வரிகளை நிறைவேற்ற வாழ்த்துக்கள். நனி சால நன்றி.

 

, Professor (Adjunct)/ Investment Banker
 
 
 
Tamil Computing - Tools and Applications
Young Researchers' Conference 2021 (TaCTA-YRC2021)
Conference Program Schedule - Tentative

Day 1 - 12 March 2021, Friday, 16.00 – 19.00 Hrs IST

 

Time

Speakers

Topic


16.00 -16.30

Inaugural session
Chair: Dr. K. Kalyanasundaram

Profs. M. Surappa
Prof. M. Anandakrishnan
Prof. M. Ponnavaiko


16.30 - 17.30

Session 1
Chair: Prof. K. Rajan

Session 1
Chair: Prof. K. Rajan

Deep Learning Applications in Tamil NLP

Identification of Names from Tamil Novel

17.30 - 19.00

Session 2
Chair: Prof. Vasu Renganathan

Prof. C.N. Subalalitha
SRM Inst of Science & Technology, Chennai
Mr. Rajaraman
Infosys
Mr. Julien Malard
McGill Univ., Montreal

Tamil NLP AI applications.

தமிழ் எழுத்துப் பிழை காட்டி

லஸ்ஸி - பன்மொழி நிரலாக்கத்துக்காக ஒரு மென்பொருள் கருவி



Sponsors for the Prizes
Ailaysa KCT Tamil Mandram

Day 2 - 13 March 2021, Saturday, 16.00 – 19.30 Hrs IST

    Time Session Speakers Topic
    16.00 - 17.00 Session 3
    Chair: Prof. A. Murugaiyan
    Dr. R. Saranya
    (Central Univ of Tamilnadu)
    Dr. K. Parameswari
    Univ. of Hyderabad

    Named Entity Recognition for Tamil Posts using Deep Learning
    A Rule-Based Dependency parsing for Tamil

    17.00 - 19.00 Session 4
    Chair: Prof. L. Sobha
    Dr.M. Anand Kumar
    NIT, Suratkal, Karnataka
    Dr. Sinduja Gopalan
    Uniphore Softwares
    Ms.. Shenbagavadivu
    (SRM Vallaiyamma College of Engg)
    Dr. Balasubramanian
    Sacred Hearts College, Tirupattur
    .. to be announced

    Role of Concession Connectives in Sentiment Analysis
    வலை செயலி (Web App)- டிஜிட்டல் மயமாக்குதல்
    வல்லினம் மிகும் இடங்கள், மிகா இடங்கள் -செயலி உருவாக்கத்தின் வழி தமிழ் எழுதக் கற்பிக்கும் முறைமை

Day 3 - 14 March 2021, Sunday, 16.00 – 19.00 Hrs IST

    Time Session Speakers Topic
    16.00 - 17.15 Session 5
    Chair: Dr. Pattabhi Rao
    Best Projects of GCT Hackathon - session 1


    Presentation by the Teams:
    Litt09, Arts22, Arts17, Arts32 and Arts13
    (see details below)
    17.15 - 18.30 Session 6
    Chair: Dr. Vijay Shankar Ram
    Best Projects of GCT Hackathon - session 2

    ...
    Presentation by the Teams
    Litt21, Arts36, Litt05, Wiki08 and Litt12
    (see details below)

    18.30 - 19.00 Closing
    Chair: Mr. S. Maniam

    ...
    Mr. Rajaraman, Dr.K. Rajan,
    Dr. Subalalitha, Ms. Shenbagavadivu
    Dr. Siva Subramanian (Jurors -Hackathon)

    Prize Distribution for Best paper presentations
    of the Young Researchers' Conference

List of Best Executed Projects of GCT Hackathon 2021
 
Projects in Tamil Computing carried out by a group of undergraduate students of Engineering colleges

1. R. Naveenraj & Adithya Harish (PSG College of Tech, Kovai)
Team: Litt09 - Zerocoder
Title: இலக்கியங்களில் உள்ள சொல்லை எளிதில் தேடித் தரும் செயலி
 
2. Sri Vishnu, Pushpa, Nisha and Nivetha (Govt College of Engg, Salem)
Team : Arts22 -TeamThandras
Title: தமிழ் மரபு விளையாட்டுக்கள் இணைய வழி கொண்டு வருதல்
 
3. R. Dhinakar , J. Raghu, K. Arun Krishna & M. Ajay (Krishnasamy College of Engineering, Kloudone)
Team: Arts17 - mDNA-Transcription
Title: எழுத்ததிகாரம் (Digital Tamil Epigraphy Corpus)
 
4. Meenakshi Sundaram, S.R., Solaiyappa, S (Thiagarajar College of Engineering)
Team: Arts32 - Unique Coders
Title: தமிழர் திண்ணை விளையாட்டுகளை இணைய மயமாக்குதல்
 
5. V. Kavikumar (Kumaraguru College of Tech, Kovai), V. Barath & P. Karthick Kumar
Team; Arts13 - Boredom Techies
Title: தமிழ் பாரம்பரியக் கலைகளை ஆவணப் படுத்தல்
 
6. Alex Jeffrin, D., Sanjeyan, R, Shebana M, Gnana Sowndarya S (Rathinam College of Arts and Science, Kovai)
Team: Litt21 - Thamizh Talkies
Title: Tamil Virtual Assistant
 
7. Maharun Halida, Keerthana Shamida & Kanmani Gowsalya, Rahul (Govt College of Technology, Kovai)
Team: Arts36 - Best of the Best
Title: தமிழனின் பாரம்பரிய இசைக் கருவிகள்
 
8. R.L. Hariharan & M. Anand Kumar (NIT, Suratkal, Karnataka)
Team: Litt05 - NITK-NLP
Title: Design a Mind map for Tamil Language using Word Embeddings
 
9. Ajay, Rubesh Loganathan (Coimbatore Inst of Technology, Kovai)
Team: Wiki08 - CIT Mayoon
Title: Ancient Tamil Living Standard using virtual Reality
 
10. Mrs. N. Arulmozhi, K. Shalini , M. Abitha & A. Gomathi (Govt. College of Technology, Kovai)
Team: Litt12 - Vallinam
Title: Tamil Dialects (வட்டார வழக்கு) Database Portal
-----------------
 
 
 

 
 
 

கருத்துகள் இல்லை

எழுதுவது எப்படி?

 எழுதுவது எப்படி?   எழுதுவது எப்படி? – ஜெயமோகன் கற்றுத் தருகிறார்   புத்தகம் எழுதுவது எப்படி? முனைவர் வெ.இறையன்பு அவர்களின் அற்புதமான வழிகாட...