கணினி நிரலாக்கத் திறன் பெற்றவர்கள் தமிழுக்கு எவ்வாறெல்லாம் தொண்டாற்றலாம்?
நிரலாக்கத் திறன் (coding skills) இன்றைய பல்துறைப் பணிகளுக்கும் மிகமிகப் பயனுள்ள ஒன்று. மொழியியல் துறையிலும் அவ்வண்ணமே. தமிழ்மொழியை இலகு செய்யும் புள்ளிகளில் நிரலாக்கத் திறன் உள்ளவர்கள் என்னவெல்லாம் செய்யலாம்? என்பதை ஒரு பட்டியல் போலச் சொல்லி விடுகிறேன்.
- தமிழ் இலக்கணம் சார்ந்து அதை இலகு செய்யக்கூடிய பல நுட்பங்களைத் தமிழ்மொழிக்கு உருவாக்கிக் கொடுக்கலாம். குறிப்பாக எங்கெங்கெல்லாம் சந்தி மிகும்/சந்தி மிகாது, சந்திக்குப் பதிலாக நிறுத்தற் குறிகள்/ தரிப்புக் குறிகள் போன்றவற்றை எங்கு பயன்படுத்திக் கொள்ளலாம் என்பதற்கான தானியங்கு பிழைதிருத்தி (Auto Spellchecker) போல ஒரு செயலியை உருவாக்கிக் கொடுக்கலாம். இப்போதுள்ளவை அத்துணைப் போதுமானதாக இல்லை.
- வடமொழிச் சொற்களுக்கு இணையான நேரடித் தமிழ்ச் சொல்லை மாற்றித் தரும் செயலிகளை/ நிரல்களை உருவாக்கலாம் (Auto Sanskrit Remover).
சான்றாக, உதாரணம்/ சந்தோஷம் என்று எழுதப்பட்டால் அதைச் சான்று/ மகிழ்ச்சி என்று தானே மாற்றித் தருவது போல ஒரு செயலி. இவ்வாறு வடசொற்களுக்கு இணையான தமிழ்ச் சொற்களை, நான்கு-ஐந்து முறை தானே மாற்றித் தரும்போது ஆறாவது முறை நாமே நேரடித் தமிழ்ச்சொல்லைப் பயன்படுத்தத் துவங்கி விடுவோம். - மக்கள்
பேச்சு வழக்காகத் தமிழ் வாக்கியங்களுக்கு இடையில் சொல்லும் ஆங்கிலச்
சொற்களைத் தமிழிலோ (அல்லது) அப்படியே ஆங்கிலத்திலோ மாற்றித் தருவது. (Auto
Tanglish Adapter)
சான்றாக, ‘மேட்னீ ஷோ’ என்று எழுதினால் அதனை ‘matinee show’ என்றோ அல்லது ‘நண்பகல் காட்சி’ என்றோ, (அல்லது) நண்பகல் காட்சி என்ற தமிழ்ச் சொல்லாகவும் கூடவே அடைப்புக் குறிக்குள் ஆங்கிலத்தில் (matinee show) என்றும் மாற்றித் தருவது போலச் செயலிகள் செய்யலாம். - தற்காலத்தில்
தொழில்நுட்பக் காரணங்களுக்காக ஆங்கிலப் பயன்பாடு அதிகரித்துள்ளது. இங்கே
ஆங்கிலத்தை ஆங்கிலத்திலேயே எழுதிவிட்டால் சிக்கல் இல்லை. சில நேரங்களில்
தமிழாக்கம் புரிந்து கொள்ளக் கடினமாக உள்ளது என்றால், அந்தத்
தமிழ்ச்சொல்லுக்கு அருகிலேயே ஆங்கிலச் சொல்லையும் அடைப்புக்குறிக்குள்
எழுதுவது பயன் தரும். (Technical Terms Adapter).
சான்றாக: பாட்காஸ்ட் என்று எழுதுவதை, ஒலியோடை (Podcast) என்பது போல் மாற்றித் தரும் செயலிகள்.
இதுபோல பல பணிகளை நிரலாக்கத் திறன் உள்ளவர்கள் தமிழுக்காகச் செய்யலாம். இது போன்று பணிகளைச் செய்தாலே, மொழிநடையில் 50 விழுக்காடு வெற்றி கிட்டிவிடும். இவையெல்லாம் தான் தொழில்நுட்ப மொழித் தொண்டு. - மொழியியல் அல்லாமல், மொழிசார்ந்த வரலாறு, பண்பாடு, தொல்லியல் போன்ற துறைகளுக்கும் கணினித் தொழில்நுட்பம் தேவைப்படுகிறது. ஒரு கல்வெட்டு படிப்பதற்கோ, தமிழ் பிராமி என்று சொல்லப்படும் தமிழி எழுத்துக்களை வாசிப்பதற்கோ, வட்டெழுத்துக்கள் வாசிப்பதற்கோ, சுவடியில் உள்ள தொல் இலக்கிய இலக்கணங்களை வாசிப்பதற்கு உதவும் வகையில் கூட ஒரு Scanner செயலி செய்யலாம். (Tamil Epigraphy Reader)
- மேலும்
பழங்கால இலக்கியங்களில் உள்ள வரிகள் சேர்த்துச் சேர்த்து
எழுதப்பட்டிருக்கும். படிப்பதற்கு வசதியாகச் சொல் பிரித்துத் தருதல்
என்பதும் ஒரு தொழில்நுட்பப் பணி. (Tamil Word Splitter)
இதற்கு மொழியறிவும், சிறிது ஏரணமும் (logic) தேவைப்படும். சான்றாக: பொற்குடம் என்பதை (பொன்+குடம்) என்றும் மட்குடம் என்பதை (மண்+குடம்) என்றும் பிரிக்க வேண்டும். தொல்காப்பியரே விதிகளை ஒரு நிரல் போலத் தான் எழுதியிருக்கிறார். Exception Handling (அலங்கடை) கூடத் தொல்காப்பியத்தில் உண்டு. - சங்கத்தமிழில்/
இலக்கியங்களில் ஒரு சொல், எங்கெங்கெல்லாம் வருகிறது என்று தேடுபொறி
உருவாக்கித் தரலாம். (Tamil Literature Search Engine/ Tamil Concordance
Tool)
சான்றாக: யானை என்றோ களிறு (ஆண் யானை) என்றோ பிடி (பெண்யானை) என்றோ தேடினால், தமிழ் இலக்கியங்களில் எங்கெங்கெல்லாம் அச்சொல் இருக்கிறது? என்பதை எடுத்துக் கொடுப்பது போலச் சங்கத்தமிழ்த் தேடுபொறி, திருக்குறள் தேடுபொறி உருவாக்கலாம். - வெறும் அகராதி மட்டுமே அல்லாது, தொடர்புடைய சொற்கள் (Related Terms), நேர்ச்சொல்/எதிர்ச்சொல் (Synonym/Antonym), இயைபு ஒலிச்சொல் (Rhyming words) - ஒரு சொல்லில் இருந்தே பல சொல் பிடித்துக் கொண்டு போகும் Visual Thesaurus.
- ஆவண மாற்றிகள், அச்சுநூல் மாற்றிகள், ஒளிவருடல் கோப்புகளில் இருந்து எழுத்து அறுவடை செய்தல் (Pdf to Unicode Converter for Tamil)
- தமிழ் ஒலிப்புப் பயிற்றுநர்கள் மற்றும் பெண்-ஆண் பல்குரல் தமிழ் ஒலிப்பான்கள் (Tamil Voice Assistants)
- குழந்தைகளுக்கான தமிழ்ப் பெயர்கள் வழங்கு பொறி (Tamil Baby Names Provider).
வெறும் முதலெழுத்து கொடுத்துப் பெயர்கள் பரிந்துரைப்பது மட்டுமன்றி, சான்றாக: அழகு என்று பொருளுடைய பெயர்கள், சங்கப் புலவர் பெயர்கள், சமூகநீதிப் பெயர்கள் என்று பல குறிச்சொல் சார்ந்த பெயர் தேடுபொறிகள்.
இவ்வாறு தமிழ்த் தொழில்நுட்பக் களத்தில் இயங்குபவர்கள், தனி ஒரு தளமாக மட்டும் இயங்கித் தேங்கிப் போய்விடாது, ஒன்றிணைப்புத் தளங்களில் (Integrated Platforms) இயங்க வேண்டும்.
எழில் நிரலாக்க மொழி, அண்மையில் பெருங்கவனத்தைப் பெற்றுள்ளது.
INFITT
(International Forum for Information Technology in Tamil-INFITT, உலகத்
தமிழ் தகவல் தொழில்நுட்ப மன்றம்-உத்தமம்), கார்க்கி ஆய்வு மையம், Natural
Language Processing, Tamil Robotics என்றும் இன்னும் மீயுயர் (Advanced)
தளங்களிலும் இயங்கலாம். எப்படி இயங்கினாலும்,
*நுட்பவியல் வளமாக்கல் (technical enrichment)
*மக்களுக்கு அன்றாடப் பயனாக்கல் (utility enrichment)
என்று இரண்டு விதமாகவும் இயங்க வேண்டும். "தொண்டு செய்க தமிழுக்கு, துறைதோறும் துறைதோறும் துடித்தெழுந்தே!" என்ற பாவேந்தரின் வரிகளை நிறைவேற்ற வாழ்த்துக்கள். நனி சால நன்றி.
, Professor (Adjunct)/ Investment Banker
Tamil Computing - Tools and Applications Young Researchers' Conference 2021 (TaCTA-YRC2021) Conference Program Schedule - Tentative |
Day 1 - 12 March 2021, Friday, 16.00 – 19.00 Hrs IST
Time |
Speakers |
Topic |
|
16.00 -16.30 |
Inaugural session |
Profs. M. Surappa |
|
16.30 - 17.30 |
Session 1 |
Session 1 |
Deep Learning Applications in Tamil NLP Identification of Names from Tamil Novel |
17.30 - 19.00 |
Session 2 |
Prof. C.N. Subalalitha |
Tamil NLP AI applications. தமிழ்
எழுத்துப் பிழை காட்டி |
Sponsors for the Prizes | |
Ailaysa | KCT Tamil Mandram |
Day 2 - 13 March 2021, Saturday, 16.00 – 19.30 Hrs IST
Time | Session | Speakers | Topic | |
16.00 - 17.00 | Session 3 Chair: Prof. A. Murugaiyan | Dr. R. Saranya (Central Univ of Tamilnadu) Dr. K. Parameswari Univ. of Hyderabad | Named Entity Recognition for Tamil Posts using Deep Learning A Rule-Based Dependency parsing for Tamil | |
17.00 - 19.00 | Session 4 Chair: Prof. L. Sobha | Dr.M. Anand Kumar NIT, Suratkal, Karnataka Dr. Sinduja Gopalan Uniphore Softwares Ms.. Shenbagavadivu (SRM Vallaiyamma College of Engg) Dr. Balasubramanian Sacred Hearts College, Tirupattur |
.. to be announced Role of Concession Connectives in Sentiment Analysis வலை செயலி (Web App)- டிஜிட்டல் மயமாக்குதல் வல்லினம் மிகும் இடங்கள், மிகா இடங்கள் -செயலி உருவாக்கத்தின் வழி தமிழ் எழுதக் கற்பிக்கும் முறைமை |
Day 3 - 14 March 2021, Sunday, 16.00 – 19.00 Hrs IST
Time | Session | Speakers | Topic |
16.00 - 17.15 | Session 5 Chair: Dr. Pattabhi Rao | Best Projects of GCT Hackathon - session 1 | Presentation by the Teams: Litt09, Arts22, Arts17, Arts32 and Arts13 (see details below) |
17.15 - 18.30 | Session 6 Chair: Dr. Vijay Shankar Ram | Best Projects of GCT Hackathon - session 2 ... | Presentation by the Teams Litt21, Arts36, Litt05, Wiki08 and Litt12 (see details below) |
18.30 - 19.00 | Closing Chair: Mr. S. Maniam ... | Mr. Rajaraman, Dr.K. Rajan, Dr. Subalalitha, Ms. Shenbagavadivu Dr. Siva Subramanian (Jurors -Hackathon) | Prize Distribution for Best paper presentations of the Young Researchers' Conference |
1. R. Naveenraj & Adithya Harish (PSG College of Tech, Kovai)
Team: Litt09 - Zerocoder
Title: இலக்கியங்களில் உள்ள சொல்லை எளிதில் தேடித் தரும் செயலி
Team : Arts22 -TeamThandras
Title: தமிழ் மரபு விளையாட்டுக்கள் இணைய வழி கொண்டு வருதல்
Team: Arts17 - mDNA-Transcription
Title: எழுத்ததிகாரம் (Digital Tamil Epigraphy Corpus)
Team: Arts32 - Unique Coders
Title: தமிழர் திண்ணை விளையாட்டுகளை இணைய மயமாக்குதல்
Team; Arts13 - Boredom Techies
Title: தமிழ் பாரம்பரியக் கலைகளை ஆவணப் படுத்தல்
Team: Litt21 - Thamizh Talkies
Title: Tamil Virtual Assistant
Team: Arts36 - Best of the Best
Title: தமிழனின் பாரம்பரிய இசைக் கருவிகள்
Team: Litt05 - NITK-NLP
Title: Design a Mind map for Tamil Language using Word Embeddings
Team: Wiki08 - CIT Mayoon
Title: Ancient Tamil Living Standard using virtual Reality
Team: Litt12 - Vallinam
Title: Tamil Dialects (வட்டார வழக்கு) Database Portal
-----------------
கருத்துகள் இல்லை