२३ एप्रिल, २०११

अव्यय, प्रत्यय, उपसर्ग इत्यादी



खाली दिलेल्या टेबलमध्ये सर्व प्रकारचे अव्यय, उपसर्ग वगैरे जमा केले. आता एकाच क्वेरीने विविध प्रकारचे शब्द चुकीचे/ बरोबर शब्द शोधणे शक्य होईल असे दिसते. उदा मला जर शब्दयोगी अव्यय लावलेले बहुतांश शब्द पाहायचे असतील तर ते सहज मिळू शकतील.

करिता हा शब्दयोगी अव्यय आहे, करी हा प्रत्यय आहे तर कु हा उपसर्ग आहे. म्हणून त्यांना प्रत्येकी १,२ व ३ असे नंबर मिळाले. असे सर्व अव्यय, प्रत्यय आणि उपसर्ग एका जागी आणून त्याचा उपयोग करून अशुद्ध शब्द मिळतात का ते पाहायचे आहे.

add_type
(1, 1, 'शब्दयोगी अव्यय'),
(2, 1, 'प्रत्यय'),
(3, 2, 'उपसर्ग')

add_word
(1, 'करिता', 'करीता', 'याकरिता'),
(2, 'करी', 'करि', 'गावकरी'),
(3, 'कु', 'कू', 'कुसंगती'),
(2, 'करू', 'करु', 'यात्रेकरू'),
(1, 'करून', 'करुन', 'येणेकरून'),
(1, 'करवी', 'करवि', 'याकरवी'),
(2, 'कीय', 'किय', 'परकीय'),

अधिक तांत्रिक माहिती या दुव्यावर उपलब्ध आहे.

http://code.google.com/p/hunspell-marathi-dictionary/wiki/avya_pratya_upsarg

याचा नक्की फायदा कसा, कोणाला होईल ते सांगता येत नाही. पण भाषेचे अभ्यासक याचा उपयोग करून घेऊ शकतील असे वाटते.
 _____
अधिक स्पष्टीकरण ऑगस्ट २५, २०१२ 
याचा उपयोग खाली दिलेले पर्याय सुधारण्यासाठी होऊ शकेल असे मला वाटते.



घोड्याप्रत , घोड्याप्रति घोड्याप्रमाणे आणि घोड्याप्रित्यर्थ असे चार शब्द दिसणे अपेक्षित आहे. त्याऐवजी घोड्यापर, घोद्याप्र घोद्यापर आणि घोदयाप्र असे चार ऑप्शन्स दिसत आहेत. हे चार शब्द पूर्णपणे कुचकामी आहेत कारण एकतर ते अशुद्ध शब्द आहेत आणि त्या शब्दांवरून एखादा शुद्ध शब्द बनू शकेल अशी शक्यता नाही. लेखकाने "घोड्याप्र" इतके टाईप केल्यावर दिसणार्‍या पर्यायांमध्ये डेटाबेसमधील शब्दांना प्राधान्य मिळाले पाहिजे.
त्यासाठी डेटाबेसमध्ये घोडा या शब्दाबरोबर त्यापासून बनणारे सर्व शब्द जमा करावे लागतील किंवा "घोड्या" असे रूप एकीकडे आणि त्याला लागू शकणारे अव्यय, उपसर्ग दुसर्‍या टेबलमध्ये अशी वर दाखविलेली रचना करता येईल.