११ ऑक्टोबर, २०२४

मराठी शब्द संग्रह

साठ लाख शब्दांपेक्षा जास्त शब्दांची फाईल खाली दिलेल्या दुव्यावर उपलब्ध करून दिली आहे. यात शुद्ध / अशुद्ध असे सर्वच शब्द आहेत.


datameetgeobk.s3.amazonaws.com/hunspell/ai4b/to_ai4b.txt

भाषेच्या अभ्यासकांना याचा उपयोग होऊ शकेल कारण प्रत्येक शब्दाबरोबर त्याची वारंवारता देखील दिली आहे. त्यावरून विविध निष्कर्ष काढता येतात. उदाहरणार्थ  खाली दिलेल्या डाटावरून "करणे" हे क्रियापद मराठीत "असणे" या क्रियापदानंतर सर्वात जास्त वापरले जाते असे म्हणता येईल.  (करण्यात, केला, केली, केले / आहे, आहेत, होते, होती, होता)

19798096 आहे
10021696 आणि
9236793 या
4859511 आहेत
4605454 ना
4288908 हे
3955666 यांनी
3615407 तर
3329200 का
3257382 ते
2944101 होते
2941239 एक
2905625 केली
2833018 व
2806197 हा
2469536 करण्यात
2449902 असे
2165567 केला
2095380 केले
2049289 होती
2034432 की
1951079 पण
1910578 होता
1783648 त्यामुळे
1761337 आता
1746278 मात्र
1699462 आले
1600933 त्या

हे शब्द नेटवरील विविध स्त्रोतांमधून जमा केले आहेत त्यामुळे त्यांची विश्वासार्हता किती ही एक शंका आहे. पण मी ही फाईल मोठ्या प्रमाणावर वापरतो. इतरांनाही त्याचा उपयोग होईल असे मला वाटते.

२४ ऑगस्ट, २०२४

मराठी स्पेलचेक अ‍ॅप (Google play store)

 शंतनू ओक यांच्या प्रयत्नातून साकार झालेले मराठी शुद्ध चिकीत्सक अ‍ॅप

अ‍ॅन्ड्रॉईडसाठी बनविलेले अ‍ॅप प्ले स्टोअरवरून "marathi spell check" या नावाने शोधून डाऊनलोड करता येते. यात मराठी बरोबरच संस्कृत स्पेल चेक आणि संस्कृत संधी / विग्रह देखील करून पाहता येतो. 

पार्श्वभूमी:

मॉड्युलर इन्फोटेक या कंपनीने अरूण फडके यांच्या सहकार्याने ७-८ वर्षांपूर्वीच असे एक अ‍ॅप विकसित केले होते. पण ते शुद्धलेखनाचे अ‍ॅप होते. त्यात तुम्ही एखादा शब्द टाईप करायला सुरुवात केली की त्या शब्दाने सुरू होणारे शब्द दिसू लागत. उदाहरणार्थ तुम्हाला माध्यमिक शब्दातील "मी" पहिली की दुसरी प्रश्न असेल तर तुम्ही "मा" असे टाईप करणे अपेक्षित असे. तसे केले की त्यावरून सुरू होणारे शब्द म्हणजे माधुर्य, माधवी, माध्यमिक दिसू लागत.  त्यावरून तो शब्द कसा लिहिला पाहीजे ते समजत असे.  थोडक्यात छापील मराठी भाषा कोश मोबाईलवर उपलब्ध करून देण्याचा प्रयत्न झाला होता. एका मर्यादित अर्थाने यशस्वी झालेले ते अ‍ॅप आता प्ले स्टोअरवर उपलब्ध नाही.

इंग्रजी - मराठी डिक्शनरी (English Marathi Dictionary by Innovative Software)  हे अ‍ॅप लाखो लोकांपर्यंत पोहोचले आहे. त्यात "test" हा इंग्रजी शब्द टाईप केला की चाचणी, कसोटी आणि परीक्षा असे अर्थ दिसतात.  तर "माध्यमिक" असा शब्द टाईप केला तर seminary, secondary असे इंग्रजी शब्द मिळतात.  पण "माध्यमीक" हा शब्द चुकीचा असून तो माध्यमिक असा पाहिजे असे खात्रीपूर्वक सांगणारे एकही अ‍ॅप नाही. गूगल की-बोर्ड किंवा देश मराठी कीबोर्ड या सारखे की-बोर्ड जर इन्स्टॉल असतील तर त्यात टाईप करतानाच योग्य तो शब्द सुचविला जातो हे बरोबर आहे पण तो शब्द शुद्धलेखनाच्या नियमानुसार शुद्धच असेल अशी काही शाश्वती नाही. दुसरी गोष्ट म्हणजे जर खूप मोठा मजकूर स्पेल चेक करायचा असेल तर एक एक शब्द गूगल की-बोर्डच्या साहाय्याने टाईप करत बसावा लागेल. जर हाताने कागदावर लिहिलेला मजकूर असेल किंवा तुमच्याकडे छापील मजकुराचा फोटो असेल तर त्यातील लिखाण गूगल लेन्सच्या माध्यमातून युनिकोडमध्ये बदलता येते.  आणि मग अशा कॉपी-पेस्ट केलेल्या मजकुरासाठी मराठी स्पेल चेक या अ‍ॅपमधील शुद्धीचिकीत्सक वापरता येतो.

एखाद - दुसरा शब्द बरोबर आहे का किंवा तो शब्द नेमका कसा लिहायचा हे पाहण्यासाठी ऑनलाईन/ ऑफलाईन बरेच मार्ग उपलब्ध आहेत. पण संपूर्ण मजकुराचा स्पेल चेक करून देणारे असे अ‍ॅप मराठीत प्रथमच उपलब्ध होत आहे. त्याचे स्वागत करू या. 

_____

संगणकावर मराठी स्पेल चेक हवा असेल तर शंतनू ओक आणि ओंकार जोशी यांच्या प्रयत्नातून साकार झालेला मराठी शुद्ध चिकीत्सक फायरफॉक्स आणि लिब्रे ऑफिस या सॉफ्टवेअरसाठी एक्स्टिंशनच्या स्वरूपात अनेक वर्षांपासून उपलब्ध आहे.

firefox 

https://addons.mozilla.org/en-US/firefox/addon/marathi-dictionary/

libreoffice

https://extensions.libreoffice.org/en/extensions/show/marathi-spellchecker

_____

ज्यांना सिक्युरिटीच्या कारणाने किंवा अ‍ॅपची गर्दी होऊ नये म्हणून हे अ‍ॅप इन्स्टॉल करायचे नसेल त्यांच्यासाठी टेलिग्राम बॉट उपलब्ध आहे. (मराठी स्पेल बॉट आणि संस्कृत वन बॉट)  आयफोन वापरणारे देखील टेलिग्रामसाठी बनविलेल्या या दोन्ही बॉटचा उपयोग करू शकतात.

Marathi Spell Bot

https://t.me/Marathispellbot

_____

Sanskrit One Bot

https://t.me/SanskritOneBot

संस्कृत पानावर संधी आणि विग्रह अशा दोन्ही सोयी उपलब्ध आहेत. म्हणजे तुम्ही जर "कर्मण्येवाधिकारस्ते" असे टाईप केले तर "कर्मणि एव अधिकारः ते" अशी फोड करून मिळेल. तसेच दोन किंवा अधिक शब्द टाईप केले तर त्यांची संधी करून मिळेल. उदा.  "गणेश उत्सव" असे टाईप केले तर "गणेशोत्सव" असे उत्तर मिळेल. 

०७ ऑगस्ट, २०२४

मराठी स्पेलचेक अ‍ॅप

 मराठी स्पेलचेक अ‍ॅपची नवीन आवृत्ती गुगल प्ले स्टोअरवर उपलब्ध आहे.

https://play.google.com/store/apps/details?id=com.myapp.marathispellcheckandsanskritsandhi&hl=en

काही मराठी शब्दांची भर घातली आहे.  कॉपी-पेस्ट केलेला कोणताही मजकूर आता अगदी १०० टक्के नाही तरी निदान ९५ टक्के अचूक तपासला जात आहे. संस्कृत पानावर संधी आणि विग्रह अशा दोन्ही सोयी उपलब्ध आहेत. म्हणजे तुम्ही जर "कर्मण्येवाधिकारस्ते" असे टाईप केले तर "कर्मणि एव अधिकारः ते" अशी फोड करून मिळेल. तसेच दोन किंवा अधिक शब्द टाईप केले तर त्यांची संधी करून मिळेल. उदा.  "गणेश उत्सव" असे टाईप केले तर "गणेशोत्सव" असे उत्तर मिळेल. 

ज्यांना सिक्युरिटीच्या कारणाने किंवा अ‍ॅपची गर्दी होऊ नये म्हणून हे अ‍ॅप इन्स्टॉल करायचे नसेल त्यांच्यासाठी टेलिग्राम बॉट उपलब्ध आहे. 

Sanskrit One Bot

https://t.me/SanskritOneBot

Marathi spell bot

https://t.me/Marathispellbot

आयफोन वापरणारे देखील टेलिग्राम साठी बनविलेल्या दोन्ही बॉटचा उपयोग करू शकतात.

_____

फायरफॉक्ससाठी बनविलेले अ‍ॅड ऑन फार पूर्वीपासून येथे उपलब्ध आहे.

https://addons.mozilla.org/en-US/firefox/addon/marathi-dictionary/

लिब्रे ऑफिससाठी बनविलेले अ‍ॅड ऑन येथून मिळवता येईल.

https://extensions.libreoffice.org/en/extensions/show/marathi-spellchecker

त्यात सिनॉनिम (समानार्थी शब्द) आणि अ‍ॅटोकरेक्ट अशा अधिकच्या सोयी मिळतील. त्याच पानावरून पुढे लिब्रे ऑफिससाठी बनविलेल्या इतर सुविधा पाहता येतील. उदाहरणार्थ स्पेल चेक प्लस हा मॅक्रो वापरून फक्त चुकीचे शब्द निवडून वेगळे काढता येतील.

१७ जुलै, २०२४

डिक्शनरीतील इंग्रजी शब्द

डिक्शनरीतील इंग्रजी शब्दांच्या लिखाणातील अनुस्वार (काही ठिकाणी) परसवर्ण पद्धतीने लिहिला आहे. उदा.


बाँड बॉण्ड
क्रॉंक्रीट कॉन्क्रीट
काँस्टेबल कॉन्स्टेबल
काँट्रिब्युशन कॉन्ट्रिब्युशन
फाँट फॉण्ट
लाँच लॉन्च

स्टँप स्टॅम्प
कँप कॅम्प
कँसर कॅन्सर
हँडसेट हॅण्डसेट

कंस्ट्रक्शन कन्स्ट्रक्शन
प्रिंसिपल प्रिन्सिपल
रेसिडेंट रेसिडेन्ट

१७ मे, २०२४

वृद्धी नियम

 इक (िक) अथवा ई (ी)  प्रत्यय जोडल्यावर शब्दाचे पहिले अक्षर दीर्घ बनते.


स्वर दीर्घ बनतो. उदा. इच्छा > ऐच्छिक
अ आ
इ  ऐ
ई   ऐ
उ   औ
ऊ  औ
ए ऐ
ओ औ

व्यंजनाला लागलेला स्वर देखील दीर्घ बनतो. उदा. देव > दैविक धर्म > धार्मिक
x ा
ि   ै
ी ै
ु  ौ
ू ौ
े ै
ो ौ

स्वर आधीच दीर्घ असेल तर काहीच बदल होत नाही. उदा. मास > मासिक
आ आ
ऐ ऐ
औ औ
ा ा
ै ै
ौ ौ 

_____

import re

pattern = re.compile(r"(.्)?.[ािीुूृेैोौं]?[ं]?")
pattern.match('व्यैक्ती').group(0)

# return 'व्यै'

Using regex in hunspell affix file

The regular expression is used very nicely in this example.

SFX j a âed tha
SFX j a âed cha
SFX j a aed [^tc]ha

https://github.com/fin-w/LibreOffice-Geiriadur-Cymraeg-Welsh-Dictionary/blob/main/dictionaries/cy_GB.aff

१७ मार्च, २०२४

संस्कृत विभक्ती

 संस्कृतमें पितृ शब्द की प्रथमा विभक्ती "पिता पितरौ पितरः" भ्रातृ शब्द की "भ्राता भ्रातरौ भ्रातरः" तो दातृ शब्द की विभक्ती "दाता दातरौ, दातरः" होनी चाहीये न की "दाता दातारौ दातारः"?

Explanation:

तृन्-प्रत्ययान्तशब्दाः, तृच्-प्रत्ययान्तशब्दाः, तथा अप्, स्वसृ, नप्तृ, नेष्टृ, त्वष्टृ, क्षत्तृ, होतृ, पोतृ, तथा प्रशातृ - एतेषामङ्गस्य उपधायाः असम्बुद्धिवाचके सर्वनामस्थानपरे दीर्घः भवति ।

https://ashtadhyayi.com/sutraani/6/4/11

Sutra (7-1-94) is used to derive: पिता दाता; sutra (7) brings in अनङ् as an आदश for ऋ and then sutra ( 6-4-8) make the उपधा दीघः thus getting the form पिता and दाता। 

https://sanskritdocuments.org/learning_tools/subantaruupaNi.pdf