१४ डिसेंबर, २०२२

ऍटोकरेक्ट वापरून कठीण शब्द / जोडाक्षरे

नेहमी लागणारे कठीण शब्द (इंग्रजी भाषेच्या) ऍटोकरेक्ट लिस्टमध्ये टाकून ठेवता येतात. उदा.

:klp: क्लृप्ती

:krd: कुऱ्हाड

आता मला जेव्हा "क्लृप्ती" हा शब्द लिहायचा असेल तेव्हा फक्त  :klp: असे लिहून स्पेस दिली की काम झाले!

०३ डिसेंबर, २०२२

वापरात नसलेले शब्द

जे शब्द स्पेलचेकच्या डेटाबेसमध्ये नाही घेतले तरी चालतील अशा सुमारे पाच हजार शब्दांची यादी तयार केली आहे.

https://github.com/shantanuo/Spell-Checker/blob/master/exclude_words.txt

शब्दकोशात असले तरी हे शब्द वापरात नाहीत म्हणून स्पेलचेकमधूनही काढले आहेत. वापरात आहेत की नाही हे ठरविण्याचा एकमेव निकष म्हणजे गूगलमध्ये तो शब्द किती वेळा आला आहे ते पाहिले. ० ते १०० अशा स्केलमध्ये शून्य ते तीस / चाळीस पर्यंतची मजल गाठू न शकलेले हे शब्द काढले तर डेटाबेसचा आकार लहान ठेवता येईल असे मला वाटते.

२८ ऑक्टोबर, २०२२

एनॉटॉमी आणि लोअर लिंब

 लोकसत्ताच्या संपादकीयात नुकताच भाषेचा विषय येऊन गेला आहे.

https://www.loksatta.com/sampadkiya/editorial/loksatta-editorial-about-mbbs-course-in-hindi-zws-70-3201595/

त्यांनी विचारलेला प्रश्न बरोबर आहे. एनॉटॉमी, लोअर लिंब, मेडिकल फिजिओलॉजी हे शब्द का? यातून फक्त इंग्रजी परिभाषेचे देवनागरी लिपीतील सादरीकरण दिसते. हेही मान्य. पण  माझा प्रश्न फक्त असा आहे की हे शब्द मराठीत ॲनॉटॉमी, लिम्ब, फिजियोलॉजी असे लिहावेत का? की हिंदीत जसे लिहिले आहेत तसेच लिहावे? खाली दिलेल्या साईटवर खूप कोश दिसत आहेत पण ते anatomy हा शब्द एनॉटॉमी लिहावा की ॲनॉटॉमी याचा निर्णय देत नाहीत तर त्याला पर्यायी मराठी शब्द "शारीर" सुचवीत आहेत.

http://marathibhasha.org/

रोमन इंग्रजी ते देवनागरी इंग्रजी असा कोणता कोश ऑनलाईन/ युनिकोड स्वरुपात उपलब्ध आहे का? स्पेलचेकसाठी असे काही शब्द हवे आहेत म्हणून विचारत आहे.

१३ सप्टेंबर, २०२२

अफिक्स फाईलमधील बदल

 "घराना घरानो घरानी"  या तीन शब्दांना अनुक्रमे "घरांना घरांनो घरांनी" अशी सुचवणी येणे अपेक्षित आहे. पण  अगदी वेगळेच शब्द राईट क्लिकवर दिसतात.  त्यासाठी  रिप्लेसमेंट टॅगमध्ये ही नोंद केली.

REP ाना ांना
REP ानो ांनो
REP ानी ांनी

खाली दिलेले रफार चुकीचे असून ते विसर्गाने दाखवायला हवे. म्हणून ते देखील अफिक्स फाईलच्या रिप्लेसमेंट टॅगमध्ये टाकले.

REP र्क ःक
REP र्ख ःख
REP र्च ःच
REP र्छ ःछ
REP र्ट ःट
REP र्ठ ःठ
REP र्त ःत
REP र्थ ःथ
REP र्प ःप
REP र्फ ःफ
REP र्श ःश
REP र्ष ःष
REP र्स ःस

SQL Query:

select regexp_extract(word, 'ः.')   as mychar , count(*) as cnt 
from oscar2_sorted 
where word like '%ः%' 
group by regexp_extract(word, 'ः.')  

०३ सप्टेंबर, २०२२

इंग्रजी शब्द मराठीत (भाग ५)

युनिकोडच्या दृष्टीने योग्य शब्द कसा काढायचा ते खाली दिले आहे.

कॅप
['क', 'ॅ', 'प']

कँप
बरोबर - ['क', 'ँ', 'प']
चूक - ['क', 'ॅ', 'ं', 'प']\

कॉस्ट
['क', 'ॉ', 'स', '्', 'ट']\

काँग्रेस
बरोबर - ['क', 'ा', 'ँ', 'ग', '्', 'र', 'े', 'स']
चूक - ['क', 'ॉ', 'ं', 'ग', '्', 'र', 'े', 'स']

व्याकरणाच्या दृष्टीने पाहिले तर अनुस्वार वेगळा देणेच बरोबर ठरते. म्हणजे आपण 'भोंगा' शब्दात ओवर अनुस्वार देतो तर 'भिंत' शब्दात इवर अनुस्वार देतो तसा ॅ आणि ॉ वर अनुस्वार द्यायला हवा. पण या बाबतीत युनिकोडने व्याकरणाशी फारकत घेतली आहे. चंद्रकोर आणि अनुस्वार मिळून एकच एक असे चंद्रबिंदू नावाचे ँ चिन्ह देऊन युनिकोडने एक बाईट वाचवला आहे असे दिसते.

कँप शब्द कॅंप असा लिहिला तर एक बाईट जास्त खर्च होईलच पण त्याबरोबरच बहुतेक सर्व फाँटमध्ये अनुस्वार चुकीच्या जागी दिसेल. ते अक्षर तुटल्यासारखेच प्रिंटदेखील होईल आणि वाचायला त्रास होईल. म्हणून काँग्रेस शब्द कॉंग्रेस असा लिहू नये.

२७ ऑगस्ट, २०२२

इंग्रजी शब्द मराठीत (भाग ४)

नॉव्हेल या शब्दाचे अनेकवचनी रूप "नॉव्हेल्सचा" असे होऊ शकते खाली दिलेल्या नियमानुसार.

SFX S Y 3
SFX S 0 ्स/ac .
SFX S ग ग्ज ग
SFX S 0 ेस/ac [सशज]

त्यासाठी नॉव्हेल/S अशी नोंद डिक्शनरीमध्ये करावी लागते. "बस" किंवा "वेज" या शब्दांची अनेकवचने रूपे बस्सचा किंवा वेज्सचा अशी न होता बसेसचा आणि वेजेसचा अशी होतात. तर बॅग या शब्दाचे अनेकवचन बॅग्स या बरोबरच बॅग्ज असेही होते. त्या सर्वांची सोय वरील नियमात केली आहे. डिक्शनरीतील नोंदी अशा दिसायला हव्यात.

नॉव्हेल/S
बस/S
वेज/S
बॅग/S

२५ ऑगस्ट, २०२२

विशेष नामांची व्यवस्था

आनंद/k अशी नोंद डिक्शनरीत आहे. त्यावरून आनंदाची, आनंदाने असे शब्द बनतील. पण हा शब्द भाववाचक नामाबरोबरच विशेष नाम म्हणूनदेखील वापरला जातो.  उदाहरणार्थ आनंद हे एखाद्या व्यक्तीचे नाव देखील असू शकते. अशा वेळी आपण "आनंदची बायको" असे म्हणतो.  सध्या "आनंदची" हा शब्द स्पेलचेकर चुकीचा म्हणून दाखवत आहे. जर आनंद/Aac अशी नोंद केली तर तो शब्ददेखील डिक्शनरीत जमा होईल. दोन्ही शब्द मिळून  आनंद/Aack अशी नोंद करता येईल. पण तसे करण्याचे मी टाळले आहे. कोणती विशेष नामे डिक्शनरीत घ्यायची ते नक्की करावे लागेल. आनंद हा शब्द विशेष नाम म्हणून फार कमी प्रमाणात वापरला जातो. गांधी, मोदी, अडानी, अंबानी हे शब्द आता विशेषनामे म्हणून नव्हे तर सत्ता/ संपत्ती यांना प्रतिशब्द म्हणून मोठ्या प्रमाणात वापरले जातात. म्हणून ते शब्द घेता येतील. इतर शब्दांच्या बाबत काटेकोरपणे विचार करावा लागेल.

०९ ऑगस्ट, २०२२

इंग्रजी शब्द मराठीत (भाग ३)

इंग्रजी ऍ चा मराठीत आ (क्वचित ए इ) असा बदल होतो. तसेच जोडाक्षरातील "ह"चा उच्चार होत नाही. उदा.

लॅबॉरेटरी / लॅब्रोटरी

मॅट्रीक / म्याट्रिक

ड्रॉवर / ड्रावर 

डिव्होर्स / डिवोर्स 

नेचरोपॅथी / नॅचरोपथी

न्युट्रॅलिटी / नुट्रलिटी

पॉवर / पावर

सँटाक्लॉज / सांताक्लॉज

ट्रॅफिक / ट्राफिक

सायकॅट्रिस्ट / सायकियाट्रिस्ट

डिमॉलिशन / डिमोलेशन

कोव्हॅक्सीन / कोवॅक्सीन 

कॉलेस्ट्रॉल / कोलेस्ट्रोल

कॅथॉलिक / कॅथलिक 

डिव्हिडंट / डिविडेंट

डिझ्नी / डिझनी

डिलिव्हरी / डिलिवरी

०८ ऑगस्ट, २०२२

इंग्रजी शब्द मराठीत (भाग २)

tragedy हा शब्द तीन प्रकारे लिहिता येतो.  १) ट्रॅजडी २) ट्रॅजिडी ३) ट्रॅजेडी 

त्यातील पहिला पर्याय ऑक्सफर्डसंमत असल्यामुळे विकीपीडियावर तो वापरता येईल कारण तो ज्ञानकोश असून पूर्णपणे नियमाने चालणे अपेक्षितच आहे.

पण स्पेल चेकसाठी तो पर्याय उपयोगी नाही. इथे "शास्त्रात रुढी बलियसी" हा न्याय वापरावा लागतो. त्यामुळे दुसरा पर्याय ट्रॅजिडी योग्य वाटतो. कारण गूगलमध्ये तो शब्द तिसऱ्या शब्दापेक्षा दसपट जास्त वेळा वापरला गेला आहे. पण गूगलमध्ये हिंदी पानांवरदेखील हा शब्द दिसतो. त्यामुळे कदाचित हिंदी स्पेलचेकसाठी दुसरा पर्याय योग्य होईल. मराठी स्पेलचेकसाठी मात्र तिसरा पर्याय घेतला पाहिजे कारण 'चा’, 'ची', 'चे' सारखे विभक्ती प्रत्यय आणि 'मध्ये’, 'पेक्षा’, 'वर’, 'वरून’, 'कडे' यासारखी अव्यये तिसऱ्या शब्दात वापरलेली दिसतात, दुसऱ्या शब्दात त्यांचा वापर फार कमी झालेला दिसून येईल. उदा. "ट्रॅजिडीकडे" या शब्दासाठी गूगलमध्ये एकही पान दिसत नाही तर "ट्रॅजेडीकडे" या शब्दासाठी चार-पाच पाने दिसतात.

तेव्हा "ट्रॅजेडी" मराठी स्पेलचेकमध्ये,  "ट्रॅजिडी" हिंदी स्पेलचेकमध्ये तर "ट्रॅजडी" मराठी / हिंदी विकीपीडियावर अशी मांडणी करावी लागेल असे वाटते.

_____

खाली दिलेल्या शब्दात अर्ध्या "न" चा उच्चार स्प्ष्ट होतो आणि तो काही पर-सवर्ण पद्धतीने काढलेला अनुस्वार नाही तेव्हा हे शब्द पहिल्या पर्यायाप्रमाणे लिहायचे आहेत.

ट्रेन्ड ट्रेंड
ट्रान्स्लेटर ट्रान्सलेटर ट्रांसलेटर
ट्रॅन्सप्लॅंट ट्रान्स्प्लान्ट ट्रान्स्प्लांट ट्रान्सप्लांट ट्रांसप्लांट
लॅन्सेट लँसेट
कॉन्ट्रॅक्टर कॉन्ट्रक्टर कॉण्ट्रॅक्टर कॉण्ट्रक्टर कॉंट्रॅक्टर

इतर काही शब्दः

ट्रम्प ट्रंप
ट्रीटमेंट ट्रिटमेन्ट ट्रिटमेण्ट ट्रिटमेंट

_____

शास्त्राप्रमाणे "टेक्स्चर" तर रुढ शब्द आहे "टेक्श्चर". म्हणून हे दोन्ही शब्द स्पेल चेकच्या डेटाबेसमध्ये घेतले. असे शब्द अपवादात्मक असावेत.


०५ ऑगस्ट, २०२२

इंग्रजी शब्द मराठीत (भाग १)

 "टेक्नॉलॉजीचा" हा शब्द खाली दिलेल्या २० – २५ प्रकारे लिहिला जात आहे असे दिसते. त्यातील एकच पद्धत नक्की करून ती वापरणे सर्वांच्या फायद्याचे ठरेल.  

टॅक्नॉलॉजीचा
टेक्नलॉजीचा
टेक्ऩॉलॉजीचा
टेक्नालाजीचा
टेक्नालॉजिचा
टेक्नालॉजीचा
टेक्नॉंलॉजीचा
टेक्नॉलजीचा
टेक्नॉलाजीचा
टेक्नॉलीजीचा
टेक्नॉलॉगीचा
टेक्नॉलॉचीचा
टेक्नॉलॉजिचा
टेक्नॉलोजीचा
टेक्नोलॉजिचा
टेक्नोलोजीचा
टेक्‍नॉलॉजीचा
टेक्‍नोलॉजिचा
टेक्नोलाॅजीचा
टेक्‍नोलॉजीचा
टेक्नोलॉजीचा
टेक्नाॅलाॅजीचा
टेक्नॉलॉजीचा

यातील शेवटचे दोन शब्द दिसायला सारखे दिसले तरी युनिकोडच्या नियमानुसार ते वेगवेगळे आहेत. नोटपॅडमध्ये कॉपी-पेस्ट केल्यावर त्यातील वेगळेपण लगेच समजत आहे. स्पेलचेकमध्ये शेवटचा "टेक्नॉलॉजीचा" हा शब्द बरोबर दिसत असून इतर शब्द चुकीचे दाखवत आहे. ते बहुधा बरोबर असावे.  उच्चाराप्रमाणे लेखन, जोडाक्षरांचे वैकल्पिक लेखन, युनिकोडच्या नियमाप्रमाणे लेखन, परभाषेतील शब्दांना मराठीचे नियम लावून केलेले लेखन अशा सर्व कसोट्यांची परीक्षा घेणारा हा शब्द आहे!  ऑक्सफर्डमध्ये पाहिले तर हा शब्द खरा म्हणजे "टेक्नॉलजीचा" असा लिहावा लागेल. तसा तो कोणीच लिहीत नाही हे गूगलमध्येच शोधले तर स्पष्ट दिसत आहे. तेव्हा शास्त्रापेक्षा रूढी बलिष्ठ या न्यायाने "टेक्नॉलॉजी" हा शब्द डिक्शनरीत घेत आहे. कुणाचा आक्षेप असेल तर ते इथे लिहितीलच.  असाच दुसरा शब्द आहे टेक्स्चर texture.

०१ ऑगस्ट, २०२२

अफिक्स फाईलमधील बदल

सध्याच्या स्पेल-चेकमध्ये खाली दिलेले चारही शब्द शुद्ध समजले जातात व त्याखाली लाल रेघ येत नाही.

घरामध्ये
घरामधे
घरामधें
घरामध्यें

शुद्धलेखनाच्या नियम १.५ प्रमाणे अनुच्चारित अनुस्वार देता येत नाहीत. त्यामुळे शेवटचे दोन शब्द आपोआप अशुद्ध ठरतात. तर "मधे” हे "मध्ये” या शब्दाचे बोली रूप असून ते देखील नियमाप्रमाणे अशुद्ध ठरते. फक्त पहिला "घरामध्ये” हा एकच शब्द शुद्ध ठरतो. तसे असले तरी सर्वसमावेशक डिक्शनरी बनविण्याच्या धोरणाप्रमाणे चारही शब्द योग्य दाखविले आहेत. कोणाला जर १००% नियमाने चालणारी डिक्शनरी हवी असेल तर अफिक्स फाईलमधील खाली दिलेले दोन रूल काढून टाकून स्पेल चेकर बनवून घेता येईल.

BREAK ं$
ICONV मधे मध्ये

१४ जुलै, २०२२

हंस्पेलची कंजुसी

 मी जर "कंजूषी" असा शब्द टाईप केला तर मला "कंजुसी" अशी सुचवणी मिळत नाही. कारण मूळ शब्दात दोन ठिकाणी बदल करावे लागत आहेत. हा हंस्पेलमधील दोष असून तो सुरवातीपासून तसाच आहे!

इंग्रजीतही testimont या शब्दाला  "testament" किंवा desimination या शब्दाला  "dissemination" असा शब्द सुचविला जात नाही. यासाठी साउंडेक्स पद्धतीचा अवलंब करावा असे हंस्पेलच्या कर्त्यांनी म्हटले आहे पण ते नेमके कसे करायचे ते सांगितलेले नाही.

https://bugzilla.mozilla.org/show_bug.cgi?id=519214

गुगलने क्रोमसाठी हंस्पेलमध्ये बरेच बदल केले आहेत. त्यामुळे त्यांचे सगळे ठीक चालले आहे असे दिसते!

१० जून, २०२२

भाषा बदलतेय नव्हे तर बदलली आहे!

भाषासूत्र या सदरात वैशाली पेंडसे-कार्लेकर यांनी "भाषा बदलतेय" या लेखात नियम १३ चा विस्तार करून त्यानं, इकडं, इथं, आतलं, मधलं अशा शिरोबिंदूयुक्त शदांचा प्रमाण भाषेत स्वीकार करावा असे सुचविले आहे. तसेच, बदलते आहे- बदलतेय, गेली आहे- गेलीय- गेलेय, बोलतो आहे- बोलतोय अशा प्रकारची संधिसाधू क्रियापदेदेखील नियमानुसार आपलीशी करावी असे म्हटले आहे.

loksatta.com/navneet/marathi-language-learning-changes-in-marathi-language-types-of-marathi-sentences-zws-70-2965010/

स्पेलचेकच्या डेटाबेसमध्ये हे शब्द अगदी सुरवातीपासून म्हणजे सुमारे १५ वर्षांपासून जमा आहेत. या शब्दांचा आम्ही कधीच स्वीकार केला आहे!

२९ एप्रिल, २०२२

नेहमी चुकणारे शब्द

मुल्य > मूल्य

स्विकार > स्वीकार

मंदीर > मंदिर

आधारीत > आधारित 

क्रांतीकारी > क्रांतिकारी

समुह > समूह

स्वरुप > स्वरूप

नमुद > नमूद

असुन > असून

सेल्सिअस की सेल्सियस?

यष्टीरक्षक > यष्टिरक्षक



२६ एप्रिल, २०२२

नामाचे लिंग सर्वनामाला

खाली दिलेल्या वाक्यात "असलेली" बरोबर आहे का "असलेले" बरोबर आहे?

१) बेल्हे जुन्नर तालुक्यातील एक मोठी बाजार पेठ असलेली मोठ्ठ गाव आहे. 

२) बेल्हे जुन्नर तालुक्यातील एक मोठी बाजार पेठ असलेले मोठ्ठ गाव आहे. 

माझ्यामते क्रमांक २ बरोबर आहे. त्याचे कारण यस्मिन शेख यांच्या लेखात वाचता येईल.

https://www.loksatta.com/navneet/gender-in-marathi-nouns-marathi-language-learning-zws-70-2831275/

ही दोन वाक्ये वाचा :

(१) 'वृद्धांना कधी कधी वाटते, की वार्धक्य किंवा दीर्घायुष्य हे परमेश्वराची कृपा नसून अवकृपा आहे.'

(२) 'मवाल्यांनी त्या सुंदर मुलीला इतका त्रास दिला, की सौंदर्य हे वर नसून शाप आहे असे तिला वाटू लागले.'

या दोन्ही वाक्यांत एक चूक आहे, 'हे' हा शब्द. या दोन्ही वाक्यांत 'हे' हे सर्वनाम, नपुसकिलगी, एकवचनी आहे. वास्तविक पहिल्या वाक्यात हे सर्वनाम 'वार्धक्य' किंवा 'दीर्घायुष्य' या नपुसकिलगी नामाचे नसून 'कृपा','अवकृपा' या स्त्रीलिंगी एकवचनी नामांचे आहे. तसेच, दुसऱ्या वाक्यात 'हे' हे नपुसकिलगी सर्वनाम 'सौंदर्य' या नपुसकिलगी, एकवचनी नामाचे नसून ते 'शाप' 'वर' या (पुल्लिंगी) नामांचे आहे. हे शब्द – नामे, पुल्लिंगी, एकवचनी आहेत, त्यामुळे ही वाक्ये अशीच योग्य आहेत. 

(१) 'वृद्धांना कधी कधी वाटते, की वार्धक्य किंवा दीर्घायुष्य ही परमेश्वराची कृपा नसून अवकृपा आहे.' 

(२) मवाल्यांनी त्या सुंदर मुलीला इतका त्रास दिला, की सौंदर्य हा वर नसून शाप आहे असे तिला वाटू लागले.

या संदर्भात लोकमान्य टिळकांचे एक अत्यंत प्रसिद्ध वचन येथे उद्धृत करावेसे वाटते. – 'स्वराज्य हा माझा जन्मसिद्ध हक्क आहे आणि तो मी मिळवणारच.' 'हा', 'तो' ही पुल्लिंगी सर्वनामे 'स्वराज्य' या नपुसकिलगी नामाची नसून, 'हक्क' या पुल्लिंगी नामासाठी आहेत.

अलीकडेच 'लोकसत्ता'त छापलेले हे वाक्य पाहा – 'मुंबई पोलीस प्रशासनाने काढलेला आदेश हे महाराष्ट्र साहित्य परिषदेच्या पाठपुराव्याचे यश आहे' असे परिषदेचे अध्यक्ष प्रा. मिलिंद जोशी यांनी सांगितले. 'हे' हे सर्वनाम (नपुसकिलगी एकवचनी) 'आदेश' या पुिल्लगी नामाचे नसून 'यश' या नपुसकिलगी नामाचे आहे, हे वाचकांच्या लक्षात आलेच असेल.

०९ एप्रिल, २०२२

कारकिर्द की कारकीर्द?

अरूण फडके यांच्या मार्गदर्शनाखाली बनलेल्या "शुद्धलेखन ठेवा खिशात" या ॲपमध्ये हे स्पष्टीकरण मिळाले.

बरोबरः उर्फ, कारकिर्द, शागिर्द, सुपुर्द

चूकः ऊर्फ, कारकीर्द,शागीर्द, सुपूर्द

उर्फ, कारकिर्द, शागिर्द, सुपुत्र हे मराठीतले तद्भव शब्द आहेत. त्यामुळे ह्यांमधले इकार-उकार मराठीच्या ऱ्हस्व-दीर्घ नियमांनुसार लिहिले जातील. परंतु ह्या चारही शब्दांमध्ये रफारयुक्त अ-कारान्त जोडाक्षर आहे. त्यामुळे ह्या शब्दांना दोन नियम लागू होतात.

१) अ-कारान्तापूर्वीचा इकार उकार दीर्घ असतो.

२) जोडाक्षरापूर्वीचा इकार-उकार ऱ्हस्व असतो.

हे दोन नियम परस्परविरुद्ध इकार-उकार दाखवतात. त्यामुळे आता अ-कारान्त जोडाक्षर असलेले इतर मराठी शब्द ह्या दोन नियमांपैकी कोणत्या नियमाने चालतात हे पहावे लागेल. ते शब्द असे - कुट्ट, खिन्न, खुट्ट, गुच्छ, ठुस्स, डिम्म ढिम्म, डु ढुस्स, फुस्स, भिल्ल, भिस्त, मिट्ट, शिस्त, सुस्त, हुश्श हे सारे शब्द जोडाक्षरापूर्वीचा एकार इकार - उकार ऱ्हस्व असतो ह्या नियमाने चालताना दिसतात. त्यामुळे ह्याच नियमानुसार उर्फ, कारकिर्द, शागिर्द, सुपुर्द असेच लेखन बरोबर ठरते.


२० मार्च, २०२२

शुद्धलेखनाच्या नियमांचे सार

१९७२ सालापासून शुद्धलेखनाचे १८ शासनमान्य नियम अस्तित्वात आहेत.  रामाने जसे शिवधनुष्याचे तुकडे केले तसे मराठी माणसाने त्यातील ८.१ या नियमाचे तुकडे करून फेकून दिले आहेत. तर तो नियम आहे असा...

उपान्त्यी दीर्घ ई किंवा ऊ असलेल्या मराठी शब्दांचा उपान्त्य ई-कार किंवा ऊ-कार उभयवचनी सामान्यरूपांच्या वेळी ऱ्हस्व लिहावा.
उदाहरणार्थ : गरीब-गरिबाला,गरिबांना,चूल-चुलीला,चुलींना. 

अपवाद-दीर्घोपान्त्य तत्सम शब्द.
उदाहरणार्थ:परीक्षा-परीक्षेला, परीक्षांना, दूत-दूताला, दूतांना.

थोडक्यात सांगायचे झाले तर शब्दातील शेवटून दुसरे अक्षरे कधी पहिले तर कधी दुसरे काढायचे ते ब्रह्मदेव देखील खात्रीने सांगू शकणार नाहीत. ट्राफिकचे काही रूल हे फक्त "मामा” लोकांच्या वरकमाईसाठी निर्माण केले गेले आहेत असे त्या विषयातील जाणकार सांगतात. तसे हा नियम डुढ्ढाचार्य / अंकल लोकांच्या सोयीसाठी आहे असे या विषयातील जाणकार सांगतात. खोटं वाटत असेल तर कै. अरूण फडके यांनी या नियमात काय बदल सुचविला होता ते येथे वाचता येईल.

https://arunphadake.com/2011/01/01/shuddhalekhanachesulabhikaran/

10) उपान्त्य अक्षराचा दीर्घ इकार किंवा दीर्घ उकार सामान्यरूपात ऱ्हस्व लिहावा.

(महामंडळाच्या नियम क्रमांक 8.1ला हा पर्यायी नियम आहे. उपान्त्य अक्षराचा दीर्घ इकार किंवा दीर्घ उकार सामान्यरूपात ऱ्हस्व करणे, ही मराठीची प्रकृती आहे. त्यामुळे ‘वीर, पूजा, गीत’ ह्यांसारख्या संस्कृत शब्दांची सामान्यरूपेही ‘विराला, पुजेत, गितासाठी’ अशी लिहिली जातील. ‘कुटुंबीयांना’ हा शब्द अनेक वेळा ‘कुटुंबियांना’ असा लिहिला जातो आणि प्रचलित नियमांनुसार तो चुकीचा ठरतो, हे आपण पाहतोच. त्याशिवाय तो शब्द संस्कृतमधून मराठीत आला आहे हे ओळखायचे कसे हा प्रश्न इथेही आहेच.)

आमच्या शाळेतील एक शिक्षक वेळेवर न येणाऱ्या, अभ्यास न करणाऱ्या मुलांचे पुढे काय होणार याचे लेक्चर आम्हा वेळेवर येणाऱ्या मुलांना देत असत. त्याप्रमाणे कुटुंबीयांना हा शब्द अनेक वेळा कुटुंबियांना असा चुकीचा लिहिला जातो, याची शिक्षा म्हणून वीराला, पूजेत, गीतासाठी असे शब्द विराला, पुजेत, गितासाठी असे लिहावेत अशी त्यांनी केलेली सूचना कोणीही स्वीकारलेली नाही. ही सूचना बरोबर असून मी तसेच लेखन करतो असे म्हणणारा एकतरी व्याकरणतज्ज्ञ कोणाला माहीत आहे का? ही सूचना अस्वीकारार्ह आहे कारण कोणी त्यापुढे जाऊन म्हणेल की सामान्यरूपात तरी ऱ्हस्व का करा? दीर्घच ठेवला तर हा नियम अधिक सोपा नाही का होणार? (उदा. गरीब - गरीबाला, गरीबांना, चूल - चूलाला, चूलांना) आणि अगदीच पुढे जाऊन ऱ्हस्व इकार/ उकार काढूनच टाका - फक्त दीर्घ इकार/ उकार पुरेसे आहेत असे म्हणणारे देखील आहेत की! ते मान्य केले तर "चुलीत घाला तुमचे नियम" हे वाक्य "चूलीत घाला तूमचे नीयम” असे लिहावे लागेल. ही दोन्ही वाक्ये मोठ्याने वाचून पाहिल्यावर ऊंझा जोडणी मराठीच नाही तर खुद्द गुजराती भाषेने देखील का स्वीकारली नाही ते कळेल. गुजरातीचे मला माहीत नाही पण मराठीचे ऱ्हस्व / दीर्घ उच्चार अगदी स्पष्ट होतात आणि ते तसेच लिहावे लागतात हे सर्व नियमांचे सार आहे.  


२८ जानेवारी, २०२२

युबंटूसाठी गमभन

खाली दिलेली कमांड युबंटूच्या कमांड प्रॉम्टवर कॉपी-पेस्ट करा. त्यानंतर आवश्यकता भासल्यास  reboot  कमांडने कंप्युटर पुन्हा सुरू करा. 

sudo add-apt-repository ppa:gamabhana-team/gamabhana

sudo apt-get update

sudo apt install gamabhana

आनुषंगिकच्या निमित्ताने

आनुषंगिक हा शब्द १६ प्रकारांनी लिहिता येतो. म्हणजे खाली दिलेले बाकीचे १५ प्रकार चुकीचे आहेत.

अनुशंगिक
अनुशंगीक
अनुषंगिक
अनुषंगीक
अनूशंगिक
अनूशंगीक
अनूषंगिक
अनूषंगीक
आनुशंगिक
आनुशंगीक
आनुषंगीक
आनूशंगिक
आनूशंगीक
आनूषंगिक
आनूषंगीक

हे शब्द तयार करण्यासाठी पायथॉनची ही स्क्रिप्ट वापरली.

mylist = [["अ", "आ"], ["नु", "नू"], ["शं", "षं"], ["गि", "गी"], ["क"]]
import itertools
for i in itertools.product(*mylist):
    print("".join(i))

तसेच ऐतिहासिक हा शब्द देखील अनेक प्रकारे लिहिता येतो.

_____

Use this code to generate more words with replacements.

replacements = {'ि':'ी', 'ी':'ि', 'ु':'ू', 'ू':'ु'}

with open('dicts/mr_IN_eng.dic') as f:
    for x in f:
        subs = [{_x,replacements.get(_x,_x)} for _x in x]
        for s in itertools.product(*subs):
            print ("".join(s))

१० जानेवारी, २०२२

जोडाक्षरांची आडवी / उभी मांडणी

मराठी विकिपीडियाने काही जोडाक्षरांच्या बाबतीत आडवी मांडणी स्वीकारलेली दिसत आहे. उदा...

आडवी मांडणी । उभी मांडणी

रत्‍नागिरी । रत्नागिरी

मुक्‍त । मुक्त

आश्‍वासन । आश्वासन

लोकसत्तासारखी वृत्तपत्रेदेखील हे शब्द आडव्या मांडणीत दाखवतात. याचा अर्थ वाचकांची सोय ही जास्त महत्त्वाची असून संगणक लॉजिक किंवा नियम सरसकट राबवता येत नाहीत. पण तसे असेल तर अश्‍वारोहण हा शब्द उभ्या मांडणीत अश्वारोहण असा का लिहिला जातो? म्हणजे मराठी शब्द आडव्या मांडणीत तर संस्कृत शब्द उभ्या मांडणीत दाखवावेत असा काही संकेत आहे का? कारण माझ्यामते अश्वत्थामा बरोबर असून सहसा अश्‍वत्थामा असे लिहिले जात नाही. आडव्या मांडणीसाठी नॉन जॉइनर वापरावा लागतो. त्याची चर्चा मी याच धाग्यात (१ एप्रिल २०२१) केली आहे. एकच शब्द दोन पद्धतीने लिहिता येत असेल तर त्यातील एकच पद्धत स्पेलचेकमध्ये स्वीकारायची असे धोरण आहे. पण या बाबतीत अपवाद करून हे सहाही शब्द डेटाबेसमध्ये जमा करत आहे. अजून काही शब्द सुचविले गेले तर ते देखील स्वीकारता येतील.