१३ सप्टेंबर, २०२२

अफिक्स फाईलमधील बदल

 "घराना घरानो घरानी"  या तीन शब्दांना अनुक्रमे "घरांना घरांनो घरांनी" अशी सुचवणी येणे अपेक्षित आहे. पण  अगदी वेगळेच शब्द राईट क्लिकवर दिसतात.  त्यासाठी  रिप्लेसमेंट टॅगमध्ये ही नोंद केली.

REP ाना ांना
REP ानो ांनो
REP ानी ांनी

खाली दिलेले रफार चुकीचे असून ते विसर्गाने दाखवायला हवे. म्हणून ते देखील अफिक्स फाईलच्या रिप्लेसमेंट टॅगमध्ये टाकले.

REP र्क ःक
REP र्ख ःख
REP र्च ःच
REP र्छ ःछ
REP र्ट ःट
REP र्ठ ःठ
REP र्त ःत
REP र्थ ःथ
REP र्प ःप
REP र्फ ःफ
REP र्श ःश
REP र्ष ःष
REP र्स ःस

SQL Query:

select regexp_extract(word, 'ः.')   as mychar , count(*) as cnt 
from oscar2_sorted 
where word like '%ः%' 
group by regexp_extract(word, 'ः.')  

०३ सप्टेंबर, २०२२

इंग्रजी शब्द मराठीत (भाग ५)

युनिकोडच्या दृष्टीने योग्य शब्द कसा काढायचा ते खाली दिले आहे.

कॅप
['क', 'ॅ', 'प']

कँप
बरोबर - ['क', 'ँ', 'प']
चूक - ['क', 'ॅ', 'ं', 'प']\

कॉस्ट
['क', 'ॉ', 'स', '्', 'ट']\

काँग्रेस
बरोबर - ['क', 'ा', 'ँ', 'ग', '्', 'र', 'े', 'स']
चूक - ['क', 'ॉ', 'ं', 'ग', '्', 'र', 'े', 'स']

व्याकरणाच्या दृष्टीने पाहिले तर अनुस्वार वेगळा देणेच बरोबर ठरते. म्हणजे आपण 'भोंगा' शब्दात ओवर अनुस्वार देतो तर 'भिंत' शब्दात इवर अनुस्वार देतो तसा ॅ आणि ॉ वर अनुस्वार द्यायला हवा. पण या बाबतीत युनिकोडने व्याकरणाशी फारकत घेतली आहे. चंद्रकोर आणि अनुस्वार मिळून एकच एक असे चंद्रबिंदू नावाचे ँ चिन्ह देऊन युनिकोडने एक बाईट वाचवला आहे असे दिसते.

कँप शब्द कॅंप असा लिहिला तर एक बाईट जास्त खर्च होईलच पण त्याबरोबरच बहुतेक सर्व फाँटमध्ये अनुस्वार चुकीच्या जागी दिसेल. ते अक्षर तुटल्यासारखेच प्रिंटदेखील होईल आणि वाचायला त्रास होईल. म्हणून काँग्रेस शब्द कॉंग्रेस असा लिहू नये.