०९ डिसेंबर, २०१९

नियमानुसार काम!

"मी चहा प्यायला" हे प्रमाणभाषेतले वाक्य उदाहरण म्हणून घेऊ. जर "प्यायला" हा शब्द "पाय्ला" असा लिहिला तर तो शब्द अशुद्ध ठरतो. त्याखाली लाल रेघ येते आणि योग्य शब्द म्हणजे "प्यायला" राईट क्लिकवर दिसतो. इथपर्यंत तुमचं आमचं जमलं. आता पुढचं पटलं तर घ्या नाहीतर सोडून द्या!
"मी चहा प्यायला" हे प्रमाणभाषेतले वाक्य, तर "मी चाय पिली" हे बोली भाषेतले वाक्य. दोन्ही शुद्धलेखनाच्या दृष्टीने शुद्धच आहेत. स्पेलचेकमध्ये "पिली" या शब्दाखाली लाल रेघ येत नाही. असे का? "बसणे" या क्रियापदावरून ज्या  नियमाने "बसली" हे रूप बनते त्याच नियमाने "पिणे" वरून "पिली" बनते. स्पेलचेकर शब्दाचे लिंग तपासत नाही. त्यामुळे "चाय पिली" किंवा "चाय पिला" दोन्ही शुद्धच! प्रमाणभाषेत हे बसत नाही ही गोष्ट मान्य. पण त्याला काय करणार? "शिश्ठ"  लोकांना मान्य नसेल तर हा स्पेलचेकर "शिष्टमान्य" नाही असे फार तर म्हणता येईल. अर्थात मी बोली भाषेत लिहितो असे म्हणत कोणी "मी चाय पीली" असे लिहिले तर पीली शब्दाखाली लाल रेघ येईल. दीर्घ "पी" बदलून ह्रस्व करावा लागेल. हंस्पेल नियमांच्या बाबतीत नो काँप्रोमाईज!

०३ नोव्हेंबर, २०१९

कशाकशाचे सुलभीकरण?

"बालभारतीपुरस्कृत अभिनव मराठी संख्यावाचन पद्धतीबद्दल काही शंका"  हा सलील कुळकर्णींचा अमृतमंथन ब्लॉगवरील लेख नुकताच वाचनात आला.

या धोरणामुळे मराठीचे सुलभीकरण होत असेल तर त्याला माझा विरोध असण्याचे कारण नाही. पण हे सुलभीकरण फक्त संख्या वाचनापुरतेच मर्यादित असणार आहे की पुढे पुढे सर्वच क्षेत्रात त्याचा संचार होणार आहे हे देखील स्पष्ट होऊ द्या.  इंग्रजीत नाते संबंध देखील फार सुलभ पद्धतीने सांगितले जातात. "आँटी" म्हणजे काकू, मावशी किंवा आत्या कोणीही असू शकते.  चायनीज भाषेत मात्र वडिलांच्या मोठ्या भावाला एक शब्द तर वडिलांच्या लहान भावाला दुसरा शब्द आहे. आपल्यासारखे फक्त काका किंवा अंकल म्हणून ते पुरे पडत नाही. त्यांना ही नाते सुलभीकरणाची प्रक्रिया समजावून सांगायला कोणी तयार होईल का? माझी आई फोन वर देखील "नंडेची सासू" वगैरे शब्द वापरते. संभाषण पुढे जाते म्हणजे पलिकडची जी कोण असेल तिला ते नाते समजले असा होतो. माझ्याबरोबर बोलताना मात्र तिला फार जपून (सुलभीकृत) भाषेत बोलावे  लागते. कारण "नणंद" म्हणजे नक्की कोण असा माझा प्रश्न  असणार हे तिला माहीत असते. सुलभीकृत भाषेत बोलावे असा अत्याग्रह धरला तर संवादच थांबतो असा माझा तरी अनुभव आहे. तेव्हा बालभारतीने ती शक्यता देखील विचारात घ्यावी. गुजरात राज्याच्या विकासाचे मॉडेल सगळीकडे चालेल असे समजणे शहाणपणाचे नाही तसेच एका भाषेतील सुलभता दुसरीकडे कॉपी-पेस्ट करून समस्या सुटत नाही, उलट जटील बनते कारण प्रत्येक भाषेला स्वतःचा असा इतिहास, संस्कृती आणि गरजा असतात व त्या पूर्ण करणारे शब्द हवे असतात. 

१५ सप्टेंबर, २०१९

Using wiki for collecting Marathi words

The words will be added by the community on this page.

http://mr.shoutwiki.com/

I will add tags and final list will be available on github here...

https://github.com/shantanuo/marathi_wordlist/blob/master/mr_IN.dic

Once all the words are added, the final version of firefox and libre office spell check software will be made available.

१४ जुलै, २०१९

Firefox add-on mentioned in Loksatta

Here is the link of "कुटुंबकट्टा" section as on July 11, 2019:

https://www.loksatta.com/kutumbkatta-news/language-learning-apps-on-mobile-mobile-app-to-learn-a-language-zws-70-1928462/

‘फायरफॉक्स’मध्ये शुद्धलेखन चिकित्सा

केवळ अ‍ॅपच नव्हे तर इंटरनेट ब्राऊजरमध्येही तुम्ही शुद्ध शब्द जाणून घेऊ शकता. ‘फायरफॉक्स’या ब्राऊजरमध्ये मराठी डिक्शनरीचे ‘अ‍ॅड ऑन’ जोडून घेऊन तुम्ही मराठीतून टाइप केलेल्या मजकुरात काही शुद्धलेखनाच्या चुका आहेत का, हे तपासून पाहू शकता. हे अ‍ॅड ऑन मिळवण्यासाठी http://addon.firefox.com/12797 या लिंकवर जावे लागेल. ‘अ‍ॅड ऑन’ करताच तुम्ही टाइप केलेल्या मजकुरातील अशुद्ध मराठी शब्द लाल रंगात दिसू लागतील. या शब्दांवर राइट क्लिक करून तुम्हाला योग्य शब्दाची निवड करता येईल. एखादा शब्द योग्य असूनही तो लाल रंगात अधोरेखित होत असेल तर तो शब्द तुम्ही आपल्या व्यक्तिगत संग्रहात ‘अ‍ॅड टू डिक्शनरी’ हा पर्याय वापरून जमा करू शकता.

लोकसत्ताच्या कुटुंबकट्टा पुरवणीतील ही छोटी बातमी दिनांक ११ जुलै २०१९



०७ जुलै, २०१९

स्वरानंतरचा हलन्त

स्वरानंतर पाय मोडके व्यंजन लागू शकत नाही. असे शब्द नक्कीच चुकीचे आहेत.

x = 'पा पि पी पु पू पं पः'
mylist= list()
for i in x.split():
    mylist.append(i[1] + '्')
 
'\|'.join(mylist)

!grep 'ा्\|ि्\|ी्\|ु्\|ू्\|ं्\|ः्' mytext5.txt | wc -l

_____

सुगम मराठी शुद्धलेखन पुस्तिका

https://docs.wixstatic.com/ugd/2ed2e7_2a31a401412d4811ae2987b4e2219d3c.pdf

Rules mentioned on page 22 and 23 can be converted to hunspell.

विसर्गापूर्वीचे इकार, उकार नेहमी ऱ्हस्व असतात. तेव्हा खाली दिलेले शब्द चुकीचे आहेत.
x = 'दू:ख'
y = 'नी:व'

दीर्घ ईकार, ऊकारानंतर  विसर्ग आला आहे का ते पहावे लागेल.
print (x[-3:][:2])
ू:
print (y[-3:][:2])
ी:

२७ जून, २०१९

दिसतं तसं नसतं!

आंबा शब्द लिहिताना अ + काना + अनुस्वार असे न लिहिता आ + अनुस्वार असे लिहावे. उदा. खाली दिलेले दोन शब्द कॉपी पेस्ट करून गूगलमध्ये शोध घेतल्यास वेगवेगळे रिजल्ट मिळातात. पहिला शब्द चूक असल्याने कमी तर दुसरा बरोबर असल्याने त्याला जास्त.

अांबा
आंबा

टेक्निकली पाहिले तर पहिल्या शब्दाची लांबी ५ भरते तर दुसऱ्याची ४. तेंव्हा कमी बाईटमध्ये बसणारा दुसरा आंबाच बरोबर!

चुकीचाः ['अ', 'ा', 'ं', 'ब', 'ा']
बरोबरः ['आ', 'ं', 'ब', 'ा']

वर दिलेले दोन शब्द गुगलच्या फॉन्ट पेजमध्ये पेस्ट करून  "Apply to all fonts” देऊन पहा.

https://fonts.google.com/?subset=devanagari

असेच चुकीचे लिहीलेले इतर काही शब्दः

अांघोळ
अांतरराष्ट्रीय
अांतर्वक्र
अांध्र
अांव
_____

ही समस्या इतर शब्दांमध्ये येत नाही. कारण "कांता" हा शब्द लिहिताना क + आ + अं असाच लिहावा लागतो. त्याला दुसरा पर्याय नाही. “अ” आणि "आ” यांना मात्र युनिकोडमध्ये स्वतंत्र स्थान दिले गेले आहे. म्हणजे आ किंवा ई ही "अ” ची बाराखडी नसून ते स्वतंत्र स्वर आहेत. म्हणून अ + आ + अं आणि आ + अं हे दोन्ही सारखे दिसले तरी पूर्णतः वेगळे शब्द आहेत (युनिकोडच्या दृष्टीने)
_____

'अ + काना' शोधून त्याला 'आ' ने बदलण्यासाठी लिनक्समध्ये sed कमांड अशी वापरता येते.

sed -i 's/अा/आ/g' mytext5.txt
_____

जी गोष्ट आंबा या शब्दाची तीच ॲपल या शब्दाची.

अ + ॅ + प + ल असे न  लिहिता एकसंध ॲ + प + ल असे लिहावे.  खाली दिलेले दोन शब्द गुगलमध्ये टाकले तर वेगवेगळे रिझल्ट्स मिळतात.

ॲपल

अॅपल

विकिपीडियावर देखील चुकीच्या पद्धतीने लिहलेला ॲपल होता, तो निनावी या बॉटद्वारे गेल्या वर्षी सुधारला गेला. संपूर्ण नेट सुधारणारा बॉट अजून जन्माला यायचा आहे. तेव्हा आपणच लिहिताना काळजी घ्यायला हवी.

https://tinyurl.com/y6tv8564

प्रमुख आय.एम.ई मध्ये अशा प्रकारे लिहावा.  A_pal

युनिकोडच्या चार्टमध्ये खास मराठीसाठी असा याचा उल्लेख आहे. तेव्हा मराठी माणसांनी संघर्ष करून मिळवलेले हे अक्षर सोडता कामा नये.

https://unicode.org/charts/PDF/U0900.pdf

वर दिलेल्या पी.डी.एफ. मध्ये हा उल्लेख आहे...

Independent vowel for Marathi
0972 ॲ DEVANAGARI LETTER CANDRA A
_____

मराठी विकिपीडियाच्या मालकांच्या संगणकावर सगळं काही ठीक दिसत असल्याने बाकीच्या हजारो लोकांना काय दिसत आहे?, युनिकोडच्या नियमात काय बसते?  अशा फालतू गोष्टींची चर्चा निरुद्योगी लोकांना करू द्यावी. कोणाला खाली दाखवल्याप्रमाणे विक़ीचे पान दिसत असेल तर त्यातील चुकांकडे दुर्लक्ष करावे किंवा मग मालक सांगतील तो फॉन्ट डाऊनलोड करावा!


_____

आजोबा शब्दातील "जो” हे अक्षर ज + आ + ओ असे लिहीता येते किंवा मग डायरेक्ट ज + ओ असे लिहीता येते.

x = 'आजाेबा'
for i in x:
    print (i)








y = 'आजोबा'
for i in y:
    print (i)







len(x), len(y)
(6, 5)

पहिल्या प्रकारातील "जो” साठी 6 बाईट्स तर दुसऱ्यात फक्त 5 बाईट्स खर्च होतात. गुगलमधे दुसऱ्या प्रकारच्या आजोबाला खूप रिजल्ट मिळतात तर पहिल्या आजोबाला फारच कमी.

https://www.google.com/search?q=%E0%A4%86%E0%A4%9C%E0%A4%BE%E0%A5%87%E0%A4%AC%E0%A4%BE

(सुमारे १००० पाने)

https://www.google.com/search?q=%E0%A4%86%E0%A4%9C%E0%A5%8B%E0%A4%AC%E0%A4%BE

(सुमारे ५,००,००० पाने)

हे दोन्ही आजोबा दिसायला अगदी सारखे दिसतात. पण काही ठिकाणी त्यांचे पितळ उघडे पडते. नीर-क्षिर विवेक केला की हंस तो हंस आणि बगळा तो बगळा.
_____

जी गोष्ट आजोबांची तीच त्यांच्या ओसरीची! या शब्दातही थेट "ओ” न वापरता "आ + ओ” वापरला तर माझ्यासारख्या छिद्रान्वेषी लोकांच्या भावना दुखावल्या जातात!

z = 'आेसरी'
for i in z:
    print (i)







z1 = 'ओसरी'
for i in z1:
    print (i)






len(z), len(z1)
(5, 4)
_____

ज ला ा असा काना काढून मग े किंवा ो जोडणे युनिकोडच्या दृष्टीने चूक हे आपण वर पाहिले. तसेच आती या शब्दात त ला 'आ'कार काढून मग ी जोडणे चूक. कारण असे केल्याने जे अक्षर बनते ते कोणत्याच भाषेत वापरले जात नाही.

x = 'आताी'

वरच्या शब्दात ा ला ी जोडली आहे. हा शब्द ना तर "आता” असेल ना तर "आती”.

for i in x:
    print (i)






अशी अतरंगी अक्षरे काढताच येऊ नयेत अशी व्यवस्था बहुतेक एडिटरमध्ये असतेच. पण तरीदेखील काही हुशार मंडळी हे जमवतात आणि सर्वांचा ताप वाढवतात. जा हे अक्षर पहा कसे काढले आहेः

x = 'ज्ाा '
for i in x:
    print (i)





_____

ओ पर्यंत जाण्यासाठी आता डायरेक्ट गाडी आहे. अ + आ + ओ असा द्रविडी प्राणायाम करावा लागत नाही. तसेच औ चे देखील आहे. तीन अक्षरी शब्द 'औषध' हा नेमक्या तीन बाईट्समध्येच बसतो.

x = 'औषध'
for i in x:
    print (i)





खाली दाखविल्याप्रमाणे जर ४ बाईट वापरले, तर तो तुटक दिसेल आणि गूगलमध्ये धडपणे इंडेक्सही होणार नाही.

x = 'आैषध'
for i in x:
    print (i)





_____

on / off  हा शब्द मराठीत लिहीताना अ + आ + 'ॅ' किंवा आ + 'ॅ' असे न लिहिता थेट ऑ लिहावा.

x='आॅन'
[i for i in x]
['आ', 'ॅ', 'न']

वर दिलेल्या उदाहरणात ३ बाईट खर्च झाले तर खाली दिलेल्या उदाहरणात फक्त २ बाईट लागले. मारवाड्यासारखा एक एक बाईट वाचवूया. थेंबा थेंबाने तळं साचतं म्हणतात ना? बाईट वाचवण्याचे बरेच फायदे आहेत. पेज डाऊनलोडचा स्पीड वाढेल. पान सेव्ह करताना कमी मेमरी लागेल वगैरे.

y = 'ऑन'
[i for i in y]
['ऑ', 'न']

पाॅलिश या शब्दाची फोड अशी दिसेल.

x = "पाॅलिश"
for i in x:
    print(i)
ि

प + आ + ऑ हा क्रम चुकीचा असून प + ऑ हा क्रम बरोबर आहे. खाली दिलेला पायथॉन कोड वापरून असे इतर शब्द शोधता येतील.

mylist = list()
for i in open("stackdata1.txt"):
    mylist.append(i.split("/"))
    
for i in mylist:
    if "पाॅलिश"[1:3] in i[0]:
        print(i)

आता पाॅलिश शब्द शोधून त्याला पॉलिश बनवावे लागेल. मग त्याची फोड अशी दिसेल.

ि

चुकीचा पॉलिश शब्द ६ तर योग्य शब्द फक्त ५ बाईट्स खातो. एका बाईटची कमाई!
_____

'फाँ' हे अक्षर ३ प्रकारे लिहीता येते.

x = "फ" + "ा" + "ँ"
y = "फ" + "ॉ" + "ं"
z = "फ" + "ा" + "ॅ" + "ं"

यातील पहिली (x) पद्धत बरोबर असून इतर दोन पद्धती वापरू नयेत.  उदाहरणार्थ:

x = "काँग्रेस"
[i for i in x]
['क', 'ा', 'ँ', 'ग', '्', 'र', 'े', 'स'] > correct

y = "कॉंग्रेस"
[i for i in y]
['क', 'ॉ', 'ं', 'ग', '्', 'र', 'े', 'स'] > wrong

_____

बरोबर : ट्विट ['ट', '्', 'व', 'ि', 'ट']
चूक : टि्वट ['ट', 'ि', '्', 'व', 'ट']

_____

काही काही एडिटरमध्ये पूर्णविरामाच्या जागी पायमोडके अक्षर निर्माण होते. म्हणजे जे. काढले की असे काहीतरी दिसते... ज्ो

हीच समस्या युबंटू लाईव्ह सिडीच्या आयट्रान्स प्रणालीत मला दिसून आली होती.

https://www.maayboli.com/node/51711

त्यात मी लिहीले होतेः
या समस्यांवर काही उपाय मिळतो का ते पहायला हव्e. (पहा 'हवे' शब्द टाईप करून पूर्णविराम द्यावा तर ए. चे e. होत आहे. )
_____

माझ्या भावनांचं जाऊ द्या. गूगलमध्ये आपले लेखन नीट इंडेक्स न होणं परवडणारं आहे का? हजारो लोकांच्या संगणकावर आपला लेख तुटक दिसणं तुम्हाला चालणार आहे का? 

_____

Adding these entries to autocorrect list of Libreoffice:

.*अा.* आ
.*आे.* ओ
.*आै.* औ
.*आॅ.* ऑ
.*अ‍ॅ.* ॲ
.*ऎ.* ऐ
.*ाे.* ो
.*ाॅ.* ॉ
.*ॉं.* ाँ
.*ॅं.* ँ
.*र्‍य.* ऱ्य
.*र्‍ह.* ऱ्ह
.*ध्द.* द्ध
अभी.* अभि
प्रती.* प्रति
अनू.* अनु
अधी.* अधि
अती.* अति
.*ु ू

२४ जून, २०१९

ऱ्य आणि ऱ्ह चा घोळ

ऱ्य काढण्याच्या दोन पद्धती आहेत.
r--y
r*y

तसेच ऱ्ह काढण्याच्या दोन.
r--h
r*h

यातील दुसरी पद्धत बरोबर असून पहिली पद्धत वापरू नये. पहिल्या पद्धतीत zero width joiner वापरला आहे. तर दुसऱ्यात नुक्ताधारी ऱ आहे. खाली दिलेले दोन्ही शब्द सारखे दिसत असले तरी गूगलमध्ये कॉपी पेस्ट केले तर वेगवेगळे रिझल्ट मिळतील.

दुसर्‍यात
दुसऱ्यात

२३ जून, २०१९

अव्ययांची लोकप्रियता

करून, वाचून, नजिक, अंती, आतून, आधी असे अव्यकाढून टाकले कारण ते हल्ली वापरले जात नाहीत. त्याऐवजी अधिक वापरले जाणारे अव्यय जसे देखील, वरील, करता घेतले. त्यासाठी विकीचा शब्द संग्रह वापरला.


https://kagapa.s3.ap-south-1.amazonaws.com/spellcheck/av2.pdf

Sample list of words with tags and the singular / plural words generated.

अतिथी/Aacdh (174 + 94)
आंधळा/e   188
अतिरेकी/e  188
अंडे/e     188
अनुभव/f   188
अडचण/g   188
अटक/i     94
अबला/j    188
अंधार/k     94
अंदाधुंद/l    94
अनास्था/n    94


२० जून, २०१९

अनियमित शब्दांचे नियमित रूप

वाणी शब्दाला e टॅग वापरून "वाण्याचे" बनवता येईल. पण अधिकारी, अनुयायी अशा शब्दांना तो टॅग वापरता येणार नाही. म्हणून अनियमित चालणाऱ्या शब्दांचे नियमित रूप करून घेऊन मग त्याला टॅग लावला.

अनुयाय/Ff

यातील पहिला F हे स्पष्ट करतो की हे अनियमित रूप असून मराठीत "अनुयाय" असा शब्द नाही. पण नंतरच्या f टॅगने बनविलेले शब्द स्वीकारण्यास काही हरकत नाही. म्हणून "अनुयायांचे"  हा शब्द बरोबर. जर असे केले नाही तर सर्व म्हणजे सुमारे १५० शब्द डिक्शनरीत केवळ एका शब्दासाठी जमा करावे लागतील. ते शक्य नाही.

SFX e Y 8
SFX e ा  ्या/Aacd ा
SFX e ा  ्यां/AFbcd ा
SFX e ी  ्या/Aacd ी
SFX e ी  ्यां/AFbcd ी
SFX e ि  ्या/Aacd ि
SFX e ि  ्यां/AFbcd ि
SFX e े  ्या/Aacd े
SFX e े  ्यां/AFbcd े

SFX f Y 2
SFX f 0  ा/AFacd .
SFX f 0  ां/AFbcd .

_____

अडवणूक
अडवणुक/Fg
अडवणुका/h

SFX g Y 2
SFX g 0  ी/AFacd .
SFX g 0  ीं/AFbcd .

SFX h Y 1
SFX h 0  ं/AFbcd .

NEEDAFFIX F

१९ जून, २०१९

शब्दांचे सामान्यरूप

शब्दांचे सामान्यरूप करताना हे हंस्पेल नियम वापरता येतील.

SFX e Y 8
SFX e ा  ्या/AFacd ा
SFX e ा  ्यां/AFbcd ा
SFX e ी  ्या/AFacd ी
SFX e ी  ्यां/AFbcd ी
SFX e ि  ्या/AFacd ि
SFX e ि  ्यां/AFbcd ि
SFX e े  ्या/AFacd े
SFX e े  ्यां/AFbcd े

आंधळा
अडाणी
अंडे

SFX j Y 2
SFX j ा  े/AFacd ा
SFX j ा  ां/AFbcd ा

अग्रपूजा
अचूकता

SFX f Y 2
SFX f 0  ा/AFacd .
SFX f 0  ां/AFbcd .

अजगर
अडसर

SFX g Y 2
SFX g 0  ी/AFacd .
SFX g 0  ीं/AFbcd .

अडचण

SFX h Y 1
SFX h 0  ं/AFbcd .

अतिथी

SFX i Y 1
SFX i 0  े/AFacd .

अखंडता

SFX k Y 1
SFX k 0  ा/AFacd .

अतिपरिचय

SFX l Y 1
SFX l 0  ां/AFbcd .

अणूबॉंब

करीत की करित?

अगदी सुरवातीला "करीत" असे लिहिले तर ऍटोकरेक्ट तो शब्द उलटवून "करित" असे करीत असे. आता हा बग सुधारला आहे. पण करित या शब्दाला "करिते" , “करियर" किम किंवा "करकरत" असे पर्याय दिसत आहेत. "करीत" असा पर्याय का दिसत नाही? यासाठी हंस्पेल शब्द कसा सुचवतो त्याचा अभ्यास करायला हवा.

ऍटोकरेक्टमधून काढायचे शब्दः
लिहिले लिहीले
अस्थिपंजर अस्थीपंजर 

स्पेलचेकमधून शब्द काढणेः
अनिर्णीत दुर्मीळ 

१८ जून, २०१९

सर्वसमावेशक की निवडक?

हंस्पेलमध्ये फक्त दोन रूलचे नेस्टिंग होऊ शकते. म्हणजे अंडे - अंड्या - अंड्याशिवाय इथपर्यंत गाडी जाऊ शकते. पुढे "अंड्याशिवायची" असा शब्द बनू शकत नाही. जर सर्व शब्द हवे असतील तर अंड्याच्या ४ नोंदी होतील.

अंडे/Z
अंड्या/Aacd
अंड्यां/Abcd
अंडी/Z

जर "अंड्याशिवाय" शब्दापर्यंत जाणारी गाडी चालणार असेल तर २ नोंदीत काम होईल. मी खात्री केली आहे की त्यापुढचे शब्द म्हणजे "अंड्याशिवायची", "अंड्याशिवायचा", "अंड्याशिवायचे" असे शब्द फार क्वचित वापरले जातात.

अंडे/Ze
अंडी/Z

नेटवरील रेसिपींमध्ये "अंड्याशिवायचा केक" असा उल्लेख दिसतो. ज्यांना खरोखरच अगदी सर्वसमावेशक डिक्शनरी हवी असेल त्यांनी वर दिलेल्या २ नोंदींबरोबर "अंड्या" आणि "अंड्यां" अशा दोन नोंदी वाढवाव्यात. मी मात्र थोडक्यात काम भागवणार आहे.

२४ मे, २०१९

correcting spelling where space is missing

mystring='कारोबारमुंबईसेलेकरगोवातकफैलाहुआहैपूरेइलाक़ेमेंरॉबर्टकाएकछत्रराजहै'

def recursive(mystring):
    for i in range(len(mystring), 1, -1):
        if mystring[:i] in mylist:
            print (mystring[:i])
            mystring = mystring[i:len(mystring)]
            recursive(mystring)
            break

recursive(mystring)

कारोबार मुंबई सेले कर गोवा तक फैला हुआ है पूरे इला

नुक्तावाला क

क ला नुक्ता जोडून जे अक्षर बनते त्याची लांबी दोन भरते तर स्वतंत्र नुक्तावाला क वापरला तर एकाच अक्षराने काम भागते.

क़
U+0915 + U+093C


U+0958

डिक्षनरीत योग्य तो क वापरलेला दिसत आहे. पण टाईप करताना लोक दोन अक्षराचा क वापरत आहेत. हा दोन अक्षरी क बदलून एक अक्षरी करण्यासाठी ही पायथॉन स्क्रीप्ट वापरली. नुक्त्याचा युनिकोड क्रमांक 093C आहे.

mystring='इलाक़े'
len(mystring)
myreplace= {'क़':'क़', 'ख़':'ख़', 'ग़':'ग़', 'ज़':'ज़', 'ड़':'ड़', 'ढ़':'ढ़', 'फ़':'फ़', 'य़':'य़'}
for key in myreplace.keys():
    mystring=mystring.replace(key, myreplace[key])
len(mystring)


२२ मे, २०१९

चतुरंग पुरवणीतील महत्त्वाचे लेख

राजन गवस यांचा आवर्जून वाचावा असा लोकसत्तेतील चतुरंग पुरवणीतील लेख (सुत्तडगुत्तड : मुक्त लेक)
https://www.loksatta.com/chaturang-news/suttadguttad-article-about-author-rajan-gavas-8-1891591/

यातील काही भाग फार महत्त्वाचा…
सावित्रीच्या लेकी महाराष्ट्रभर कर्तृत्व गाजवत आहेत. याबाबत भरभरून बोललं, वाचलं, लिहिलं जातं. पण हे सर्व होत असताना त्यांच्या आरोग्याबाबत, मानसिकतेबाबत कोणीच काही ध्यानात घ्यायला तयार नाही. हा खरा चिंतेचा प्रश्न आहे. पालक, शाळा, समाज सारेच मुलींच्या आरोग्याबाबत काही विचार करत आहेत याचे कुठं काही तपशील येतात असे चित्र नाही. तिनं गल्लीत खेळायचं नाही. घरात खेळायचं नाही. शाळेत तर खेळायला जागाच नाही. अशा वातावरणात पोरीच्या आरोग्याचं होणार तरी काय?
ते खेळ, ती गाणी, ते वाढणं, रांधणं टाकून द्यावं वाटत असेल, तर टाकून द्या. झिम्माफुगडी कालबाह्य वाटत असेल तर खेळू नये. पण त्या ठिकाणी पर्यायी व्यवस्था आपण काही निर्माण केली का? नवं संगोपनशास्त्र विकसित केलं का? याचं उत्तर नकारार्थीच येतं. त्यांच्या संगोपनाबाबत घरातील पालकांनी आणि शाळेतल्या शिक्षकांनी स्वतःचे परंपरागत दृष्टिकोन बदलायला पाहिजेत. जेव्हा तुम्ही जुने खेळ सहज टाकून देता तेव्हा जुने दृष्टिकोन नको का टाकून द्यायला. मुलगी म्हणजे परक्या घरचं धन. बाईच्या जातीनं असं करून कसं चालेल. बाई म्हणजे काचेचं भांडं. आमच्या घरची अशी रीत, तशी रीत. हे सगळं बाजूस सारल्याशिवाय मुलीचं संगोपन कसं होईल नीट.
_____

नीरजा यांचा विचार करायला लावणारा  लोकसत्तेतील चतुरंग पुरवणीतील लेख (तळ ढवळताना : डिस्कनेक्ट होण्याच्या काळात..)
https://www.loksatta.com/chaturang-news/tal-dawaltana-article-by-neerja-9-1891601/
यातील काही भाग फार महत्त्वाचा…

 ‘व्हॉट्स अ‍ॅप’मुळे सकाळच्या ‘गुड मॉर्निग’नं दिवसाची सुरुवात व्हायला लागली आणि रात्री ‘शुभरात्री’ म्हणत झोपायला लागलो. फार पूर्वी कधी तरी इंजिन सोडून यार्डात गेलेले डबे पुन्हा एकदा जोडले गेले आणि आमची ट्रेन एका छानशा सफरीला निघाली. पण ही सफर वाटली होती तेवढी प्रसन्न नाही राहिली.  वादाच्या ठिणग्या पडायला लागल्या. काहींनी ग्रुप सोडला, काही ग्रुपवर राहूनही कायमचे मुके झाले तर काही नित्यनेमाने एक आन्हिक म्हणून प्रत्येक वाराबरोबर बदलणाऱ्या देवदेवतांच्या प्रतिमा, कधी साईबाबा तर कधी स्वामी समर्थ मग त्याच्या जोडीला स्वातंत्र्यवीर सावरकर, लोकमान्य टिळक, भगतसिंग, क्वचित कधी तरी जोतीबा फुले, बाबासाहेब आंबेडकर, महात्मा गांधी, नाही तर थेट नाना पाटेकर, विश्वास नांगरे पाटील वगैरेच्या नावावर खपवल्या गेलेल्या संस्कारांचं भरघोस पीक, सुविचारांची उधळण, कधी ‘कोई लौटा दे मेरे बीते हुए दिन’ म्हणत जुन्या दिवसांच्या काढलेल्या आठवणी, वेगवेगळ्या दिवसांच्या, सणावाराच्या शुभेच्छा, बायकोच्या (कथित) हुकूमशाहीवरचे विनोद, आणि जोडीला ‘मेरा भारत महान’च्या घोषणा!
आज इतिहास जाणून घेण्यासाठी खोल आणि विस्तृत पट उलगडून दाखविणारी पुस्तकं वाचण्याची गरज असते हे वेळ नसलेली आणि वाचनाची सवयच नसलेली माणसं विसरून गेलेली आहेत. आता केवळ सीमेवरच सैनिक लढताहेत असं नाही. तर प्रत्येक घराची रणभूमी झाली आहे. अलीकडे तर अनेक ‘फेसबुक’ व ‘व्हॉट्सअ‍ॅप’ ग्रुपवर युद्धसदृश स्थिती आहे. फुलापानांनी आणि सुंदर सुविचारांनी भरलेला ‘व्हॉट्स अ‍ॅप’चा अवकाश हळूहळू हिंसक रंगांनी भरायला लागला. समाजमाध्यमांमुळे सोपं झालं आहे कनेक्ट होणं एकमेकांशी. पण मनानं डिस्कनेक्ट होत चाललो आहोत कायमचे, त्याचं काय करायचं राव!