१० नोव्हेंबर, २०२१

विकी म्हणजे काय?

विकी नक्की काय आहे या विषयी बऱ्याच लोकांचा गैरसमज झालेला दिसतो. उदाहरण द्यायचे झाले तर मराठी विकीवरील सदस्य_चर्चा:ज हे पान पाहू शकता. हे सदस्य अत्यंत अनुभवी असून त्यांनी एका लेखातील काही विशिष्ट वर्ग काढून टाकले. संदेश हिवाळे यांनी स्पष्टीकरण मागितले की "या लेखातून तुम्ही कोणतेही स्पष्टीकरण न देता "वर्ग:दलित लेखक, वर्ग:दलित कार्यकर्ते, वर्ग:भारतीय बौद्ध, वर्ग:आंबेडकरवादी" हे चार वर्ग हटवले;  हे चारही वर्ग मराठी विकिपीडिया खेरीज इंग्लिश विकिपीडियासह अनेक विकिपीडियांमध्येही उपलब्ध आहेत." त्यावर यांनी सांगितले की... "विकीवरच काय पण इतरत्र कुठेही कुठलाही जातवादी उल्लेख असू नये या मताचा मी आहे. तसे उल्लेख करत राहिलो तर जातिअंताच्या चळवळीचे काय भविष्य असेल?" विकिपीडिया हे जातिअंताच्या चळवळीचे साधन आहे असे यांना कुणी सांगितले?

मराठी विकीवर मुखपृष्ठावर रामदास स्वामींनी केलेला उपदेश विकीचे अधिकृत धोरण असल्यासारखे वापरले आहे. “आपणांसी जे जे ठावे, ते इतरांसी सांगावे; शहाणे करोनी सोडावे, सकलजन.” यातील पहिला अर्धा भाग विकीला चपखल लागू पडतो. पण नंतरचा अर्धा भाग विकीच्या तत्त्वात अजिबात बसत नाही.  “शहाणे करोनी सोडावे” यात जो जबरदस्तीचा भाग आहे तो विकीला कधीच मान्य नव्हता. विकिपीडिया आपल्यासमोर फक्त काही माहिती ठेवते त्याच्या सत्यासत्यतेविषयी किंवा निष्पक्षतेविषयी कसलीही जबाबदारी घेत नाही.  आई जसे औषध घेतल्याशिवाय मुलाला सोडत नाही तसे काही विकी करत नाही. 

काही विचारवंत शासनावर दबाव आणण्यासाठी विकीचा वापर करावा असे लेख लिहून जाहीरपणे सांगतात. उद्या नक्षलवादी कार्यकर्तेदेखील विकीचा वापर आपल्या संघटनेच्या प्रचारासाठी करतील, काय सांगावे?

०८ नोव्हेंबर, २०२१

गाळलेल्या जागा भरा!

काही वेळा जुन्या पुस्तकातील दोन – चार शब्द पुसले गेलेले असतात. अशी पुस्तके स्कॅन केल्यावर असे शब्द काय असतील हे शोधणे कठीण होऊन बसते. 

https://mr.wikisource.org/wiki/%E0%A4%AA%E0%A4%BE%E0%A4%A8:Arth_shastrachi_multatve_cropped.pdf/81

दोन शब्दांमधील गाळलेले शब्द शोधून काढण्यासाठी ही क्वेरी वापरता येते.

# /root/.cargo/bin/rg  -No "(दरवर्षी (\w+ ){3}पेठ)" mr_dedup.txt

याचा अर्थ दरवर्षी या शब्दानंतर पुसले गेलेले ३ शब्द शोधायचे आहेत. पण त्यानंतर येणारा शब्द हा "पेठ” असा असला पाहिजे. या निकषात बसणाऱ्या दोन ओळी मिळाल्या...

संस्थेतर्फे दरवर्षी भरवली जाणारी ग्राहक पेठ यावर्षी शुक्रवार दि. १९ ऑक्टोबर २०१८ ते रविवार दि. २८ ऑक्टोबर २०१८ या कालावधीत संपन्न होत आहे...

वृद्ध आबासाहेबांनाही या मुलाच्या विलक्षण बुद्धिमत्तेबद्दल कौतुक होतं. दरवर्षी त्यांचा टांगा नारायण पेठेतल्या त्या जिन्याखालच्या खोलीसमोर थांबे - ज्ञानाची उपासना करणार्‍या या मुलाला गणेशोत्सवाच्या जेवणाचं समक्ष आमंत्रण करण्यासाठी.

"भरवली जाणारी ग्राहक" किंवा "त्यांचा टांगा नारायण" असे दोन पर्याय  मिळतात त्यातील. योग्य पर्याय संदर्भाने निवडता येतो. 

यासाठी ऑस्कर नावाचा पब्लिक डेटा वापरला आहे. 

https://oscar-public.huma-num.fr/shuff-dedup/mr/

आणि ग्रेप क्वेरी न वापरता रिपग्रेप कमांड वापरली कारण त्यात युनिकोड सपोर्ट आहे. रस्ट ही एक पायथॉन सारखी  प्रोग्रॅमिंग लँग्वेज असून ती देखील यासाठी आवश्यक आहे.

१९ ऑक्टोबर, २०२१

काय फरक पडतो?

 मराठी विकीवरील संदेशः

ज्ञानसंप्पन आणि माहितीसमृद्ध समाज घडवण्यासाठी वाचन संस्कृतीचा विकास व प्रसार आवश्यक आहे. वाचन संस्कृतीचा विकास व प्रसार होण्याचे उद्देशाने भारत रत्न डॉ. ए. पी. जे. अब्दुल कलाम ह्याचा जन्मदिवस हा महाराष्ट्र सरकार २०१५ पासून वाचन प्रेरणा दिन म्हणून साजरा करतो. मराठी भाषा विभाग मंत्रालयाच्या आव्हाना प्रमाणे मराठी विकिपीडिया २०१५ पासून १५ ऑक्टोबरला जोडून दरवर्षी वाचन प्रेरणा सप्ताहाचे आयोजन करीत असतो.

१) "ज्ञानसंप्पन" हा शब्द "ज्ञानसंपन्न" असा हवा होता.

२) "प्रसार होण्याचे उद्देशाने" असे न म्हणता आपण "प्रसार होण्याच्या उद्देशाने" असे म्हणतो.

३) "सरकार साजरा करतो" असे न म्हणता आपण "सरकार साजरा करते" असे म्हणतो.

४) "मंत्रालयाच्या आव्हाना प्रमाणे" मंत्रालय सर्वांना उठसुठ आव्हान देत असले तरी इथे मात्र तो शब्द "आवाहनाप्रमाणे" असा वाचावा.

५) "आव्हाना प्रमाणे", "भारत रत्न" असे शब्द हिंदीप्रमाणे तोडून नव्हे तर जोडून लिहिण्याची प्रथा आहे. ती त्रासदायक वाटत असेल आणि सुटे सुटे शब्द वाचायला सोपे वाटत असतील तर मी तसेही वाचण्याची सवय लावून घेईन. 

६) "अब्दुल कलाम ह्याचा" असे न म्हणता "अब्दुल कलाम ह्यांचा" असे आपण आदरार्थी बहुवचन वापरतो. 

संदेश देण्याघेण्याकरता भाषा हे एक माध्यम आहे आणि माध्यमाने म्हणजेच साधनाने साध्य होण्याचा प्रयत्न करू नये हे ठीक. पण वाचन संस्कृतीचा विकास व प्रसार व्हावा असे खरोखरच वाटत असेल तर भाषेचे प्रमाणीकरण करावे लागेल. तीन-चार वाक्ये समजून घेऊन वाचता येतील. अशी आणखी किती वाक्ये फेरफार करीत वाचणार?

१४ जून, २०२१

शास्त्रात् रूढीः बलीयसी

४१, ४६, ८५ आणि ८६ हे अंक अक्षरी कसे काढायचे याची मला खात्री नाही. कारण सरकारी नियमाप्रमाणे ते असे आहेत. 
एकेचाळीस शेहेचाळीस पंच्याऐंशी शाऐंशी 

पण बाकी बहुतेक सर्व ठिकाणी हे शब्द असे लिहिलेले दिसत आहेत. 
एक्केचाळीस सेहेचाळीस पंचाऐंशी शहाऐंशी 

https://www.maharashtra.gov.in/Site/Upload/Government%20Resolutions/English/20091106130447001.pdf 

 पहाः पान १६ परिशिष्ट पाच (देवनागरी अंक आणि त्यांचे प्रमाणीकृत अक्षरी लेखन) 

 "शास्त्रात् रूढीः बलीयसी" या न्यायाने वर दिलेले रूढ शब्द डिक्शनरीत घेत आहे. कोणी आक्षेप घेतला नाही तर. दोन्ही शब्द बरोबर आहेत असे जर तज्ज्ञ सांगत असतील तर दोन्ही शब्द डिक्शनरीत ठेवता येतीलही. पण लिब्रे ऑफिसच्या नंबर टू टेक्स्ट फंक्शनमध्ये कोणतातरी एकच शब्द ठेवता येईल!

https://github.com/Numbertext/libnumbertext/pull/88/commits/73d0bb4bb8106a0f2f6d7b68ec1727b249e9299f

२२ मे, २०२१

Apply Autocorrect

These words change to wrong words after I use Tools - autocorrect - apply.

औद्योगीकरण
निर्भत्सन
निर्भत्सना
पितांबर
पितृछाया
व्यक्तित्त्व
स्वताः
पुनःश्च
विशेषत्त्व

The new words looks like this and they are wrong. The are not present in auto-correct list.

औद्योगीकर्ण
निर्भत्सण
निर्भत्सणा
पीतांब्र
पीतृछाया
व्यक्तीत्त्व
स्वतःाः
पुनःःश्च
विशेषतः्त्व

Most of the words are getting converted correctly. But around 10% random words are not. The English auto correct works as expected. This is noticed only in Marathi.

https://bugs.documentfoundation.org/show_bug.cgi?id=142437

१७ मे, २०२१

हंस्पेलमधील बग

खाली दिलेले दोन्ही गट हे इडागमाचा नियम वापरून बनलेले असले तरी पहिला गट चुकीचा म्हणून मार्क होत आहे तर दुसरा बरोबर.

लाल रेघ येऊन चुकीचे दर्शविलेले शब्दः

बोलाविण्याचे  बोलाविण्यास बोलाविण्याचा बोलाविण्याची बोलाविण्याच्या  बोलाविण्यामागे  बोलाविल्यानंतर बोलाविल्याचा बोलाविल्याचे  बोलाविल्याबद्दल बोलाविल्यावर बोलाविण्याऐवजी  बोलाविण्यासंदर्भात  बोलाविल्याचा बोलाविल्याचे  बोलाविल्याबद्दल बोलाविल्यावर

डिक्शनरीत असलेले आणि म्हणून लाल रेघ न येणारे बरोबर शब्दः

बोलविण्याचे  बोलविण्यास बोलविण्याचा बोलविण्याची बोलविण्याच्या  बोलविण्यामागे  बोलविल्यानंतर बोलविल्याचा बोलविल्याचे  बोलविल्याबद्दल बोलविल्यावर बोलविण्याऐवजी  बोलविण्यासंदर्भात  बोलविल्याचा बोलविल्याचे  बोलविल्याबद्दल बोलविल्यावर

R टॅग मध्ये P टॅग दिलेला आहे
SFX R णे ाविणे/P णे 

तर P टॅगमध्ये "ण्या-चे” हे पालुपद लावण्याची सोय आहे.
SFX P णे ण्या/Aacd णे 

म्हणजे बोलणे - बोलाविणे - बोलाविण्या - बोलाविण्याचे असे चार शब्द बनले पाहिजेत. प्रत्यक्षात फक्त पहिले तीनच शब्द बनत आहेत. याचे कारण हंस्पेल फक्त पहिल्या दोन पायऱ्यांचा विचार करतो. हा हंस्पेलमधील बग आहे त्याचा उल्लेख मी याच चर्चेत यापूर्वीदेखील केला आहे. त्याला उपाय म्हणजे एकाच्या ऐवजी दोन / तीन  शब्द डिक्शनरीत ठेवावे लागतील.

बोलणे/MNPQR
बोलवणे/NOP
बोलावणे/NOP

या तिन्ही क्रियापदांचा अर्थ वेगवेगळा असल्यामुळे ती एकत्र करण्याची माझी आयडिया मुळातच चुकीची होती.  हंस्पेलला दोष देण्यात काही अर्थ नाही!

१६ एप्रिल, २०२१

नेहमी चुकणारे काही शब्द

 जालावर लिहिताना बरेच लोक ऱ्ह्स्वान्त शब्द टाईप करताना दिसतात. उदा.

 

सुरु  करु तेलुगु  असु चालु 

संगति सदाहि इत्यादि नाहि


ऱ्ह्स्व उ आणि ऱ्ह्स्व इ शब्दाच्या शेवटी (पूर्णविराम किंवा स्पेसच्या आधी) आल्यास जावा स्क्रिप्ट वापरून एक प्रॉम्प्ट द्यावा व नंतरच मजकूर सबमिट करता येईल अशी व्यवस्था वेब ऍडमिनने केली तरी बऱ्याच चुका टळतील.


तसेच नेहमी चुकणारे असे काही शब्द ऍटोकरेक्टने सुधारता येतील.

ज्यास्त  गरदी स्वत विषाणुंचीच  जंतुंची  माहित अजुन नविन आणी महत्व म्हणुन देखिल माहीती


२८ मार्च, २०२१

updates to the dict

 दृष्टीकोन आणि  दृष्टिकोण हे दोन्ही  शब्द बरोबर आहेत. पण कन्फ्युजन  टाळण्यासाठी  फक्त  दृष्टीकोन  हा मराठी शब्द  ठेवला आणि  दृष्टिकोण हा संस्कृत शब्द  वगळला.


पाहणे/NOPQ यापासून पाहल्याचा शब्द बनतो. पण पाहिल्याचा शब्द बनत नाही.


२५ मार्च, २०२१

list of exception words allowed to use joiners

These are the exceptions to the rule of not using joiners anywhere in the text.

https://unicode.flopp.net/c/200C

Copy the zero width non-joiner from the above page and search for it...

grep '‍' words_without_verbs.txt | sed -E  's/(\/.*)//g' old_file.txt | tr '\n' ' '

 तासन्‌तास विद्युत्‌चुंबक विद्युत्‌शक्ती विद्युत्‌जन्य  विद्युत्‌गतिक विद्युत्‌गतिशास्त्र विद्युत्‌गतिशास्त्रीय विद्युत्‌जन्य  विद्युत्‌तारिणी विद्युत्‌दाहिनी विद्युत्‌दाहिन्या विद्युत्‌दीप  विद्युत्‌मापक विद्युत्‌रोधक  विद्युत्‌लहर विद्युत्‌वाहक विद्युत्‌वाहकता विद्युत्‌लता  विद्वत्‌जन श्वासोच्छ्‌वास षट्‌कर्णी  षट्‌कर्मी  षट्‌कर्मे षट्‌कर्मां षट्‌कोणीय षट्‌कोन षट्‌कोनी षट्‌पदी षट्‌पद्या षट्‌शास्त्रे षट्‌शास्त्रां षड्‌गुण षड्‌गुणा षड्‌गुणी  षड्‌ज षड्‌भुज  षड्‌यंत्र षड्‌यंत्रे षड्‌रस षड्‌रसां षड्‌विकार षड्‌विकारां षड्‌विकारी 

‍Apply same to zero width joiner and find the words...

grep '‍' words_without_verbs.txt | sed -E  's/(\/.*)//g' | tr '\n' ' '

 महिनोन्‍महिने  मुखोद्‍गत  मुद्‍गल  मैलोन्‍मैल  युगान्‍त  वाक्‍गंगा  वाक्‍चातुर्य  वाक्‍चातुर्ये   वाक्‍ताडन  वाक्‍ताडने  वाक्‍शून्य   वाक्‍सिद्धी  वाग्‍युद्ध  वाग्‍युद्धे विद्युच्‍चुंबक विद्युज्‍जन्य  विद्युज्‍जन्य  विद्युल्‍लहर विद्युल्‍लता  विद्वज्‍जन  शंक्‍वाकृती  शार्ङ्‍गपाणी 

Only these words are allowed to use joiners. All other "jodakshars" in Marathi should be written without joiners.

०९ मार्च, २०२१

ग्रामनामांसाठी हन्स्पेलचे नियम

'पूर' शब्दा्ने अंत झालेल्या ग्रामनाम असलेल्या शब्दाचे षष्ठीच्या प्रत्ययापूर्वी सामान्यरूप होत नाही. नागपूरचे, सोलापूरचे वगैरे. इतर प्रत्यय लावताना नागपूरला/*पुराला, *पूरहून/पुरापासून अशी दोन्ही रूपे होतात.

https://mr.wikipedia.org/s/3vu8

ग्रामनामे हन्स्पेलच्या नियमानुसार अशी लिहावी.

नागपूर/Aac
नागपूरमार्गे
नागपूरहून
नागपुर/Fk
नागपुरी
नागपूरकर
नागपूरकरा/Facd
नागपूरकरां/Fbcd
नागपूरवासीय
नागपूरवासीया/acd
नागपूरवासीयां/bcd
_____

कोल्हापूर
सोलापूर
पंढरपूर
राजापूर

०८ मार्च, २०२१

इंग्रजी शब्दांची व्यवस्था

मराठी शुद्धलेखनाचे नियम गुगलवर सहज मिळतात. त्यातील नियम ८ भल्याभल्यांना कोड्यात टाकतो.

नियम ८:

८.१ उपान्त्यी दीर्घ ई किंवा ऊ असलेल्या मराठी शब्दांचा उपान्त्य ई‑कार किंवा ऊ‑कार उभयवचनी सामान्यरूपांच्या वेळी ऱ्हस्व लिहावा.

उदाहरणार्थ : गरीब – गरिबाला, गरिबांना चूल – चुलीला, चुलींना.

अपवाद – दीर्घोपान्त्य तत्सम शब्द.

उदाहरणार्थ : परीक्षा – परीक्षेला, परीक्षांना दूत – दूताला, दूतांना.

म्हणजे बघा, "जमीन" दीर्घ पण "जमिनीचा" ऱ्हस्व. "पोलीस" दीर्घ पण "पोलिसाचा" ऱ्हस्व. थोडे कन्फ्युजिंग पण समजण्याजोगे. ओके. पण पुढचा भाग अधिक इंटरेस्टिंग आहे. मराठी आणि संस्कृत शब्दांबाबत स्पष्टता असली तरी इंग्लिश शब्द कसे लिहायचे ते हा नियम सांगत नाही.

टाईम्सच्या / टाइम्सच्या

डिझाईनचे / डिझाइनचे

हे शब्द तत्सम नाहीत त्यामुळे ऱ्हस्व लिहावे की ते मराठी नाहीत म्हणून दीर्घ? मुळात "तत्सम" याचा अर्थ आहे "त्या सारखा". मग तो संस्कृतसारखा असेल किंवा मग इंग्रजीसारखा.  महाराष्ट्र  टाइम्स हे वृत्तपत्र आपले नाव ऱ्हस्व ठेवते. ते कदाचित नियम ७.२ च्या आधाराने असेल. 

७.२ मराठी शब्दांतील अनुस्वार, विसर्ग किंवा जोडाक्षर यांच्या पूर्वीचे इकार व उकार सामान्यतः ऱ्हस्व लिहावेत.

उदाहरणार्थ : चिंच, डाळिंब, भिंग खुंटी, पुंजका, भुंगा छिः थुः किल्ला, भिस्त, विस्तव कुस्ती, पुष्कळ, मुक्काम.

परंतु तत्सम शब्दांत ते मुळाप्रमाणे र्‍हस्व किंवा दीर्घ लिहावेत.

उदाहरणार्थ : अरविंद, चिंतन कुटुंब, चुंबक निःपक्षपात, निःशस्त्र चतुःसूत्री, दुःख कनिष्ठ, मित्र गुप्त, पुण्य ईश्वर, नावीन्य पूज्य, शून्य.

जोडाक्षरापूर्वीचा इकार ऱ्हस्व लिहावा हा नियम फक्त मराठी शब्दांनाच लागू होतो. त्यातही "सामान्यतः" अशी मेख आहे! स्पेलचेकच्या डेटाबेससाठी मूळ शब्द दीर्घ तर त्याचे सामान्यरूप ऱ्हस्व असे (सध्या तरी) ठेवत आहे.

टाईम्स / टाइम्सच्या

डिझाईन / डिझाइनचे

जाणकारांनी काही सूचना केली तर त्याचा विचार होईल. अर्थात डिझाईनचे आणि डिझाइनचे असे दोन्ही शब्द ठेवा अशी अपेक्षा पुरी होणार नाही. कारण झेन ऑफ पायथॉनच्या मते सगळ्यासाठी शक्यतो एकच मार्ग असावा!

There should be one - and preferably only one - obvious way to do it.

https://en.wikipedia.org/wiki/Zen_of_Python

Update (१२ एप्रिल २०२२):

इंग्रजी आणि उर्दूतून मराठीत आलेले शब्द मराठीच्या नियमांप्रमाणे चालवले जातात. उदा. लाईन / लायनीवर  (नियम ८.३ प्रमाणे). त्या नियमाने डिझाईन किंवा डिझाइन असे कसेही लिहिले तरी त्याचे सामान्यरूप मात्र डिझाइनचे असेच (नियम ८.१ प्रमाणे) होईल. टाइम्स (आणि कारकिर्द) हा शब्द देखील मराठीच्या नियमानुसार चालणार असेल तर तो ऱ्हस्वच बरोबर ठरतो.

२४ फेब्रुवारी, २०२१

इडागम टॅगमधील काही सुधारणा SFX A 0 पुढे .

 Need to add these 7 entries to O tag. The count will become 33 + 7 = 40

SFX O णे िणार णे

SFX O णे िणाऱ्या/acd णे

SFX O णे िणाऱ्यां/bcd णे

SFX O णे िण्या/acd णे

SFX O णे िण्यां/bcd णे

SFX O णे िलेल्या/acd णे

SFX O णे िलेल्यां/bcd णे

SFX O णे िल्या णे

_____

Add these 5 parameters to Q tag after SFX Q णे वाव्यास णे

SFX Q णे वायचा णे
SFX Q णे वायची णे
SFX Q णे वायचे णे
SFX Q णे वायच्या णे
SFX Q णे वायला  णे
_____

Add these 7 parameters to P tag after  SFX P णे ाल णे

SFX P णे ायचं णे
SFX P णे ायचा णे
SFX P णे ायची णे
SFX P णे ायचे णे
SFX P णे ायचो णे
SFX P णे ायच्या णे
SFX P णे ायला णे

SFX P णे ेना णे
SFX P णे ेनात णे
SFX P णे ेनासं णे
SFX P णे ेनासा णे
SFX P णे ेनासे णे

_____


SFX A 0 इतका .
SFX A 0 इतकी .
SFX A 0 इतके .
SFX A 0 एवढा .
SFX A 0 एवढी .
SFX A 0 एवढे .
SFX A 0 करता .

SFX A 0 पुढे .
SFX A 0 पुरता .
SFX A 0 पुरती .
SFX A 0 पुरते .
SFX A 0 पुरत्या .

_____

SFX R णे वणे/O णे

_____

उपसणे/NP
उडणे/MNPQ
उल्लेखणे/NOP

कळणे/MNPQ
कळवणे/NP
किणकिणणे/NP
केणे/FT
खुणावणे/NP
गौरवणे/NOP
घातणे/FTP  घातलेला घातलेली घातलेले
चित्कारणे/NP
दुर्लक्षणे/NOP
धुत्कारणे/NP
पोहोचणे/NP  to पोहोचणे/MNPQ


०४ फेब्रुवारी, २०२१

स्वराला स्वर

स्वराला स्वर जोडता येत नाही. पण काही एडिटरमध्ये हे शक्य होत आहे असे दिसते. खाली दिलेले दोन्ही शब्द दिसायला सारखे दिसत असले तरी ते वेगळे आहेत. 

अधिकारांंचा अधिकारांचा 

पहिल्या शब्दात स्वराला स्वर जोडला आहे. असा  ं  ं

असे सर्व शब्द निवडून रिप्लेसमेंट टॅगमध्ये जमा करावे लागतील.

२८ जानेवारी, २०२१

निवडक शब्दसंपदा

"जीवाला” या शब्दाला पर्याय म्हणून "जुवाला" असा शब्द दिसत आहे. याचे कारण "जू” या मूळ शब्दाचे एकवचनी सामान्यरूप "जुवाला”, “जुवाचे” वगैरे होऊ शकते. स्पेल चेक सर्वसमावेशक बनविण्यासाठी जास्तीत जास्त शब्द आणि त्यांची रूपे घेण्याच्या नादात स्पेलचेकची क्वॉलिटी घसरू शकते. त्यासाठी निवडक शब्द आणि त्यांची ठरावीक रूपे घ्यावीत. 

"पंक" या शब्दाचा अर्थ दाते शब्दकोशाप्रमाणे "चिखल” किंवा "साखरेचा पाक” असा होतो. या दोन्हीपैकी कोणत्याच अर्थाने आज तो शब्द वापरात नाही. पंक/f अशी नोंद करून ६४५ शब्द डिक्शनरीत वाढवण्यात काहीही अर्थ नाही. असे बरेच शब्द आहेत ते काढावे लागतील. उदा. “अज/f” याचा अर्थ बोकड असा होतो. हा संस्कृत शब्द असून मराठीत फारसा वापरात नाही. वापरातील शब्दच ठेवणे फार महत्त्वाचे आहे. 


२५ जानेवारी, २०२१

अफिक्स फाईलमधील सुधारणा

 अधिवेशन या शब्दापासून सुमारे ६५० शब्द बनत असले तरी काही शब्द राहिले.

# grep '^अधिवेशना' all_words_final1.txt | wc -l

648

हे चार शब्द का सुटले ते पहावे लागेल. 

अधिवेशनाअगोदर

अधिवेशनानिमित

अधिवेशनापर

अधिवेशनावेळी

च आणि ही प्रत्येक शब्दाला लावणे शक्य नाही.

अधिवेशनातूनच

अधिवेशनानंतरही

ईय आणि इक सारखे प्रत्यय काही ठरावीक शब्दांनाच लागतात. त्यांची सोय करावी लागेल.

अधिवेशनीय

१० जानेवारी, २०२१

हंस्पेलमधील रीप्लेसमेंट टॅग

 चुकीच्या शब्दांना योग्य शब्द सुचवताना जे पर्याय येतात ते काही वेळा समर्पक नसतात. "वालवतो" या शब्दाला “वाळवतो” अशी सुचवणी न येता “चालवतो, घालवतो, खालवतो, खालावतो" हे शब्द सुचवले जात आहेत. याचे कारण हंस्पेलने "वालवतो" या शब्दातील "वा” चुकीचा असण्याची शक्यता गृहीत धरली आहे. आता आपण दुसरा शब्द पाहू. "वाडवतात” या शब्दाला “वागवतात वाजवतात वाळवतात वाचवतात" अशी सुचवणी  येत आहे. याचा अर्थ इथे "वा” नव्हे तर "ड” बदलायला हवाय हे हंस्पेलला बरोबर कळले. पण "ड” ला "ढ” हा "ग” अथवा "ज” पेक्षा जास्त जवळचा पर्याय आहे हे त्याला माहीत नाही. त्यामुळे "वाढवतात” हा पर्याय दिसत नाही. लोकं "ढ” च्या ऐवजी "ड” टाईप करतात कारण फोनेटिक मध्ये  "ढ” काढणे हे "ड” पेक्षा जास्त त्रासदायक ठरते. कोणते अक्षर कोणत्या अक्षराला जास्त जवळचे आहे हे हंस्पेलला शिकवण्यासाठी "रीप्लेसमेंट टेबल” चा टॅग वापरता येतो.

REP 9
REP स श
REP स ष
REP श ष
REP प फ
REP ज झ
REP ल ळ
REP न ण
REP त ट
REP ड ढ

"विसरला" हा शब्द "विषरला" असा सहसा लिहला जात नाही. कारण बहुतेक इन्पुट मेथडमध्ये ष हे अक्षर काढण्यासाठी ३ की-स्ट्रोक वापरावे लागतात. पण "विषय" हा शब्द "विशय" असा सर्रास लिहला जातो. त्यामुळे वर दिलेल्या  रीप्लेसमेंट टेबलमध्ये श – ष अशी नोंद असली तरी ष – श अशी नोंद नाही. यात कोणाला काही बदल करायचा असेल तर विकीच्या ह्या पानावर चुकीचा शब्द – बरोबर शब्द – सध्या दिसणारे पर्याय अशी नोंद करावी.  

https://tinyurl.com/replacement-table

रीप्लेसमेंट टेबल हा टॅग वापरून आपण आपला स्पेल चेक अधिक परिणामकारक बनवू शकू.