झिरो विड्थ नॉन जॉईनर 200c काढून टाकावा

संपादन

स्तोत्रम्‌ - या शब्दात झिरो विड्थ नॉन जॉईनर \u200c अगदी शेवटी "म" चा पाय मोडण्यासाठी वापरला आहे. तो बरोबर आहे.

रिझॉर्ट्\u200cस - या शब्दात तो "स" च्या आधी येतो, तो चुकीचा आहे. कारण झिरो विड्थ नॉन जॉईनर न वापरता देखील तो शब्द तसाच दिसेलः रिझॉर्ट्स

म्हणजेच झिरो विड्थ नॉन जॉईनर नंतर स्पेस, एंटर मार्क किंवा दंड चिन्ह । आले तर ठीक, नाही तर झिरो विड्थ जॉईनरचा उपयोग नाही तो काढून टाकावा. मला वाटते त्यासाठी रेग्युलर एक्स्प्रेशन वापरावे लागेल. टंकभेद की लेखनभेद

Shantanuo (चर्चा) ११:४१, ९ फेब्रुवारी २०२२ (IST)Reply

कॉंग्रेस शब्दाची फोड

संपादन
काँग्रेस > कॉंग्रेस  ( क + ा + ँ > क + ॉ + ं )

कॉम्रेड या शब्दातील 'कॉ' तर लॉजिक शब्दातील 'लॉ' ही दोन-दोन बाईटची (ल + ॉ / क + ॉ) अक्षरे आहेत. ती तीन बाईटमध्ये (क + ा + ऍ) अशी लिहू नयेत. वर दिलेल्या 'कॉंग्रेस' या शब्दामध्ये दोन्ही बाजूंना तीन बाईट आहेत. सर्व टंकात पहिला शब्द अगदी बरोबर दिसतो. तर काही टंकात दुसरा शब्द नीट दिसत नाही. पण तसे असले तरी देखील दुसरा पर्यायच बरोबर ठरवावा कारण तसे पाहिले तर 'कॉ' वर अनुस्वार म्हणजेच 'कॉं' असा क्रम बरोबर आहे. शब्द नीट वाचता येणे हा एकच निकष ठेवला तर मात्र पहिला शब्द बरोबर आहे. Shantanuo (चर्चा) १३:२१, २० फेब्रुवारी २०२२ (IST)Reply

Corrections as per Rule 8.1

संपादन

उपान्त्यी दीर्घ ई किंवा ऊ असलेल्या मराठी शब्दांचा उपान्त्य ई-कार किंवा ऊ-कार उभयवचनी सामान्यरूपांच्या वेळी ऱ्हस्व लिहावा. शुद्धलेखनाचे_नियम#नियम_८.१

पोलीसा > पोलिसा

"पोलिस " > "पोलीस " (note the space at the end of the word)

More info: http://shabdasampada.blogspot.com/2022/03/blog-post.html

Shantanuo (चर्चा) ११:४९, २० मार्च २०२२ (IST)Reply

@Shantanuo: मला नुकताच ह्यासारखा एक अनुभव केनिया → केन्या बदल करतांना आला (special:diff/2048160). तिथे "हर्केनिया" चे "हर्केन्या" असा बदल झाला. लक्ष देऊन बघितल्यास असे दिसते कि (तांत्रिक दृष्ट्या, व्याकरणाप्रमाणे नाही) "हर्केनिया" हा "ह+र + ्+केनिया " असा लिहिल्या जातो. त्याचप्रमाणे "पोलिसा" हा शब्द "पोलिस+अ" असा लिहिला जातो. मराठी मध्ये regular expressions कसे वापरावे किंवा ते खरंच काम करतील किंवा नाही, याची मला खात्री नाही. भरपूर ठिकाणी आपण " केनिया "→ " केन्या " असे रूपांतर करू शकतो. (space at the both end). ह्याव्यतिरिक्त दुसरा काही उपाय अजून तरी सुचत नाहीये. —usernamekiran (talk) १८:१०, २१ मार्च २०२२ (IST)Reply
आपण " केनिया "→ " केन्या " असे रूपांतर करू शकतो. (space at the both end). तसे केले तर केनियाची सामान्यरूपे तशीच राहतील. म्हणजे “भारताने केनियाला हरविले” हे वाक्य "भारताने केन्याला हरविले” असे होणार नाही. पण "भारताविरुद्ध केनिया विजयी” हे वाक्य "भारताविरुद्ध केन्या विजयी” असे बदलले जाईल. असे केले की काही ठिकाणी "केनिया” तर काही ठिकाणी "केन्या” दिसेल - त्याने गोंधळात अधिक वाढ होईल व ते प्रमाण लेखनाच्या दृष्टीने देखील चुकीचे ठरेल. करायचे तर सर्व ठिकाणी केनियाचे केन्या करा नाहीतर ते तसेच ठेवा. केनिया बदलताना हर्केनिया चे हर्केन्या झाले ही अपवादात्मक चूक होती. त्यासाठी हवे तर "हर्केन्या - हर्केनिया" अशी एक रिव्हर्स एंट्री टाका. अशी दोन-चार पानेच आहेत. या व्यतिरिक्त इतर काही अपवादात्मक शब्द वापरलेले गेलेले नाहीत. त्यामुळे पोलीसा > पोलिसा हा बदल देखील निश्चिंतपणे करू शकता. [या पानावर] दिलेल्या लिनक्स कमांडने आपण ही खात्री करून घेऊ शकता. Shantanuo (चर्चा) ११:२०, २२ मार्च २०२२ (IST)Reply
@Shantanuo: मी हर्केनिया लेखावर {{nobots}} साचा टाकला, व लेखाला माझ्या watchlist मध्ये टाकले. हा मला सगळ्यात साधा पर्याय वाटला. —usernamekiran (talk) ००:३४, २५ मार्च २०२२ (IST)Reply
केनिया या शब्दाच्या आधी स्पेस टाकली तर याची गरजच नाही. कारण हर्केनिया हा शब्द केनिया या शब्दाशी न जुळल्यामुळे तो बदललाच जाणार नाही. “\ केनिया” > “\ केन्या” असा बदल करण्यासाठी बहुतेक स्पेस एस्केप \ करावी लागेल. Shantanuo (चर्चा) ०८:५६, २७ मार्च २०२२ (IST)Reply
पोलीसा → पोलिसा ही नोंद झालेली दिसत आहे पण त्याच्याबरोबरच _पोलिस_ > _पोलीस_ अशीही नोंद पाहिजे. म्हणजे नुसता पोलीस शब्द दीर्घ पण त्याची सर्व सामान्यरूपे मात्र ऱ्हस्व होतात. असे आणखी काही शब्द कोशात आहेत ते शोधून जसे मिळतील तसे येथे http://mr.shoutwiki.com/wiki/Non_dict_pages देत आहे. हे शब्द विकीवर वापरले गेले आहेत की नाही मला माहीत नाही तरी देखील देऊन ठेवत आहे कारण त्यावर कधीतरी एक लेख लिहीता येईल! Shantanuo (चर्चा) १३:४२, ३ एप्रिल २०२२ (IST)Reply
नजरचुकीमुळे राहून गेलं. एक-दोन दिवसात टाकतो. लेख असो किंवा नसो, भविष्यासाठी सर्व दुरुस्त्या आधीच टाकून ठेवलेल्या बऱ्या. :-D —usernamekiran (talk) १०:१२, ४ एप्रिल २०२२ (IST)Reply

या नियमानुसार "खूनाचा" हा शब्द खुनाचा असा पाहिजे तर "गरीबांना" हा शब्द गरिबांना असा पाहिजे. त्यासाठी

खूना खुना

गरीबा गरिबा

अशा दोन नोंदी कराव्या लागतील. यात गंमत अशी आहे की मूळ शब्द दीर्घच पाहिजे म्हणून

_खुन_ _खून_

_गरीब_ _गरीब_

अशाही दोन नोंदी लागतील. या नियमात बसणारे आणखी बरेच शब्द आहेत जे वर दिलेल्या पानावर उपलब्ध आहेत. प्रश्न असा आहे इतकी मोठी यादी बॉटला झेपणार आहे का? काही अनपेक्षित चुका झाल्यास त्या कशा सुधारणार? Shantanuo (चर्चा) १८:४१, ४ एप्रिल २०२२ (IST)Reply

चुकांबद्दल बोलायचे झाले तर, मी काही दिवसांपूर्वीच विकिपीडिया:धूळपाटी/KiranBOT II हे पान तयार केले. आपण तिथे काहीपण प्रयोग करू शकतो. खात्री झाल्यावरच लेख नामविश्वात संपादने सुरु करता येतील. तुमच्या यादीत सध्या ३५८ entries आहेत, तर आपल्या source code मध्ये जवळपास १६४ आहेत. मला वाटते एकच मोठी file/यादी करण्यापेक्षा वेगळ्या-वेगळ्या files करणे सोयीस्कर जाईल. पण दुसऱ्या (defualt व्यतिरिक्त) file ला कॉल कसा करावा हे मला माहित नाही, ते मी लवकरच बघतो. मी लवकरच तुम्हाला ह्याच पानावर bot ची तांत्रिक माहिती देईल (आज रात्री किंवा उद्या). जर वेगळ्या files शक्य नसतील तर त्याच एका file मधे वेग-वेगळे sections करावे लागतील. वर _गरीब_ च्या दोन्ही entries सारख्याच झाल्यात. —usernamekiran (talk) १९:००, ५ एप्रिल २०२२ (IST)Reply

"नोएल टाटा" या लेखात ४ एप्रिल रोजी कारकिर्दीची हा शब्द बदलून कारकीर्दीची असा केला आहे. माझ्यामते हे चूक असून खालील बदल करावेत.

_कारकिर्द_ > _कारकीर्द_

कारकीर्दी > कारकिर्दी

संदर्भः विकिपीडिया:चावडी/इतर_चर्चा/जुनी_चर्चा_७#सांगकाम्याने_केलेले_बदल Shantanuo (चर्चा) १०:१४, ६ एप्रिल २०२२ (IST)Reply

टिपा की टीपा?

संपादन

क्रिकेटवरील लेखांच्या सोर्स कोडमध्ये टीपा व टिपा असे दोन शब्द वापरलेले दिसत आहेत. उदा. भारतीय_क्रिकेट_संघाचा_ऑस्ट्रेलिया_दौरा,_२०२०-२१ या लेखात...

टिपा = सामन्याला प्रथम-श्रेणी दर्जा देण्यात आला.

टीपा = विश्वचषक सुपर लीग गुण : ऑस्ट्रेलिया‌ - १०, भारत- ०

अर्थात हे शब्द सोर्स कोडमध्ये असल्यामुळे वाचकांना काहीच फरक पडत नाही. पण या दोनपैकी एक शब्द नक्की केल्यास स्क्रीप्ट वगैरे लिहिणाऱ्यांना ते सोयीचे होईल असे मला वाटते. व्याकरणाप्रमाणे पहिला टिपा बरोबर आहे. येथे ते टीप या शब्दाचे बहुवचन असेल असे गृहीत धरले आहे. Shantanuo (चर्चा) १३:०६, ५ एप्रिल २०२२ (IST)Reply

Corrections as per Rule 5.1

संपादन

मराठीतील तत्सम इ-कारान्त आणि उ-कारान्त शब्द दीर्घान्त लिहावेत. इतर शब्दांच्या अंती येणारा इकार व उकार दीर्घ लिहावा. शुद्धलेखनाचे_नियम#नियम५.१

व्यक्तिनामे, ग्रंथनामे, शीर्षके व सुटे ऱ्हस्वान्त तत्सम शब्द मराठीत दीर्घान्त लिहावेत. शुद्धलेखनाचे_नियम#नियम५.३

खाली दिलेल्या रेग्युलर एक्स्प्रेशनमध्ये थोडी जरी गफलत झाली तरी विकीचे भरून न येणारे नुकसान होईल हे लक्षात घ्या.

ि(\ |\n|\?|\!|\-|\[|\]|\(|\)|\/|$) > ी

ु(\ |\n|\?|\!|\-|\[|\]|\(|\)|\/|$) > ू

Even a minor change in the regex mentioned above may ruin wiki. You have been warned.

आणि, नि (rule 5.4), प्रति, तथापि (rule 5.2) हे शब्द नियमाप्रमाणे ऱ्हस्वच आहेत. ते बॉटद्वारे दीर्घ करता येणार नाहीत. हि हा शब्द आपण रूल १७ प्रमाणे दीर्घ केलाच आहे. तसेच बहुतांश संस्कृत शब्द ऱ्हस्वान्त असतात उदा. कटपयादि, नेति, नास्ति तर बहुतांश इंग्रजी शब्द देखील ऱ्हस्वान्त लिहिले जातात. वास्तविक मराठीच्या नियमाप्रमाणे ते दीर्घान्त लिहिणे आवश्यक आहे पण हा नियम लोकांच्या गळी उतरवणे अशक्य आहे. त्यामुळे दि, व्हि, बि, लि, हे व इतर ऱ्हस्व शब्द मान्य करण्यावाचून गत्यंतर नाही. तात्पर्य - रेग्युलर एक्स्प्रेशन वापरून ऱ्हस्वान्त शब्द दीर्घान्त करणे शक्य नाही. Shantanuo (चर्चा) ११:१०, १८ एप्रिल २०२२ (IST)Reply

(प्रस्तावित) नियम १९

संपादन

विभक्ती प्रत्यय शब्दाच्या सामान्यरूपाला जोडून लिहावे. (हिंदीसारखे) वेगवेगळे लिहू नये. उदा. "मारुती चा" असे न लिहिता "मारुतीचा" असे अखंड लिहावे.

असा काही नियम अस्तित्वात नाही. पण हल्ली मोठ्या प्रमाणावर असे लेखन दिसत असल्यामुळे खाली दिलेले बदल करावेत.

  1. "_च_" > "च_"
  2. "_ला_" > "ला_"
  3. "_चा_" > "चा_"
  4. "_ची_" > "ची_"
  5. "_चे_" > "चे_"
  6. "_च्या_" > "च्या_"
  7. "_स_" > "स_"
  8. "_त_" > "त_"
  9. "_हून_" > "हून_"
  10. "_ना_" > "ना_"
  11. "_नो_" > "नो_"

ह्याचा अर्थ असा की "चा" हा शब्द सुटा / एकटा आढळला तर त्याच्या आधीची स्पेस काढून आधीच्या शब्दाशी जोडून घ्यावा. "ही", "ने" आणि "शी" हे प्रत्यय सुटे शब्द म्हणूनही वापरले जातात त्यामुळे वरील यादीत घेतलेले नाहीत. "ही" हा शब्द तर बऱ्याचदा येतो. पण "ने" (नेणे चे आज्ञार्थी रूप) आणि "शी" (मराठी हगी या अर्थाने आणि इंग्रजी she मराठीत लिहिताना) फार कमी वेळा वापरले गेले आहेत, तेव्हा ते शब्द देखील घ्यावेत असे मला वाटते.

"_ने_" > "ने_"

"_शी_" > "शी_"

"बाळ" सारख्या क्वचित दोन-चार पानांवर अनपेक्षित बदल झाले तर त्याचा बाऊ न करता ती पाने सुधारून घ्यावीत. इतर शेकडो पाने बॉटद्वारे बदलली जाणार आहेत हा लाभ मोठा आहे.

आणखी एक नोंद "_नी_" > "नी_" अशी करता आली असती. पण नियम ५.४ मध्ये देखील तो शब्द असून तिथे आपण तो ऱ्हस्व करणार आहोत ('_नी_' > '_नि_'). "मुलां नी खेळा" या वाक्यात शब्द जोडून "मुलांनी" असा झाला पहिजे तर "मुले नी मुली" यात तो ऱ्हस्व झाला पाहिजे "मुले नि मुली" असा. माझ्यामते ५.४ मधील नियमानुसार न चालता ह्या नियमानुसार हा शब्द चालवावा. कारण विकीवर [ [ मधु लिमये| मधु लिमयें] ] नी आवाज उठविला अशा संदर्भात "नी" वापरलेला दिसतो. सर्वांना हा युक्तिवाद मान्य असेल तर खालील नोंद ठेवावी. नाहीतर दोन्हीकडील नोंदी काढून टाकाव्या.

"_नी_" > "नी_"

Shantanuo (चर्चा) १२:४७, १० एप्रिल २०२२ (IST)Reply

@Shantanuo: "मुले नि मुली" अशा ठिकाणी वेलांटी दीर्घ सुद्धा होईल, आणि "मुलेनी" असं रूपांतर होईल. bot ची संपादने डिफॉल्ट "अलीकडचे बदल" मध्ये दिसत नाहीत. आणि तसेही मराठी विकिपीडिया वर खऱ्या अर्थाने सक्रिय असणारे संपादक खूप कमी आहेत. जर एखादी चूक आपल्या नजरेतून राहून गेली, तर महिनो न महिने ती तशीच राहण्याची दाट शक्यता आहे. पण मी पूर्वी म्हटल्याप्रमाणे स्क्रिप्ट मध्ये नवीन शब्द टाकला नाही तर ५ ते १० बदल मुश्किलीने होतात. जर आपण एकच जास्त खात्री नसणारा शब्द टाकला, तर edits खूप कमी होतील, व आपल्याला प्रत्येक एडिट वैयक्तिकरित्या पडताळून बघता येतील. दोन्हीकडील दोन्ही म्हणजे कुठल्या? —usernamekiran (talk) २२:१२, १३ एप्रिल २०२२ (IST)Reply
"मुले नि मुली" चे "मुलेनी मुली” असे रुपांतर कसे होईल ते मला समजले नाही. आपण धूळपाटीवर हे करून दाखवू शकता का? बॉटचे बदल तपासण्यासाठी देखील मॅनपॉवर नाही अशी स्थिती असेल तर लेख प्रत्यक्ष एडिट करून शुद्धलेखन तपासण्याएवढी मॅनपॉवर मराठी विकीवर येण्यास किती काळ लागेल? बॉटने प्रमाणलेखन सुधारणे हा एकच मार्ग मला सध्यातरी दिसत आहे. इतर सदस्यांनी काहीच प्रतिक्रिया व्यक्त केली नाही तर त्यांचा पाठिंबा आहे असे गृहीत धरता येते. wikipedia हा work in progress प्रोजेक्ट असून १००% परफेक्शनचा आग्रह न धरणे हा त्याचा पाया आहे!
माझ्यामते रेग्युलर एक्स्प्रेशनवाले एक/दोन अक्षरी लहान नवीन शब्द (म्हणजे स्पेस _ असलेले) सध्या घेऊ नयेत. कारण त्यात जोखीम जास्त असते. (त्यात ह्या विभागातील शब्द देखील येतात. ते तात्पुरते स्थगित ठेवावे), पण इतर मोठे शब्द जसे शारिरीक > शारीरिक किंवा नागरीक > नागरिक अवश्य बदलावेत कारण त्यात अनपेक्षित चुका होण्याचे प्रमाण नगण्य असते. Shantanuo (चर्चा) १०:१९, १४ एप्रिल २०२२ (IST)Reply
"तुझं नि माझं" हे शब्द "तुझंनी माझं" असे बदलले गेले आहेत. ते सुधारावेत. "तुझंनी" > "तुझं नि" ही नोंद स्क्रिप्टमध्ये करावी. Shantanuo (चर्चा) १४:५४, २० मे २०२२ (IST)Reply

इंग्रजी कोलनचा मराठी कोलन

संपादन

बेसिक्स, भाग २ (स्टार ट्रेकःव्हॉयेजर मालिका) या लेखातील इंग्रजी कोलन बदलून देवनागरी विसर्ग झाला. मी दिलेल्या यादीत ट्रेक: असा काही शब्द नाही, पण कः असा शब्द आहे. तो "क" शब्दाच्या सुरुवातीला असला तरच हा बदल अपेक्षित आहे. म्हणून रेग्युलर एक्स्प्रेशन वापरावे ...

  1. ^क: → कः
  2. ^नि: → निः
  3. ^य: → यः
  4. ^हु: → हुः

जर regex चालत नसेल तर पुढील शब्दाचे पहिले अक्षर वापरावे.

  1. क:प > कःप
  2. नि:प > निःप
  3. नि:क्ष > निःक्ष
  4. नि:श > निःश
  5. नि:श्व > निःश्व
  6. नि:स > निःस
  7. य:क > यःक
  8. सद्य:स्थिती > सद्यःस्थिती

ही माझ्याकडून घडलेली अनपेक्षित चूक असून मी नक्कीच अधिक काळजी घेईन. :( Shantanuo (चर्चा) १०:४३, ११ एप्रिल २०२२ (IST)Reply

अशी चूक होण्याची शंका मला आधीच आली होती, पण शक्यता खूप कमी वाटली होती. तशा शक्यता बऱ्याच आहेत. उदा: "हायड्रोक्लोरिक ऍसिडचे उपयोग पुढील प्रमाणे:" "आहेत:" "होते:" "उदा:"
मी सध्यापुरता colon section डिसेबल केलाय. सर्व शक्यता/possibilities चे regex तयार केल्यानंतर पुन्हा सुरु करता येईल. पण कधी कधी वाटते कि कोलन विसर्गामध्ये बदलण्याची मोठी आवश्यकता नाहीये. म्हणजे, ती उकार किंवा वेलांटीसारखी द्रुश्य चूक नाहीये. —usernamekiran (talk) २१:०४, ११ एप्रिल २०२२ (IST)Reply

तुम्ही दिलेल्या उदाहरणांपैकी कोणताच कोलन विसर्गात बदलला जाणार नाही. कारण "णे:", "ते:", "दा:" असे शब्द आपल्या स्क्रिप्टमध्ये कुठे आहेत? "त:" ने शेवट होणारे बरेच शब्द असले तरी त्यातला कोणताच शब्द "आहेत:" बरोबर न जुळल्यामुळे तो देखील बदलला जाणार नाही. हवे तर तुम्ही ते शब्द धूळपाटीवर ठेवून पाहू शकता. आपण सर्व कोलन विसर्गात बदललेले नाहीत. गुगलमध्ये शोधताना विसर्गासहित "दुःशासन site:mr.wikipedia.org" असा शोध घेतला तर अगदी योग्य पाने दिसतील, पण कोलनवाल्या "दु:शासन site:mr.wikipedia.org" शोधात "शासन" शब्दाशी संबंधित पाने देखील दिसतील. विकीवरील लिखाण ओपन सोर्स लायसन्सखाली उपलब्ध असल्यामुळे ते विविध प्रकारे वापरले जाते. युनिकोडचे (आणि शुद्धलेखनाचे) सर्व नियम पाळले गेले तर त्याची विश्वासार्हता वाढेल. म्हणून हे महत्त्वाचे आहे. जुन्या चुका सुधारताना नव्या चुका होऊ नयेत ही अपेक्षा बरोबर आहे. पण बॉटने झालेल्या चुका शोधणे आणि सुधारणे शक्य आणि सोपे असते कारण त्यात एक पॅटर्न असतो.

"मन: → मनः" ही नोंद करताना मला मनःकामना, मनःचक्षू, मनःपूत, मनःपूर्वक, मनःशक्ती, मनःशांती, मनःसंतोष, मनःस्थिती, मनःस्फूर्ती असे शब्द अपेक्षित होते. कॅमेरामनः ही शक्यता आता दिसल्यावर लक्षात आली ! मन शब्दाच्या आधी स्पेस दिली असती तर ही नोंद अशी दिसली असती. "_मन:" > "_मनः" आता मन शब्दाने सुरू होणारे शब्दच फक्त बदलले जातील. पण "य: → यः" यात स्पेस वापरता येणार नाही कारण मग सद्य:स्थिती हा शब्द बदलला जाणार नाही. यःकश्चित हा शब्द यःकश्‍चित असाही लिहिला जातो. म्हणून या बाबतीत खाली दिलेल्या दोन नोंदी वापरता येतील.

य:क > यःक

य:स > यःस

विसर्गाचा पूर्ण सेक्शन सुधारून खाली देत आहे. स्पेससाठी _ वापरला आहे तर काही ठिकाणी विसर्गानंतर एक अक्षर वाढविले आहे.

  1. विशेषत: → विशेषतः
  2. अक्षरश: → अक्षरशः
  3. "_अंत:" → "_अंतः"
  4. "_अध:" → "_अधः"
  5. इत:पर → इतःपर
  6. इतस्तत: → इतस्ततः
  7. पूर्णत: → पूर्णतः
  8. "_उ:" → "_उः"
  9. "_उं:" → "_उंः"
  10. "_उच्चै:" → "_उच्चैः"
  11. उभयत: → उभयतः
  12. "_उष:" → "_उषः"
  13. "_क:प" → "_कःप"
  14. "_चतु:" → "_चतुः"
  15. "_छंद:" → "_छंदः"
  16. "_छि:_" → "_छिः_"
  17. "_छु:_" → "_छुः_"
  18. "_तप:" → "_तपः"
  19. "_तेज:" → "_तेजः"
  20. "_थु:_" → "_थुः_"
  21. दु:ख → दुःख
  22. दु:श → दुःश
  23. दु:स → दुःस
  24. "_नि:" → "_निः"
  25. परिणामत: → परिणामतः
  26. "_पुन:" → "_पुनः"
  27. पुर:स → पुरःस
  28. "_प्रात:" → "_प्रातः"
  29. "_बहि:" → "_बहिः"
  30. बहुश: → बहुशः
  31. "_मन:" → "_मनः"
  32. य:क → यःक
  33. य:स → यःस
  34. यश: → यशः
  35. "_रज:" → "_रजः"
  36. "_वक्ष:स" → "_वक्षःस"
  37. वस्तुत: → वस्तुतः
  38. व्यक्तिश: → व्यक्तिशः
  39. शब्दश: → शब्दशः
  40. संपूर्णत: → संपूर्णतः
  41. "_सद्य:क" → "_सद्यःक"
  42. "_सद्य:स" → "_सद्यःस"
  43. "_स्वत:" → "_स्वतः"
  44. स्वभावत: → स्वभावतः
  45. "_हु:_" → "_हुः_"
  46. अंतिमत: → अंतिमतः
  47. अंशत: → अंशतः

Shantanuo (चर्चा) १०:३०, १२ एप्रिल २०२२ (IST)Reply

@Shantanuo: माझ्याकडून तो गैरसमज झाला, हे मला काल रात्री लक्षात आले होते, मी आत्ता ते म्हणणार होतो, पण वर तुम्हीच ते बोलून दाखवले. झालेल्या गोंदळाबद्दल व गैरसोयीबद्दल क्षमस्व. —usernamekiran (talk) २१:२०, १२ एप्रिल २०२२ (IST)Reply

बॉटकडून होणाऱ्या चुकांत एक विशिष्ट पॅटर्न असतो व तो शोधणे सहज शक्य असते. उदाहरणार्थ, कॅमेरामनः या शब्दात झालेला चुकीचा बदल लक्षात आल्यावर मी grep "मन:" backup.txt अशी कमांड देऊन इतर शब्द (जर्मन/ रोमन) शोधले. तसेच कः या शब्दातील नको असलेले बदल पुढे देत आहे.

  1. जर्मनः > जर्मन:
  2. रोमनः > रोमन:
  3. ट्रेकः > ट्रेक:
  4. प्रशिक्षकः > प्रशिक्षक:
  5. लेखकः > लेखक:
  6. प्रकाशकः > प्रकाशक:
  7. व्यवस्थापकः > व्यवस्थापक:
  8. नाणेफेकः > नाणेफेक:
  9. संपादकः > संपादक:
  10. दिनांकः > दिनांक:
  11. आयोजकः > आयोजक:
  12. दिग्दर्शकः > दिग्दर्शक:
  13. स्थानकः > स्थानक:
  14. क्रमांकः > क्रमांक:

एक नवीन सेक्शन "corrections” नावाचा तयार करून त्यात हे शब्द ठेवावेत. Shantanuo (चर्चा) ०९:४४, १५ एप्रिल २०२२ (IST)Reply

क, मन याचबरोबर य या अक्षरानंतर कोलन आलेले बरेच शब्द आहेत. उदा. सदस्य:
बॉटद्वारे झालेले बदल पुन्हा पूर्वपदावर आणण्यासाठी खाली दिलेल्या फक्त दोन नोंदी "corrections" विभागात ठेवाव्यात.
# कः > क:
# यः > य:
त्याव्यतिरिक्त मन शब्दाच्या खालील दोन नोंदी घ्याव्या लागतील कारण त्यातही पाच - दहा पाने आहेत.
# जर्मनः > जर्मन:
# रोमनः > रोमन:
ह्या चार सुधारणा सोडल्या तर बाकी सर्व बदल बरोबर आहेत याची मी बॅकअपमधून खात्री करून घेतली आहे. अर्थात हे काम मला या आधी देखील करता आले असते. पण अशा विविध शक्यतांची पुरेशी कल्पना नव्हती आणि (अति) आत्मविश्वास ही दोन कारणे या चुकीमागे आहेत. 'य' वरून यःकश्चित आणि 'क' वरून कःपदार्थ हे दोनच विसर्गवाले शब्द कोशात मिळाले. विकीवर हे दोन शब्द दोन-तीन वेळाच वापरले गेले आहेत. त्यामुळे या दोन नोंदींची मुळात गरज नव्हती असे आता वाटते. Shantanuo (चर्चा) ०९:५७, १६ एप्रिल २०२२ (IST)Reply

वर दिलेली विसर्गाची सुधारित यादी वापरात आहे की जुनी यादीच अजून चालू आहे? खाली दिलेले शब्द देखील घ्यावेत असे मला वाटते.

  1. अंतत: > अंततः
  2. जन्मत: > जन्मतः
  3. तत्त्वत: > तत्त्वतः
  4. निसर्गत: > निसर्गतः
  5. प्रथमत: > प्रथमतः
  6. प्रात: > प्रातः
  7. बाह्यत: > बाह्यतः
  8. मुख्यत: > मुख्यतः
  9. मूलत: > मूलतः
  10. मूळत: > मूळतः
  11. विशेषत: > विशेषतः
  12. संभाव्यत: > संभाव्यतः
  13. सर्वसाधारणत: > सर्वसाधारणतः
  14. साधारणत: > साधारणतः
  15. सामान्यत: > सामान्यतः

अंततः, बाह्यतः यासारखे शब्द फार क्वचित वापरले गेले आहेत. हे मला माहीत आहे आणि तरी देखील या यादीत ते शब्द ठेवले आहेत कारण पुढे भविष्यात ते शब्द येऊ शकतात, त्यावेळी हाच अभ्यास परत करायला नको! Shantanuo (चर्चा) १३:१७, १६ मे २०२२ (IST)Reply

'मुलतः' आणि 'व्यक्तीशः' या दोन शब्दात सुधारणा करता येतील तर एक शब्द 'क्रमशः' टाकावा लागेल.

  1. क्रमश: > क्रमशः
  2. मुलत: > मूलतः
  3. मुलतः > मूलतः
  4. व्यक्तीश: > व्यक्तिशः
  5. व्यक्तीशः > व्यक्तिशः

मला जसजसे शब्द मिळत आहेत तसे मी लिहून ठेवत आहे. Shantanuo (चर्चा) १४:२८, १६ मे २०२२ (IST)Reply

खाली दिलेल्या शब्दांमध्ये विसर्ग नव्हे तर इंग्रजी कोलन दिला गेला पाहिजे.

  1. आहेः > आहे:
  2. आहेतः > आहेत:
  3. लेखनावः > लेखनाव:
  4. सामनाः > सामना:
  5. तमिळः > तमिळ:
  6. शकतातः > शकतात:
  7. खालीलप्रमाणेः > खालीलप्रमाणे:

दोन्ही शब्द सारखे दिसत असले तरी ते वेगळे आहेत. कः > क: असा बदल केला नसेल तर तो देखील करता येईल. Shantanuo (चर्चा) १४:५८, १६ मे २०२२ (IST)Reply

विसर्गाचा section बऱ्याच दिवसांपूर्वी disable केला होता, तो अजूनही disabledच आहे. अजून एक म्हणजे, काही लेखांमध्ये "विकिपीडिया:अबक" असा मजकूर होता. एका लेखामध्ये मला redlink सापडली होती, कोलन टाकला असता लिंक दुरुस्त झाली. तुमच्या मताशी मी सहमत आहे. आत्ता चुका कमी असतील, किंवा नसतीलही तरी माझ्या मते आपण पूर्ण संभाव्य चुका स्क्रिप्ट मध्ये टाकून ठेवायला पाहिजे. असंही bot दररोज ज्या ५ ते १० चुका दुरुस्त करतो त्या चुका प्रत्येक दिवशी नव्यानेच झाल्येल्या असतात. —usernamekiran (talk) २३:२६, १६ मे २०२२ (IST)Reply

तत्त्व आणि नेतृत्व

संपादन

तत्त्व आणि महत्त्व अशा शब्दात दोन 'त' आहेत. पण नेतृत्व आणि हिंदुत्व अशा शब्दात एकच 'त' आहे. खाली दिलेले चुकीचे शब्द वारंवार वापरले जातात. ते बॉटनेच बदलावे लागतील.

  1. तत्व > तत्त्व
  2. तात्विक > तात्त्विक
  3. सत्व > सत्त्व
  4. सात्विक > सात्त्विक
  5. महत्व > महत्त्व
  6. व्यक्तिमत्व > व्यक्तिमत्त्व
  7. अस्तित्त्व > अस्तित्व
  8. नेतृत्त्व > नेतृत्व
  9. सदस्यत्त्व > सदस्यत्व
  10. हिंदुत्त्व > हिंदुत्व
  11. प्रभुत्त्व > प्रभुत्व
  12. प्रभूत्व > प्रभुत्व
  13. मुख्यत्त्व > मुख्यत्व

सत्व शब्द बदलून सत्त्व असा झाला की खाली दिलेले दोन शब्द पुन्हा बदलून पूर्वपदावर आणावे लागतील. कारण बुद्ध धर्माशी संबंधित लेखात ते तसेच लिहावे लागतील.

बोधिसत्त्व > बोधिसत्व

बोधीसत्व > बोधिसत्व

Shantanuo (चर्चा) १३:१७, ११ एप्रिल २०२२ (IST)Reply

_सत्व_ > _सत्त्व_ ही नोंद असेल तर बोधिसत्व बदलणे टळेल. आपण असंही सात्विक > सात्त्विक घेतच आहोत. सत्व ला space न देण्याचं काही इतर कारण आहे का? —usernamekiran (talk) २२:१९, १३ एप्रिल २०२२ (IST)Reply
हो आहे. त्यामुळे जीवनसत्त्व, सत्त्वशील, सत्त्वपरीक्षा असे शब्द देखील मॅच होतील. Shantanuo (चर्चा) ०९:४४, १४ एप्रिल २०२२ (IST)Reply
added —usernamekiran (talk) १५:४०, १९ एप्रिल २०२२ (IST)Reply

पररूप संधी - इक प्रत्यय

संपादन

नगर + इक = नागर + इक = नागरिक

पहिल्या तत्सम शब्दाच्या पहिल्या अक्षराची वृद्धी होते आणि दुसऱ्या (पर) शब्दाचा स्वर येतो.

wrong > correct

  1. अंतरीक > आंतरिक
  2. अत्याधीक > अत्याधिक
  3. अधिकाधीक > अधिकाधिक
  4. अधीक > अधिक
  5. अध्यात्मीक > आध्यात्मिक
  6. अनामीक > अनामिक
  7. अनुनासीक > अनुनासिक
  8. अनौपचारीक > अनौपचारिक
  9. अलंकारीक > अलंकारिक
  10. आण्वीक > आण्विक
  11. आंतरीक > आंतरिक
  12. आधुनीक > आधुनिक
  13. आध्यात्मीक > आध्यात्मिक
  14. आयुर्वेदीक > आयुर्वेदिक
  15. आर्थीक > आर्थिक
  16. इस्लामीक > इस्लामिक
  17. ऐच्छीक > ऐच्छिक
  18. ऐतिहासीक > ऐतिहासिक
  19. ऐतीहासीक > ऐतिहासिक
  20. ऐहीक > ऐहिक
  21. औद्योगीक > औद्योगिक
  22. औपचारीक > औपचारिक
  23. औष्णीक > औष्णिक
  24. कायीक > कायिक
  25. काल्पनीक > काल्पनिक
  26. कौटुंबीक > कौटुंबिक
  27. चमत्कारीक > चमत्कारिक
  28. जागतीक > जागतिक
  29. जैवीक > जैविक
  30. तात्कालीक > तात्कालिक
  31. तांत्रीक > तांत्रिक
  32. तात्वीक > तात्त्विक
  33. तार्कीक > तार्किक
  34. तौलनीक > तौलनिक
  35. दैवीक > दैविक
  36. दैहीक > दैहिक
  37. धार्मीक > धार्मिक
  38. नागरीक > नागरिक
  39. नावीक > नाविक
  40. नैतीक > नैतिक
    नैतीक > नैतिक
  41. नैसर्गीक > नैसर्गिक
  42. न्यायीक > न्यायिक
  43. परीवारीक > पारिवारिक
  44. पारंपरीक > पारंपरिक
  45. पारंपारीक > पारंपारिक
  46. पारितोषीक > पारितोषिक
  47. पारिवारीक > पारिवारिक
  48. पैराणीक > पौराणिक
  49. पौराणीक > पौराणिक
  50. पौष्टीक > पौष्टिक
  51. प्रमाणीक > प्रामाणिक
  52. प्राकृतीक > प्राकृतिक
  53. प्रांतीक > प्रांतिक
  54. प्राथमीक > प्राथमिक
  55. प्रादेशीक > प्रादेशिक
  56. प्रामाणीक > प्रामाणिक
  57. प्रायोगीक > प्रायोगिक
  58. प्रारंभीक > प्रारंभिक
  59. प्रासंगीक > प्रासंगिक
  60. बौद्धीक > बौद्धिक
  61. भावनीक > भावनिक
  62. भावीक > भाविक
  63. भाषीक > भाषिक
  64. भौगोलीक > भौगोलिक
  65. भौमितीक > भौमितिक
  66. माध्यमीक > माध्यमिक
  67. मानसीक > मानसिक
  68. मार्मीक > मार्मिक
  69. मासीक > मासिक
  70. मौखीक > मौखिक
  71. यांत्रीक > यांत्रिक
  72. यौगीक > यौगिक
  73. रसायनीक > रासायनिक
  74. राजसीक > राजसिक
  75. लिपीक > लिपिक
  76. लैंगीक > लैंगिक
  77. लौकीक > लौकिक
  78. वयैक्तीक > वैयक्तिक
  79. वय्यक्तीक > वैयक्तिक
  80. वार्षीक > वार्षिक
  81. वास्तवीक > वास्तविक
  82. वैकल्पीक > वैकल्पिक
  83. वैचारीक > वैचारिक
  84. वैज्ञानीक > वैज्ञानिक
  85. वैदीक > वैदिक
  86. वैधानीक > वैधानिक
  87. वैमानीक > वैमानिक
  88. वैयक्तीक > वैयक्तिक
  89. वैवाहीक > वैवाहिक
  90. वैश्वीक > वैश्विक
  91. व्याकरणीक > व्याकरणिक
  92. व्यावसायीक > व्यावसायिक
  93. व्यावहारीक > व्यावहारिक
  94. शाब्दीक > शाब्दिक
  95. शारिरीक > शारीरिक
  96. शारीरीक > शारीरिक
  97. शैक्षणीक > शैक्षणिक
  98. शैक्षीणीक > शैक्षणिक
  99. संगीतीक > सांगीतिक
  100. सपत्नीक > सपत्निक
  101. समूदायीक > सामुदायिक
  102. सयुक्तीक > सयुक्तिक
  103. संयुक्तीक > संयुक्तिक
  104. सयूक्तीक > सयुक्तिक
  105. सर्वाधीक > सर्वाधिक
  106. संविधानीक > सांविधानिक
  107. संसारीक > सांसारिक
  108. संस्कृतीक > सांस्कृतिक
  109. संस्थानीक > संस्थानिक
  110. सांकेतीक > सांकेतिक
  111. सांख्यीक > सांख्यिक
  112. सांगितीक > सांगीतिक
  113. सांगीतीक > सांगीतिक
  114. सात्वीक > सात्विक
  115. साप्ताहीक > साप्ताहिक
  116. सामाजीक > सामाजिक
  117. सामायीक > सामायिक
  118. सामुदायीक > सामुदायिक
  119. सामुहीक > सामूहिक
  120. सामूहीक > सामूहिक
  121. सार्वजनीक > सार्वजनिक
  122. सार्वत्रीक > सार्वत्रिक
  123. सांसारीक > सांसारिक
  124. सांस्कृतीक > सांस्कृतिक
  125. साहित्यीक > साहित्यिक
  126. सिद्धांतीक > सैद्धांतिक
  127. स्थानीक > स्थानिक
  128. स्थायीक > स्थायिक
  129. स्फटीक > स्फटिक
  130. स्वभावीक > स्वाभाविक
  131. स्वाभावीक > स्वाभाविक
  132. स्वस्तीक > स्वस्तिक
  133. हार्दीक > हार्दिक

Shantanuo (चर्चा) १४:३२, १३ एप्रिल २०२२ (IST)Reply

एकदाच भरपूर edits होऊ नयेत म्हणून मी ४० शब्द add केले. मला वर "नैतीक > नैतिक" अशा सारख्या दोन entries दिसत आहेत. त्यामध्ये काही फरक आहे का? माझ्या browser वर दोन्ही सारख्याच दिसत आहेत. मी सध्यापुरती फक्त पहिली entry घेतली. —usernamekiran (talk) ००:३०, २१ एप्रिल २०२२ (IST)Reply
तो शब्द नजरचुकीने दोन वेळा टाईप झाला. सुधारून घेतल्याबद्दल धन्यवाद. Shantanuo (चर्चा) ११:४३, २१ एप्रिल २०२२ (IST)Reply
मला वाटते "corrections" विभागात खालील तीन नोंदी घ्याव्या लागतील.
# प्रामाणिकरण > प्रमाणीकरण
# प्रमाणिकरण > प्रमाणीकरण
# प्रामाणिकिकरण > प्रामाणिकीकरण
Shantanuo (चर्चा) १०:१५, ३० एप्रिल २०२२ (IST)Reply

corrections as per Rule 8.9

संपादन

शक्यतो सर्व शब्दांच्या आधी आणि नंतर स्पेस द्यावी. खाली दिलेल्या दोन शब्दात ती आवश्यक आहे.

_गावून_ → _गाऊन_

_जावून_ → _जाऊन_

रागावून, समजावून, बजावून हे तीन शब्द अनुक्रमे रागाऊन, समजाऊन आणि बजाऊन असे चुकीचे बदलले जातील. उदाहरणार्थ १७ एप्रीलचा हा फरक पहा. सुबोध_जावडेकर&diff=prev&oldid=2091524 अशी पाने दोन-चारच असली तरी व्याकरणाचे नियम पाळायला हवे. 8.9 सेक्शनमध्ये किंवा "corrections" विभागात हे तीन शब्द घ्यावेत.

  1. रागाऊन > रागावून
  2. समजाऊन > समजावून
  3. बजाऊन > बजावून

Shantanuo (चर्चा) ०९:१०, १७ एप्रिल २०२२ (IST)Reply

सध्या हे तीन शब्द चुका दुरुस्ती section मध्ये आहेत. मी उद्या ते ८.९ मध्ये हलवतो. —usernamekiran (talk) १६:११, १९ एप्रिल २०२२ (IST)Reply
विषयाला सोडून एक मुद्दा: जर कोणाला चुकीचं संपादन/चूक लक्षात नाही आली तर ते तसंच राहून जाण्याची शक्यता आहे. दुसरा मुद्दा असा कि जर कोणाला लक्षात आली आणि आपल्याला न कळवता त्यांनी चूक दुरुस्त केली तर bot नंतरच्या run मध्ये तीच चूक पुन्हा करेल. त्यामुळे आपल्याकडून झालेल्या चुका/अनपेक्षित बदल आपल्याला लक्षात येणे, व इतर संपादकांनीही आपल्याला आपल्या व इतर चुका लक्षात आणून देणे, ह्या दोन्ही गोष्टी खूप महत्वाच्या आहेत. —usernamekiran (talk) १६:११, १९ एप्रिल २०२२ (IST)Reply

corrections as per दोन शब्दांमधील जागा

संपादन

जास्तीची स्पेस काढून टाकल्यानंतर काही वर्ग विस्कळित झाले आहेत. उदाहरण म्हणून हे पान पहा. इ.स._१७११&diff=prev&oldid=2079984 यातील एक वर्ग "वर्ग:इ.स.च्या १७१० च्या दशकातील वर्षे" बदलून "वर्ग:इ.स.च्या १७१०च्या दशकातील वर्षे" असा झाला. आणि हा नवीन वर्ग अस्तित्त्वात नाही. म्हणून खालील नोंदी "corrections" विभागात टाकाव्यात.

  1. ०चे > ० चे
  2. १चे > १ चे
  3. २चे > २ चे
  4. ३चे > ३ चे
  5. ४चे > ४ चे
  6. ५चे > ५ चे
  7. ६चे > ६ चे
  8. ७चे > ७ चे
  9. ८चे > ८ चे
  10. ९चे > ९ चे
  11. ०च्या > ० च्या
  12. १च्या > १ च्या
  13. २च्या > २ च्या
  14. ३च्या > ३ च्या
  15. ४च्या > ४ च्या
  16. ५च्या > ५ च्या
  17. ६च्या > ६ च्या
  18. ७च्या > ७ च्या
  19. ८च्या > ८ च्या
  20. ९च्या > ९ च्या

Shantanuo (चर्चा) १५:२९, १७ एप्रिल २०२२ (IST)Reply

त्यासोबतच "कल हो ना हो" ह्यासारखे बरेच शब्द बदलल्या गेले आहेत (कल होना हो). मला वाटते हि दुरुस्ती तात्पुरती थांबवावी, व त्यातील मोजक्या शब्दांची १०० एडिट्सची लिमिट लावून दुरुस्ती करावी. त्यामुळे कुठे काय चुकत आहे ते कळेल. पण बदल झालेले शब्द शोधणे/दुरुस्त करणे थोडे अवघड वाटत आहे. —usernamekiran (talk) १८:३४, १७ एप्रिल २०२२ (IST)Reply
वरील सर्व, व Rule 8.9 मधील ५ entries टाकल्या. एकाच वेळेस अनेक विभागांत व अनेक नियमांबद्दल चर्चा करण्यापेक्षा, मला वाटते आपण एका वेळेस एकच नियम एकाच चर्चा विभागात tackle करावा. —usernamekiran (talk) २२:३४, १७ एप्रिल २०२२ (IST)Reply
"ही दुरुस्ती तात्पुरती थांबवावी, व त्यातील मोजक्या शब्दांची १०० एडिट्सची लिमिट लावून दुरुस्ती करावी." या सूचनेशी पूर्ण सहमत आहे. "पण बदल झालेले शब्द शोधणे/दुरुस्त करणे थोडे अवघड वाटत आहे" ही अडचण खरी आहे. पुढचा बॅकअप येईपर्यंत म्हणजे पुढच्या महिन्यापर्यंत यात काहीही करता येणार नाही. "एकाच वेळेस अनेक विभागांत व अनेक नियमांबद्दल चर्चा करण्यापेक्षा, मला वाटते आपण एका वेळेस एकच नियम एकाच चर्चा विभागात tackle करावा.” ही अपेक्षा नीट कळली नाही. मला जसजसे इश्युज् मिळाले तसतसे लिहीत गेलो. वेगळी पद्धत फॉलो करावी असे वाटत असेल तर इ-मेल करून नीट समजावून द्यावे. Shantanuo (चर्चा) ०९:३५, १८ एप्रिल २०२२ (IST)Reply

"कल होना हो" सारखे आणखी काही हिंदी शब्द खाली देत आहे. ते "corrections" या विभागात ठेवावे. बहुतेक हिंदी चित्रपटांची नावे यात दिसत आहेत.

  1. होना > हो ना
  2. कहोना > कहो ना
  3. अलविदाना > अलविदा ना
  4. जानेना > जाने ना
  5. तुमना > तुम ना
  6. जिंदगीना > जिंदगी ना
  7. कभीना > कभी ना
  8. कुछना > कुछ ना

काही मराठी शब्द देखील पूर्वपदावर आणावे लागतील.

  1. आहेना > आहे ना
  2. नाहीना > नाही ना
  3. काहीना > काही ना
  4. कोणत्याना > कोणत्या ना
  5. नफाना > नफा ना
  6. कधीना > कधी ना
  7. एकना > एक ना

ही वाटते तेवढी गंभीर चूक नसावी. बॉटची आणखी एखादी चूक दाखविलीत तर मी त्या पॅटर्नचे इतर शब्द देऊ शकेन. Shantanuo (चर्चा) ०९:५७, १९ एप्रिल २०२२ (IST)Reply

चूक तेवढी गंभीर नाहीये, पण काही दुवे तुटल्या गेले आहेत. (कल हो ना हो - कल होना हो). −१ (संख्या) या लेखावरील bot ची दोन संपादने. पहिल्या संपादनात आपण सगळ्या जागा काढल्या, तर दुसऱ्या दुसऱ्या संपादनामध्ये "√−१ला" ह्यामधील जागा निघाली नाही. आपल्याला १ चे, २००० च्या, १ ला, व तत्सम pattern/variation चा विचार करावा लागेल. —usernamekiran (talk) १६:०७, १९ एप्रिल २०२२ (IST)Reply


वर दिलेल्या शब्दांमध्ये स्पेस टाकावी. उदा...

  1. _होना_ > _हो_ना_
  2. _कहोना_ > _कहो_ना_

ला हा प्रत्यय आधीच्या शब्दाला जोडून घेताना काही चुका झाल्या आहेत. उदाहणार्थ फ्रान्सचे_प्रदेश या लेखात "पेई दा ला लोआर" हे बदलून "पेई दाला लोआर" असे झाले आहे. यासाठी...

  1. _दाला_ > _दा_ला_
  2. _देला_ > _दे_ला_
  3. _डीला_ > _डी_ला_
  4. _डेला_ > _डे_ला_
  5. _झोजीला_ > _झोजी_ला_
  6. _आंदोराला_ > _आंदोरा_ला_

प्रत्येक शब्दाची पाच-दहा पाने तरी चुकीने बदलली गेली असावीत असा माझा अंदाज आहे. पण या सुधारणा लगेच करू नयेत. ह्या खरोखर बॉटच्या चुका आहेत याची मी पुढच्या बॅकअपमधून खात्री करून घेईन. पुढच्या महिन्यात या विषयावर माझा काहीच प्रतिसाद आला नाही तरी या सुधारणा अवश्य कराव्यात. Shantanuo (चर्चा) १५:३७, २० एप्रिल २०२२ (IST)Reply

"दोन शब्दांमधील जागा" या विभागात दोन नोंदी वाढवाव्यात असे मला वाटते.

  1. _. > .
  2. _, > ,

पूर्णविराम, किंवा स्वल्पविराम देण्यापूर्वी स्पेस देण्याची गरज नाही . असा पूर्णविराम किंवा , असा स्वल्पविराम दिला जात नाही तर तो आधीच्या शब्दाला जोडून, असा लिहिला जातो. Shantanuo (चर्चा) ०९:०१, २८ एप्रिल २०२२ (IST)Reply


Corrections as per Rule योग्य रकार

संपादन

बऱ्याचदा हा शब्द बर्याचदा तर तऱ्हेने हा शब्द तर्हेने असा लिहिला जातो. याचे कारण ऱ्य आणि ऱ्ह काढणे खरोखरच फार कठीण आहे. असे शब्द बदलण्यासाठी "योग्य रकार” या विभागात खालील शब्द जमा करा. तुम्ही तिथे किनार्याची → किनाऱ्याची अशी नोंद केलीच आहे. पण खालील यादीत तीच नोंद मी किनार्य >किनाऱ्य अशी केली त्यामुळे किनार्याचे → किनाऱ्याचे, किनार्याला → किनाऱ्याला अशा वेगवेगळ्या नोंदी करायची गरज नाही. अनपेक्षित शब्द मॅच होण्याचा आत्तापर्यंतच्या भीतिदायक अनुभवामुळे आपण एका वेळेला केवळ पाच-दहा शब्दच स्क्रीप्टमध्ये टाकू आणि शिवाय १०० ची लिमिट ठेवू.

  1. कुर्ह > कुऱ्ह
  2. गार्ह > गाऱ्ह
  3. गिर्ह > गिऱ्ह
  4. गुर्ह > गुऱ्ह
  5. गेर्ह > गेऱ्ह
  6. गोर्ह > गोऱ्ह
  7. चर्ह > चऱ्ह
  8. तर्ह > तऱ्ह
  9. नर्हे > नऱ्हे
  10. नोर्डर्ह > नोर्डऱ्ह
  11. बर्ह > बऱ्ह
  12. बिर्ह > बिऱ्ह
  13. बुर्ह > बुऱ्ह
  14. र्हस्व > ऱ्हस्व
  15. र्हाइन > ऱ्हाइन
  16. र्हाईन > ऱ्हाईन
  17. र्हास > ऱ्हास
  18. र्हाड > ऱ्होड
  19. र्होन > ऱ्होन
  20. वर्ह > वऱ्ह
  21. कादंबर्य > कादंबऱ्य
  22. किनार्य > किनाऱ्य
  23. कोपर्या > कोपऱ्या
  24. खर्या > खऱ्या
  25. खोर्य > खोऱ्य
  26. झर्य > झऱ्य
  27. दौर्य > दौऱ्य
  28. धिकार्य > धिकाऱ्य
  29. नवर्य > नवऱ्य
  30. पांढर्या > पांढऱ्या
  31. पायर्या > पायऱ्या
  32. फेर्या > फेऱ्या
  33. बर्या > बऱ्या
  34. वार्य > वाऱ्य
  35. शेतकर्य > शेतकऱ्य
  36. सार्य > साऱ्य
  37. अपुर्य > अपुऱ्य
  38. इशार्य > इशाऱ्य
  39. उतार्य > उताऱ्य
  40. कचर्य > कचऱ्य
  41. कर्मचार्य > कर्मचाऱ्य
  42. कष्टकर्य > कष्टकऱ्य
  43. कॅमेर्य > कॅमेऱ्य
  44. गाभार्य > गाभाऱ्य
  45. गावकर्य > गावकऱ्य
  46. गोर्य > गोऱ्य
  47. चेहर्य > चेहऱ्य
  48. जबाबदार्य > जबाबदाऱ्य
  49. तार्य > ताऱ्य
  50. नोकर्य > नोकऱ्य
  51. पिंजर्य > पिंजऱ्य
  52. व्यापार्य > व्यापाऱ्य
  53. सातार्य > साताऱ्य
  54. सर्य > सऱ्य

बरेच शब्द मॅच होण्याची शक्यता असल्याने वेगळी नोंद.

  1. णार्य > णाऱ्य

Shantanuo (चर्चा) १८:५६, १८ एप्रिल २०२२ (IST)Reply

वरील यादी न वापरता खाली दिलेली यादी वापरावी.

  1. तर्ह > तऱ्ह
  2. बर्हाणपूर > बऱ्हाणपूर
  3. बुर्हाणपूर > बुऱ्हाणपूर
  4. कर्हाड > कऱ्हाड
  5. कुर्हाड > कुऱ्हाड
  6. र्हास > ऱ्हास
  7. वर्हाड > वऱ्हाड
  8. कादंबर्या > कादंबऱ्या
  9. किनार्या > किनाऱ्या
  10. कोपर्या > कोपऱ्या
  11. खर्या > खऱ्या
  12. खोर्या > खोऱ्या
  13. दौर्या > दौऱ्या
  14. धिकार्या > धिकाऱ्या
  15. नवर्या > नवऱ्या
  16. पांढर्या > पांढऱ्या
  17. पायर्या > पायऱ्या
  18. फेर्या > फेऱ्या
  19. बर्या > बऱ्या
  20. वार्या > वाऱ्या
  21. शेतकर्या > शेतकऱ्या
  22. सार्या > साऱ्या
  23. अपुर्या > अपुऱ्या
  24. उतार्या > उताऱ्या
  25. कचर्या > कचऱ्या
  26. कर्मचार्या > कर्मचाऱ्या
  27. कॅमेर्या > कॅमेऱ्या
  28. गाभार्या > गाभाऱ्या
  29. गावकर्या > गावकऱ्या
  30. गोर्या > गोऱ्या
  31. चेहर्या > चेहऱ्या
  32. जबाबदार्या > जबाबदाऱ्या
  33. तार्या > ताऱ्या
  34. नोकर्या > नोकऱ्या
  35. पिंजर्या > पिंजऱ्या
  36. व्यापार्या > व्यापाऱ्या
  37. सर्या > सऱ्या

बरेच शब्द मॅच होण्याची शक्यता असल्याने वेगळी नोंद.

णार्य > णाऱ्य

Shantanuo (चर्चा) १०:००, १७ मे २०२२ (IST)Reply

बॉटचा शब्दक्रम

संपादन

बॉट एकामागून एक अशा प्रकारे शब्द बदलत जातो का? तसे असेल तर सत्व या शब्दाच्या नंतर जर बोधिसत्त्व हा शब्द घेतला तर त्या एका शब्दासाठी वेगळा वर्ग ठेवावा लागणार नाही. प्रथम बोधिसत्व हा शब्द बोधिसत्त्व असा होईल आणि लगेच पुन्हा बोधिसत्व असा बदलला जाईल.

  1. सत्व → सत्त्व
  2. बोधिसत्त्व → बोधिसत्व

मी स्वतः कधी बॉट चालवून पाहिलेला नाही. त्यामुळे ही कल्पना व्यवहार्य आहे का ते माहीत नाही. Shantanuo (चर्चा) ०९:२८, २५ एप्रिल २०२२ (IST)Reply

@Shantanuo: थोडक्यात सांगायचे तर bot "read - find - replace - save - next page" ह्या क्रमात काम करतो. त्यामुळे तुम्ही सुचवल्याप्रमाणे बदल होणार नाहीत. याचे उदाहरण खालील "प्रमाणीकरण" विभागात योगायोगाने आलेच आहे. —usernamekiran (talk) १७:२१, ३० एप्रिल २०२२ (IST)Reply

प्रमाणीकरण

संपादन

नमस्कार. सध्या स्क्रिप्ट मध्ये वेगवेगळ्या ठिकाणी पुढील तीन entries आहेत:

  1. प्रामाणिकरण → प्रमाणीकरण
  2. प्रमाणीक → प्रामाणिक
  3. प्रामाणीक → प्रामाणिक

नुसते शब्द बघितले, तर ते योग्य आहेत. पण त्यामुळे बरेच अनैच्छिक/अवांछित बदल झालेत. त्यापैकी काही बदल इथे बघता येतील (२८, २९, व ३० तारखेची एकूण ४ संपादने). केवळ शब्दाच्या शेवटी स्पेस टाकून दुरुस्ती होणार नाही, कारण "प्रामाणिकता", "प्रामाणिकपणे", अशे काही शब्द असतीलच. —usernamekiran (talk) १७:२१, ३० एप्रिल २०२२ (IST)Reply

स्क्रिप्टमध्ये प्रमाणीक → प्रामाणिक अशी नोंद आहे त्यामुळे प्रमाणीकरण हा शब्द (चुकीने) प्रामाणिकरण असा बदलला गेला. त्यासाठी आता दोन मार्ग आहेत. एकतर प्रमाणीक → प्रामाणिक ही नोंद स्क्रिप्टमधून काढून टाका. किंवा / आणि प्रामाणिकरण > प्रमाणीकरण अशी एकच नोंद घेऊन स्क्रिप्ट पुन्हा चालवा. असा प्रकार आपण बोधिसत्व शब्दाच्या वेळी केला होता. सत्व शब्द सगळीकडे सत्त्व असा बदलून घेतला त्यानंतर बोधिसत्त्व सुधारून परत बोधिसत्व केला. अशा अपवादात्मक सुधारणा कराव्या लागतील. त्याला इलाज नाही. विकीवरील शुद्धलेखन हा खूप जुना आणि आनुवंशिक म्हणता येईल असा आजार आहे. त्यावरील उपचार दीर्घकाळ चालणारे आहेत. पेशंटची कंडिशन पाहून औषधात बदल होऊ शकतील. वैद्य चुकाही करू शकेल. आपण आत्तापर्यंत जे सहकार्य केलेत ते पुढेही कराल असा विश्वास वाटतो. पण मला माझ्या मूळ प्रश्नाचे समाधानकारक उत्तर मिळालेले नाही. जर मी स्क्रिप्टमध्ये खाली दिलेल्या दोनच नोंदी त्याच क्रमाने घेतल्या.
# प्रमाणीक → प्रामाणिक
# प्रामाणिकरण → प्रमाणीकरण
आणि माझ्या लेखात जर फक्त एकच शब्द ठेवला "प्रमाणीकरण" तर तो तसाच राहील का? याचे होय किंवा नाही असे एका शब्दात उत्तर द्यावे. Shantanuo (चर्चा) ०९:४०, २ मे २०२२ (IST)Reply


@Shantanuo: धन्यवाद, मी जोपर्यंत सक्रिय आहे, तोपर्यंत माझी वागणूक अशीच राहील :-) मी वरच्या "बॉटचा शब्दक्रम" मध्ये तुम्हाला उत्तर दिले होते, पण बहुधा त्याकडे तुमचे लक्ष गेले नसेल. तुमच्या प्रश्नाचे अगदी थोडक्यात उत्तर:
"प्रमाणीक → प्रामाणिक" मुळे प्रामाणिकरण असा बदल होईल. —usernamekiran (talk) १०:४८, ३ मे २०२२ (IST)Reply
पण त्यानंतर असणार्‍या "प्रामाणिकरण → प्रमाणीकरण" या नोंदीमुळे तो परत मूळपदावर म्हणजे प्रमाणीकरण असा होणार नाही का? धूळपाटीवर खात्री करून घ्या असे सुचविणे म्हणजे लहान तोंडी मोठा घास घेतल्यासारखे होईल. तुमचा बॉटचा अनुभव खूप मोठा आहे हे मला माहीत आहे पण या बाबतीत मला तुमचे म्हणणे चुकीचे वाटत आहे. Shantanuo (चर्चा) १२:०२, ३ मे २०२२ (IST)Reply
तुम्ही म्हणता आहात ते बहुतेक बरोबर असावे. कारण एकदा का शब्द मॅच झाला की तो प्रोग्राम लूपमधून बाहेर पडल्यामुळे पुढचा शब्द जुळण्याचा प्रश्नच उद्भवत नाही. चूक दुरूस्तीचे बोधिसत्त्व → बोधिसत्व आणि प्रामाणिकरण → प्रमाणीकरण हे शब्द स्वतंत्रपणे चालवावे लागतील. त्याच बरोबर सत्व > सत्त्व तसेच प्रमाणीक → प्रामाणिक ही नोंद रोज चालवण्याच्या स्क्रिप्टमधून काढून टाकावी लागेल. म्हणजे आपल्याला एकूण तीन स्क्रिप्ट्स ठेवाव्या लागतील. एक रोज चालविण्याची यादी, दुसरी कधीतरी म्हणजे २ – ३ महिन्यातून एकदा चालविण्याची यादी आणि या यादीमुळे झालेले अवांछित बदल दुरुस्त करणारी तिसरी यादी. :) Shantanuo (चर्चा) ०९:०६, ५ मे २०२२ (IST)Reply
दोघांच्या खात्रीसाठी आपण एकदा प्रयोग करून बघू. computers म्हणूनच नाही, सगळ्याच बाबतीत शंकेचं सुरक्षितपणे निरसन होत असेल तर ते करणं कधीही चांगलच. मी काही दिवस गावाला जातोय. परत आलो कि प्रयोग करून बघतो. —usernamekiran (talk) २२:३३, ५ मे २०२२ (IST)Reply
  • @Shantanuo: नमस्कार. तुमची शंका अगदी बरोबर होती. पानावर फक्त "प्रमाणीकरण" शब्द, आणि तुम्ही सांगितल्याप्रमाणे दोन entries ठेवल्या असता काहीच changes झाले नाहीत. पण "प्रामाणिकरण → प्रमाणीकरण" हि एन्ट्री काढली असता "प्रमाणीकरण" → "प्रामाणिकरण" असा बदल झाला. जवळपास ४ वर्षांपूर्वी अगदी ह्याच विषयावर इंग्रजी विकिपीडियावर चर्चा झाली होती, तेव्हा AWB (bot व non-bot AWB), आणि python bot ह्या दोघांचा "read - find - replace - save - exit/next page" असा क्रम होता. त्यानंतर कधीतरी बदल झाला असावा. तेव्हा bot आधी पूर्ण पान read करायचा. read process पूर्ण झाल्यावर जेवढ्या strings match झाल्या त्या बदलल्या जायच्या, एकदा read - replace झाल्यानंतर page save व्हायचे. माझ्यामुळे झालेल्या तसदीबद्दल क्षमस्व. —usernamekiran (talk) २३:११, ११ मे २०२२ (IST)Reply
तसे असेल तर फारच उत्तम. खाली दिलेले शब्द त्याच क्रमाने स्क्रिप्टमध्ये टाकायला हरकत नाही.
# प्रमाणीक → प्रामाणिक
# प्रामाणिकरण → प्रमाणीकरण
# सत्व → सत्त्व
# बोधिसत्त्व → बोधिसत्व
अवांछित शब्द बदलण्यासाठी वेगळी स्क्रिप्ट नको. आणखी एक प्रयोग करून पहायचा असेल तर त्या दोन नोंदी उलट क्रमाने स्क्रिप्टमध्ये ठेवून जर ती स्क्रिप्ट रोज चालवली तर शब्द बदलून प्रामाणिकरण असा चुकीचा शब्द मिळेल. Shantanuo (चर्चा) १०:०३, १२ मे २०२२ (IST)Reply
@Shantanuo: नमस्कार. मी वरील चार entries "experiement" section मध्ये टाकल्या आहेत. experiment section फक्त विकिपीडिया:धूळपाटी/KiranBOT II वर दुपारी २:३५ वाजता रन होतो. तुम्हाला जितक्या entries/शब्दांसोबत प्रयोग करायचे आहेत, ते कळवा, व मी त्या entries experiments section टाकतो. मी धुळपाटीवर दुसरे महायुद्ध, क्रिकेट, आणि महाराष्ट्राची अर्थव्यवस्था असे तीन लेख टाकले आहेत, त्यांमध्ये वेग-वेगळ्या प्रकारचे भरपूर शब्द आहेत. जर तुम्हाला काही टाकायचे असतील तर "blank section" नावाच्या section मध्ये टाकू शकता. पान खूप मोठे झाले आहे, त्यामुळे एक section edit करायला सोपे जाईल. —usernamekiran (talk) २२:४६, १५ मे २०२२ (IST)Reply
मला फक्त एकच प्रयोग करून हवा आहे. मी जर खाली दिलेल्या दोन नोंदी स्क्रिप्टमध्ये त्याच क्रमाने टाकल्या आणि लेखात फक्त एकच शब्द "प्रमाणीकरण" ठेवला तर तो शब्द तसाच राहील का? याचे "हो" किंवा "नाही" असे एका शब्दात उत्तर हवे आहे. ही स्क्रिप्ट चार-पाच दिवस रोज चालवून शब्दात काही बदल होत आहे का ते पहायचे आहे. तुमचे काम थोडे वाढवत आहे. पण तुम्हीच म्हटल्याप्रमाणे "सगळ्याच बाबतीत शंकेचं सुरक्षितपणे निरसन होत असेल तर ते करणं कधीही चांगलच."
# प्रामाणिकरण → प्रमाणीकरण
# प्रमाणीक → प्रामाणिक
माझ्यामते याचे उत्तर "नाही" असे येईल. पहिल्याच दिवशी "प्रमाणीकरण" चे "प्रामाणिकरण" होईल आणि नंतर दुसर्‍या/ तिसर्‍या दिवशी काही बदल न होता तो तसाच "प्रामाणिकरण" असा राहील. मग हे निश्चित होईल की स्क्रिप्टमध्ये नोंदी करताना त्यांचा क्रम निर्णायक ठरतो. नोंदीचा क्रम बदलला की त्यांचा परिणाम बदलू शकतो. Shantanuo (चर्चा) ०८:५७, १६ मे २०२२ (IST)Reply
@Shantanuo: काम/प्रयोग कितीही वाढले तरी माझी काहीच हरकत नाही :-) experiment स्क्रिप्ट धुळपाटीवर रोज दुपारी २:३५ वाजता run होते. १६ तारखेला काही बदल झाले नाही. experiment स्क्रिप्ट मध्ये काही entries टाकायच्या किंवा बदलायच्या असतील तर मला कळवा. किंवा experiment स्क्रिप्ट ची संपादनाची वेळ वाढवायची असेल तर तेही जमते. स्क्रिप्ट सध्या cron मधून run/initiate होते. —usernamekiran (talk) २२:०७, १६ मे २०२२ (IST)Reply
१६ तारखेला काही बदल झाले नाही असे आपण लिहिले आहे. पण तेव्हा शब्दांचा क्रम काय होता? पर्याय १ की पर्याय २?
पर्याय १ः
# प्रमाणीक → प्रामाणिक
# प्रामाणिकरण → प्रमाणीकरण
पर्याय २ः
# प्रामाणिकरण → प्रमाणीकरण
# प्रमाणीक → प्रामाणिक
कोणताही पर्याय वापरला तरी शब्द बदलत नाही असे आपल्याला म्हणायचे आहे का? Shantanuo (चर्चा) १०:०७, १७ मे २०२२ (IST)Reply
hypothesis: पर्याय १ वापरला तर एकाच दिवसात तर पर्याय २ वापरला तर दोन दिवसात योग्य शब्द बौद्धिक मिळेल.
पर्याय १ः
ध्द > द्ध
बौद्धीक > बौद्धिक
पर्याय २ः
बौद्धीक > बौद्धिक
ध्द > द्ध
लेखातील शब्दः बौध्दीक
माझा अंदाज बरोबर आहे का ते पाहून प्रतिसाद द्यावा. कोणत्या शब्दांमुळे गोंधळ होऊ शकतो ते या पायथॉन स्क्रिप्टमध्ये दिसू शकेल. https://github.com/shantanuo/spell_check/blob/master/substring_match_final.ipynb Shantanuo (चर्चा) ०९:५०, १८ मे २०२२ (IST)Reply
experiment/धूळपाटी स्क्रिप्ट मध्ये सध्या पुढील क्रम आहे:
  1. प्रमाणीक → प्रामाणिक
  2. प्रामाणिकरण → प्रमाणीकरण
  3. सत्व → सत्त्व
  4. बोधिसत्त्व → बोधिसत्व
—usernamekiran (talk) १२:३३, १८ मे २०२२ (IST)Reply
प्रमाण या मूळ शब्दाला इक प्रत्यय लागून "प्रामाणिक" तर त्याशिवाय "प्रमाणीकरण" असाही शब्द बनतो. त्यासारखे इतर काही शब्द शोधले. उदा. मूळ शब्द "उद्योग" असा असला तर त्यापासून "उद्योगीकरण", "औद्योगिक" (पररूप संधी-इक) आणि "औद्यौगिकीकरण" असे तीन नवे शब्द बनतील. त्या नियमात बसणारे हे आणखी काही शब्द घ्यावेत. http://mr.shoutwiki.com/wiki/Non_dict_pages_4 Shantanuo (चर्चा) १२:१३, २७ मे २०२२ (IST)Reply


कृपया त्या पाच एंट्री काढून टाकाव्यात. मी नवीन लिस्ट दिली आहे ती वापरावी. Shantanuo (चर्चा) १४:२१, १८ मे २०२२ (IST)Reply
@Shantanuo: vij naslyamule saddhya computer band aahe. 2:30 purvi light parat yetach mi navin list script madhe takto, light nahi aali tar ratri takto. —usernamekiran (talk) १४:२६, १८ मे २०२२ (IST)Reply

corrections as per गट १, गट २, वेलांटी and उकार

संपादन

नेहमी चुकणारे शब्द मी येथे लिहून ठेवले आहेत...

http://mr.shoutwiki.com/wiki/Non_dict_pages_2

त्यातील योग्य वाटतील ते शब्द गट १ आणि गट २ साठी निवडून घ्यावेत. यातील काही शब्द विकीवर फार कमी वेळा वापरलेले गेले आहेत. तरीदेखील मी या यादीत ते शब्द ठेवत आहे कारण त्या निमित्ताने शुद्धलेखनाचे डॉक्युमेंटेशन होईल. :) Shantanuo (चर्चा) १३:१८, ५ मे २०२२ (IST)Reply

बॉटने "वरुन" हा शब्द "वरून" असा दीर्घ केला आहे. माझ्या मते "रुन " > "रून " (note the space) अशी नोंद स्क्रिप्टमध्ये करावी. म्हणजे इतर शब्द जसे धरुन, भरुन हे देखील सुधारले जातील. आणि मग "करुन" आणि "वापरुन" या दोन शब्दांसाठी वेगळी नोंद करण्याची आवश्यकता राहणार नाही. यातून अनपेक्षित बदल होणार नाहीत याची मी बॅकअपमधून खात्री करून घेतली आहे. Shantanuo (चर्चा) ०९:३९, ३ जून २०२२ (IST)Reply

"रुन " > "रून " केले. —usernamekiran (talk) ०१:१२, ५ जून २०२२ (IST)Reply

नेमकी स्क्रिप्ट

संपादन

आपण जी स्क्रिप्ट वापरत आहात ती नेमकी येथे आहे तीच आहे का त्यात काही बदल झाले आहेत? सदस्य:KiranBOT_II/typos

उदाहरणार्थ "णार्य → णाऱ्य" ही नोंद "गट २" या विभागात दिसत आहे. पण ती वास्तविक "योग्य रकार" या विभागात हवी. तसेच "योग्य रकार" या यादीतील काही नोंदी चुकलेल्या आहेत. उदा. गार्ह → गाऱ्ह अशी नोंद मी सुचविली पण त्यामुळे काही अनपेक्षित बदल झाले (उदा. उपयोगार्ह). त्यानंतर ती यादी मी सुधारून दिली, पण ती नवीन यादी वापरलेली दिसत नाही.

तुम्ही वापरत असलेल्या पायथॉन स्क्रिप्टमध्ये थोडादेखील बदल केल्यास ती स्क्रिप्ट (कोणत्याही कमेंटशिवाय) "जशी च्या तशी" कुठेतरी प्रसिद्ध करणे आवश्यक आहे. Shantanuo (चर्चा) ०९:०२, २० मे २०२२ (IST)Reply

@Shantanuo: मी थोड्याच वेळात user:KiranBOT II/script इथे स्क्रिप्ट प्रकाशित करतो. —usernamekiran (talk) ०९:४९, २० मे २०२२ (IST)Reply
वरील पानावर जी स्क्रिप्ट ती जशास तशी server आहे. आणि "list of fixes" नावानी जी यादी आहे, त्याप्रमाणे edits होतात. —usernamekiran (talk) ११:२८, २० मे २०२२ (IST)Reply
इतकं सिस्टिमॅटिक काम मराठी विकीवर मी कधीच पाहिलेलं नाही. चार सूचना आहेत त्यांचा विचार व्हावा.
१) तुमच्या स्क्रिप्टमध्ये खालील नोंदी आहेत त्या काढून टाका किंवा कमेंट करा.
#(' नि ', 'नी '),
#('क:', 'कः'),
#('य:', 'यः'),
२) "इंग्रजी कोलनचा मराठी कोलन" ह्या चर्चेत काही सूचना केलेल्या आहेत त्यांचा समावेश व्हावा.
३) कोणताही सेक्शन डिसेबल ठेवण्यात काही अर्थ नाही. कारण तो एकदा तरी विकीवर रन झाला आहे. सर्व सेक्शन एनेबल करा.
४) योग्य रकार fix14 यात आता फक्त ४० नोंदी आहेत. # 57 entries नव्हे. तसेच खालील चार आकडे सुधारून घ्यावेत.
#fix9 20 (not 16)
#fix14 40 (not 3)
#fix18 84 (not 41)
#fix19 21 (not 24)
Shantanuo (चर्चा) १४:४०, २० मे २०२२ (IST)Reply
५) मूळ लेखातील जोडाक्षरे - स्वर हा विभाग स्क्रिप्टमध्ये कुठे आहे? तो वगळण्याचे कारण काय असावे? मला त्यात आणखी एक नोंद हवी आहे.
ाॅ > ॉ
"समाजशास्त्र" या लेखात "हॅरी जाॅन्सन यांनी सांगितलेले स्वरूप पुढीलप्रमाणे " यातील जॉ हे अक्षर काही ब्राउझरमधून तुटल्यासारखे दिसते. डॉक्टर याचे लघुरुप डॉ. हे खूप ठिकाणी डाॅ. असे तुटक दिसते. तुम्हाला जर दोन्ही अक्षरे सारखीच दिसत असतील तर हाच मजकूर नोटपॅडमध्ये कॉपी-पेस्ट करून पाहू शकता. हा मुद्दा विशेष महत्त्वाचा नाही असे जर तुमचे मत असेल तर या विनंतीकडे लक्ष देऊ नये.
तसेच खालील नोंददेखील हवी आहे.
अा > आ
आे > ओ
आै > औ
आॅ > ऑ
ाे > ो
ाी > ी
चावडीवरील "जुनी_चर्चा_७#लेखाचे_शीर्षक_बदलण्याबाबत" या चर्चेत या बदलाचे महत्त्व सांगितले गेले आहे. Shantanuo (चर्चा) १०:५१, २२ मे २०२२ (IST)Reply
@Shantanuo: नमस्कार. तुम्ही सुचवल्याप्रमाणे मी चुका सुधरवल्या आहेत. तसेच "णार्य → णाऱ्य" हि entry "योग्य रकार" मध्ये हलवली. काही अनपेक्षित बदल घडल्यास तपासायला सोपे जावे, या हिशोबाने मी ती एन्ट्री वेगळी ठेवली होती (section २० मध्ये). तसेच मी विसर्ग/कोलन संदर्भात मूळ लेखामध्ये (/typos) दोन नवीन विभाग तयार केलेत. स्क्रिप्ट मध्ये केलेले बदल इथे बघता येतील, त्यामधील केवळ edit summary मी नंतर update केली.

जोडाक्षरे/स्वर सोबत मी एडिट्स जतन न करता काही प्रयोग करून बघिलते होते, मला भरपूर अनपेक्षित बदल घडण्याची शंका आली होती. "काही दिवसांनंतर पुन्हा प्रयत्न करून बघू" असा विचार केला, नंतर कधी त्यासाठी वेळ भेटला नाही. —usernamekiran (talk) २३:१३, २२ मे २०२२ (IST)Reply

अनपेक्षित बदलांची नुसती शंका जरी आली तरी त्या नोंदी स्क्रिप्टमध्ये न घेण्याचा आपला निर्णय योग्य होता. कारण नंतर बदल शोधणे आणि परत फिरवणे कठीण होऊन बसते. पण त्याचबरोबर अशी शंका येण्यासारखे शब्द इथे कळवणे किंवा ब्लॉगवर वगैरे लिहून ठेवणे आवश्यक आहे. त्यामुळे इतरांचा वेळ वाचेल. बऱ्याच लोकांच्या मते हे बदल नाही केले तरी चालण्यासारखे आहे. कारण त्यामुळे वाचकांना काहीच फरक पडत नाही. पण युनिकोडच्या मानकांचे पालन करणे (सहज शक्य असल्यामुळे) लाँग टर्मसाठी उपयुक्त आहे. Shantanuo (चर्चा) ०९:०८, २३ मे २०२२ (IST)Reply
  • @Shantanuo: "इंग्रजी colon चा मराठी विसर्ग", व "मराठी विसर्गाचा इंग्रजी colon" हे सेक्शन मी नजर ठेवण्यासाठी वेग-वेगळ्या टास्क मध्ये टाकले होते. "मन: → मनः" ह्या एन्ट्रीमुळे "जर्मनः" ला विसर्ग व कोलन लागण्याचा लूप सुरु झाला होता. त्यामुळे मी सध्यापुरतं "मन: → मनः" (कोलन तो विसर्ग) हि एन्ट्री comment out केली आहे. तसेच, वरील संभाषणानुसार प्रमाणिक/प्रामाणिक वाल्या तीन एंट्रीएस comment out केल्या, व "पररूप संधी - इक प्रत्यय" मध्ये नवीन एंट्रीएस टाकून तो section सुरु केला. त्यानुसार मी सदस्य:KiranBOT II/typos/script update केली (पान स्थानांतरित केले) . —usernamekiran (talk) १३:३३, २६ मे २०२२ (IST)Reply
ठीक आहे. "मन: → मनः" (कोलन तो विसर्ग) ही एन्ट्री comment out करायला सांगायचे मी विसरलो. माझी चूक सुधरवून घेतल्याबद्दल धन्यवाद. पण जर्मनः → जर्मन: म्हणजे (विसर्ग तो कोलन) ही नोंद कमेंट करण्याचे कारण कळले नाही. जर्मन शब्दाला संस्कृतसारखा विसर्ग लागत नाही. आणि मन चा कोलन तो विसर्ग बदल झाल्यानंतर जर जर्मन आणि रोमन या दोन नोंदी असतील तर चिंता करण्याचे कारण नाही कारण ती नोंद परत जर्मन: (कोलन) अशी झाली असती. हवे तर धूळपाटीवर खात्री करून घेऊ शकता. जर माझी समजण्यात काही गडबड होत असेल तरी प्रतिसाद देण्याची गरज नाही. पुढच्या महिन्याचा बॅक-अप आला की माझा मी समजावून घेईन. ती पद्धत मला जास्त सोयीची वाटते.
दुसरी गोष्ट म्हणजे आपण आपल्या सदस्य पानावर "काही वैयक्तिक कारणांमुळे, मी ऑफलाईन आहे. मला खात्री नाही की मी परत कधी येईन." असा संदेश का लावला आहे? काही महाभाग कुंभकर्णासारखे दीर्घ काळानंतर जागे होऊन विकीवर येतात, त्यांचेही स्वागतच होते. कोणी कारण विचारत नाही. तुम्ही तुमच्या सोयीनुसार जितके योगदान देऊ शकाल ते मौल्यवान आहे. Shantanuo (चर्चा) १४:४४, २६ मे २०२२ (IST)Reply
"जर्मनः → जर्मन:" entry पुन्हा सुरु केली, गडबडीत comment out झाली होती. तुम्ही "व्यावसायिकरण > व्यावसायीकरण" असा बदल केल्याचे लक्षात आले. "व्यावसायीक > व्यावसायिक" entry मध्ये space टाकायची का? —usernamekiran (talk) १६:४४, २७ मे २०२२ (IST)Reply
वास्तविक "व्यावसायिकरण" आणि "व्यावसायीकरण" हे दोन्ही शब्द चुकीचे असून खरा शब्द "व्यवसायीकरण" असा आहे. "व्यवसाय" शब्दापासून पररूप संधीचा इक प्रत्यय लागून "व्यावसायिक" असा शब्द बनेल तर त्यापुढे "व्यावसायिकीकरण" असाही शब्द बनविता येईल. बॉटला भारी पडणार नसेल तर ही आणखी एक अशा शब्दांची यादी. http://mr.shoutwiki.com/wiki/Non_dict_pages_4 Shantanuo (चर्चा) ०८:५६, २८ मे २०२२ (IST)Reply

नवीन यादी

संपादन

@Shantanuo: http://mr.shoutwiki.com/wiki/Non_dict_pages_4 हि यादी कोणत्या नियमात/section मध्ये बसेल? —usernamekiran (talk) ०१:२०, ५ जून २०२२ (IST)Reply

“करण” नावाचा स्वतंत्र विभाग बनवून एकदा रन होऊ द्या. मग डेली क्रॉन साठी "पररूप संधी इक प्रत्यय" या विभागात जमा करून घ्यावा कारण हे शब्द कोणी रोज वापरत नाही. दुसरी गोष्ट म्हणजे हे शब्द कुणाला तरी दाखवून घ्या. माझ्याकडे मराठी भाषेची कसलीही डिग्री नाही! मी मला जमेल तितका अभ्यास करून शब्द सुचवीत आहे. Shantanuo (चर्चा) ०९:२३, ५ जून २०२२ (IST)Reply
@Shantanuo: मी "एअरलाइन्स → एरलाइन्स" अशी एन्ट्री टाकली. आधीच्या एन्ट्रीमुळे बरेच लाल दुवे तयार झाले होते. व वरील यादी "योग्य दीर्घ वेलांटी" ह्या वेगळ्या विभागात टाकली. मी सर्व विभाग/fixes एकाच run मध्ये टाकलेत. जेव्हा कधी आपण नवीन शब्दांची यादी वाढवूत तेव्हा ती दुसऱ्या run मध्ये टाकता येतील, व २-३ दिवसानंतर नवीन यादी पहिल्या run मध्ये हलवता येईल. जेव्हा RAM किंवा दुसरी एखादी अडचण आली, तेव्हा अडचणीनुसार उपाय शोधता येईल. अजून एखादी नवीन यादी आहे का? —usernamekiran (talk) २२:२०, १० जून २०२२ (IST)Reply
खाली दिलेल्या दोन याद्या सुधारून झाल्या का?
Corrections as per Rule 8.1
http://mr.shoutwiki.com/wiki/Non_dict_pages
corrections as per गट १, गट २, वेलांटी and उकार
http://mr.shoutwiki.com/wiki/Non_dict_pages_2
Shantanuo (चर्चा) ०९:४९, ११ जून २०२२ (IST)Reply


रुन_ > रून_ हि एन्ट्री सुद्धा comment out केली. "कॅथरुन" व इतर काही शब्द अनपेक्षितपणे बदलल्या गेलीत. —usernamekiran (talk) २२:३०, १० जून २०२२ (IST)Reply
रुन_ > रून_ हि एन्ट्री सुद्धा comment out केली. "कॅथरुन" व इतर काही शब्द अनपेक्षितपणे बदलल्या गेलीत. ते माझ्यादेखील लक्षात आले होते. त्यासाठीच मी नियमाखाली त्याचे अपवाद सुधारण्याची सूचना केली होती. उदाहरणार्थः
रुन_ > रून_
कॅथरून > कॅथरुन
ही सूचना तुम्ही स्वीकारली की नाही याची कल्पना नाही. कदाचित पुरेशा प्रमाणात चाचण्या झाल्या नसतील. माझ्यामते एखाद-दुसऱ्या इंग्रजी शब्दासाठी एक चांगला रूल काढून टाकणे योग्य नाही. पण तुमचा निर्णय अंतिम राहील. Shantanuo (चर्चा) ०९:०३, ११ जून २०२२ (IST)Reply
माझं मत अंतिम निर्णय ठरवणे (कधीच) योग्य राहणार नाही. तुम्ही केलेले बदल मला दिसले होते, bot नी ते दुसऱ्या दिवशी उलटवले असते. त्यामुळे ती स्ट्रिंग मी तात्पुरती डिसेबल केली, ती पुन्हा सुरु करता येईलच. दुसरी अडचण अशी आहे कि आपण जरी योग्य शब्द टाकत असलो, तरी बरेच लेखं हे चुकीच्या शीर्षकाखाली तयार झाले होते/आहेत. त्यामुळे लाल दुवे तयार होण्याची शक्यता आहे. हे मी ह्यापूर्वी बरेचदा पाहिले होते, व काही दिवसांपूर्वी पुन्हा "एरलाईन्स" सोबत झाले होते. काही दिवसानंतर मी meta व इंग्रजी विकिपीडियावर चौकशी करतो कि लाल दुवे कसे शोधावेत. —usernamekiran (talk) १७:२७, ११ जून २०२२ (IST)Reply
Non dict pages 2 कोणत्या नियमात/विभागात टाकावी? तसेच मला "करूया", "खात्री", "निव्वळ", "संयुक्तिक", व "सर्दी" ह्या शब्दांबद्दल खात्री नाही. तुम्ही म्हटल्याप्रमाणे आपण यादी तयार करू, तुमच्या अनुभवावर मला विश्वास आहे. —usernamekiran (talk) १७:३३, ११ जून २०२२ (IST)Reply
हे सर्व शब्द मी अरुण फडके यांच्या "शुद्धलेखन ठेवा खिशात" या मोबाईल ॲप मधून घेतले आहेत. करूया > करू या / खात्री > खातरी / निव्वळ > निवळ / संयुक्तिक > सयुक्तिक / सर्दी > सरदी प्रत्येक शब्दापुढे त्यांनी स्पष्टीकरण देखील दिले आहे म्हणजे ही काही "प्रिंटींग मिस्टेक" नव्हे किंवा "सॉफ्टवेअर बग" देखील नाही. आपण जन्मभर जे शब्द वापरले ते चुकीचे होते हे समजल्यावर मला धक्काच बसला होता. तुम्हाला जर खात्री / खातरी असे दोन्ही शब्द ठेवायचे असतील तर तसेही करता येईल. कारण हे शब्द आता रूढ झाले आहेत.
प्रथम हे सर्व शब्द एकदम रन करून घ्या. म्हणजे अनपेक्षित बदल झाले तर सुधारता येतील. त्यानंतर हे शब्द वेलांटी, उकार, रकार, गट १ असे विभागून टाकावे. Shantanuo (चर्चा) ०९:३०, १२ जून २०२२ (IST)Reply
rule 8.1 मधील पहिल्या ४३ एंट्रीस second run मध्ये घेतल्या. —usernamekiran (talk) १८:५४, ११ जून २०२२ (IST)Reply
@Shantanuo: नमस्कार. ८.१ मध्ये मी अजून ४१ एंट्रीएस वाढवल्यात. रोज ४२ एंट्रीएस वाढवत जातो. अजून एक म्हणजे, bot चे दोन्ही run आता धूळपाटीवरसुद्धा काम करतील. —usernamekiran (talk) ००:१७, १३ जून २०२२ (IST)Reply
ह्या वेळी बरेच शब्द चुकलेले आहेत. बॉटचे काम काही काळापुरते थांबवा. खाली दिलेल्या शब्दात मी "कि" अशी पहिली काढायला सांगितलेली मला आठवत नाही. हे बदल नक्की कोणत्या रूलनुसार झाले ते सांगू शकाल का?
वाहतुकीसाठी वाहतुकिसाठी (नोएडा 2122556)
वाहतूकीसाठी वाहतूकिसाठी (एर अरेबिया 2122242)
निवडणुकीसाठी निवडणुकिसाठी (एकनाथ शिंदे 2122235)
फसवणुकीसाठी फसवणुकिसाठी (एलिझाबेथ होम्स 2122245)
कारागीरांनी कारागिरांनी (टिपूचा वाघ 2122446)
अमीराती अमिराती (एन्जी किवान 2122241)
Shantanuo (चर्चा) ११:१९, १३ जून २०२२ (IST)Reply
खाली दिलेले रूल स्क्रिप्टमधून काढून टाका. "कीसा > किसा" या रूलमुळे वरील गोंधळ झाला.
कीटा किटा
कीसा किसा
कूटा कुटा
कूडा कुडा
कूला कुला
कूळा कुळा
कूशा कुशा
correction ची शब्दयादी लवकरच तयार करून देतो. तोवर स्क्रिप्ट थांबविण्याची गरज नाही. फक्त २ अक्षरी (लहान) शब्द घेऊ नका. त्यामुळे अनपेक्षित शब्द मॅच होतात. Shantanuo (चर्चा) ११:३२, १३ जून २०२२ (IST)Reply
प्रत्येक शब्दाच्या सुरुवातीला स्पेस दिली तर अनपेक्षित शब्द बदलण्याचे प्रमाण शून्यावर येईल. उदा. "_कीसा > _किसा" Shantanuo (चर्चा) ११:४१, १३ जून २०२२ (IST)Reply
१) खाली दिलेले दोन बदल केले की आजच्या बहुतेक सर्व चुका दुरुस्त होतील.
लागवडि > लागवडी
किसाठी > कीसाठी
२) स्क्रिप्टमध्ये स्पेस देताना १/२ चुका झाल्या आहेत. उदा. किटा, कुटा या शब्दांच्या आधी स्पेस दिली गेल्यामुळे दत्तात्रेय या लेखातील "चित्रकूटाजवळील" शब्द बदलून "चित्र कुटाजवळील" असा झाला आहे. असे आणखी काही शब्द...
दिनकर नीलकंठ देशपांडे (2122505) "कंदीला आला" > "कंदिलाआला"
"जिंजरब्रेड (नाताळ)" (2122422) बिस्कीटांसाठी बिस् किटांसाठी
गुर्जर-प्रतिहार (2122371) राष्ट्रकूटाच्या राष्ट्र कुटाच्या
क्रिकेट विश्वचषक, २००३ त्रिकूटापुढे त्रि कुटापुढे
Shantanuo (चर्चा) १३:०६, १३ जून २०२२ (IST)Reply
वर दिलेल्या दोन सुधारणा झालेल्या दिसत नाहीत. या चुकांना आपण दोघेच जबाबदार आहोत तेव्हा त्या सुधारायची जबाबदारी आपल्या दोघांवरच आहे. आपण हा भाग विसरून गेलो तर त्या चुका तशाच राहतील. निदान क्रमांक १ मध्ये दिलेले दोन बदल तर सहज शक्य आहेत असे मला वाटते. Shantanuo (चर्चा) ०८:५१, १७ जून २०२२ (IST)Reply
@Shantanuo: पुढील entries टाकू का? —usernamekiran (talk) १४:५५, १७ जून २०२२ (IST)Reply
_लागवडि > _लागवडी
किसाठी > कीसाठी
_राष्ट्र कुट > _राष्ट्रकूट
_त्रि कुट > _त्रिकूट
माझ्यामते हे शब्द असे पाहिजेत. तुम्हाला पटले नाही तर बदल करण्याआधी तपासून / विचारून पहा. आणि एक-एक बदल करा म्हणजे नवीन काही समस्या येणार नाही.
लागवडि > लागवडी
किसाठी > कीसाठी
राष्ट्र कुटा > राष्ट्रकूटा
त्रि कुटा > त्रिकूटा
चित्र कुटा > चित्रकूटा
ति किटा > तिकीटा
अरुण फडके यांच्या मोबाईल ॲपप्रमाणे "त्रिकूटाचे" हा शब्द बरोबर आहे. तर त्यांच्याच "मराठी लेखन कोश" या पुस्तकाप्रमाणे "त्रिकुटाचे" हा शब्द बरोबर आहे. सध्या मोबाईल ॲपनुसार "त्रिकूटाचे" असा शब्द होईल असे पहा. कोणी जर त्रिकुटाचे शब्द बरोबर आहे असे सिद्ध केले तर पुन्हा क्रॉन लिहून बदल करता येतील. Shantanuo (चर्चा) १०:४९, १८ जून २०२२ (IST)Reply
@Shantanuo: हो. सध्या एका वेळेस दोन शब्द घेऊ. आत्ता "लागवडि > लागवडी" व "किसाठी > कीसाठी" हे दोन घेतले आहेत. "trikut" लिहिले असता गूगल ट्रान्सलेट आधी "त्रिकुट" व नंतर "त्रिकूट" दाखवते. "त्रिकूटा" असा बदल होईल अशी entry टाकतो. अजून एक म्हणजे, "मिरवणुकिसाठी" बरोबर कि "मिरवणुकीसाठी"? —usernamekiran (talk) २३:३६, १८ जून २०२२ (IST)Reply
"मिरवणुकीसाठी" बरोबर. मूळ शब्द "मिरवणूक" त्याचे सामान्यरूप "मिरवणुकी". यात णु पहिला झाला. मग त्याला प्रत्यय वगैरे जोडून "मिरवणुकीचा / मिरवणुकीसाठी" असे शब्द बनले. सामान्यरूप बनविताना शेवटच्या अक्षराला पहिला इ किंवा पहिला उ लावता येत नाही. या नियमाला एकाक्षरी शब्दांचा अपवाद, जी, ती, ही, तू. यावरून जिला, तिला, हिला, तुला असे शब्द बनतात. Shantanuo (चर्चा) ०९:२०, १९ जून २०२२ (IST)Reply
दोन्ही शब्दांच्या आजच्या करेक्शन्स अगदी योग्य प्रकारे झाल्या आहेत. धन्यवाद. चूक मान्य करणे, कारण शोधणे आणि दुरुस्त करणे हे विकीवरच नव्हे तर इतरत्रही दुर्मीळ झालेले गूण तुमच्यात दिसत आहेत. काही ठिकाणी "मिरवणूकीसाठी" असे चुकीचे लिहिले गेले आहे. ते "मिरवणुकीसाठी" असे पाहिजे. त्यासाठी 'ूकीसाठी' > 'ुकीसाठी' असा रूल स्क्रिप्टमध्ये टाकता येईल. Shantanuo (चर्चा) ०८:५४, २० जून २०२२ (IST)Reply
@Shantanuo: एक घोळ झाला. मी "शुद्धलेखनाचा नियम ८.१" section डिसेबल केला होता, पण सर्वर वर फाईल अपडेट करायचं राहून गेलं. त्यामुळे अडीच वाजता चुकीचे बदल पुन्हा झाले, तर ४:३० वाजता ते पुन्हा दुरुस्त झाले. नवीन चुका काही झाल्या नाही, पण निरर्थक बदल परत-परत झाले.
अजून एक, "त्रिकुट" योग्य कि "त्रिकूट"? तुम्ही वर वेग-वेगळ्या कंमेंट्स मध्ये दोन्ही बरोबर म्हटले त्यामुळे मी थोडा गोंधळलो.
सध्या "वाहतुकिसाठी > वाहतुकीसाठी" असा बदल होतोय. ते बरोबर आहे का? माझ्या मते बरोबर आहे, पण मला खातरी नाही. जर बरोबर असेल तर दुरुस्तीच्या पुढील दोन एंट्रीस वाढवता येतील. —usernamekiran (talk) २०:२०, २० जून २०२२ (IST)Reply
बिना अक्षराचा उकार घेणे थोडेसे धोकादायक वाटते. त्यासोबत आधी धुळपाटीवर प्रयोग करून घेतलेले बरे राहील.
"त्रिकूट" तसेच "त्रिकूटाचे" योग्य. "वाहतुकिसाठी > वाहतुकीसाठी" बरोबर. बिना अक्षराचा स्वर घेणे थोडेसे धोकादायक आहे हे बरोबर पण आपण फक्त स्वर घेणार नसून त्यासोबत व्यंजन देखील घेत आहोत. त्यामुळे त्यात काही धोका नाही. पण आपल्या दोघांनाही थोड्या विश्रांतीची गरज आहे असे मला वाटते. आपण काही दिवस नवीन काम न वाढवता झालेल्या कामावर लक्ष ठेवू. Shantanuo (चर्चा) ०८:५२, २१ जून २०२२ (IST)Reply

──────────────────────────────────────────────────────────────────────────────────────────────────── चालते. तोपर्यंत मी व्याकरण संदर्भातील लेखांवर काम करतो. दोन-तीन दिवसांपूर्वीच मी वर्ग:मराठी व्याकरण व त्यातील काही पोटवर्गातील जवळपास १२० लेखांवर {{nobots}} साचा लावला (हे आपण आधीच करायला पाहिजे होतं). काही दिवस मी ह्या लेखांवर काम करतो, bot नी जर तिथे काही अनपेक्षित बदल केले असतील तर ते उलटवतो, तसेच या कारणानी माझा व्याकरणाचा अभ्यास सुद्धा होईल. —usernamekiran (talk) २२:३४, २१ जून २०२२ (IST)Reply

नवीन यादी भाग २

संपादन
bot inactive केला. झालेल्या चुका एक-दोन तासात बघून सांगतो. माझ्याकडून सुद्धा script मध्ये काही चुका झाल्या होत्या. त्यामुळेच हे झाले असावे. जिथे space नको होती अशा काही शब्दांमध्ये space आली होती. काल रात्री मी स्क्रिप्टमधील त्या चुका सुधरवल्या होत्या (पण bot रन झाल्यानंतर). —usernamekiran (talk) १५:१२, १३ जून २०२२ (IST)Reply
"भारतीय स्वातंत्र्य कार्यकर्त्यांची यादी" लेखामध्ये "त्रिकूटाचे" > "त्रि कुटाचे" असा बदल झाला होता. हा सगळा गोंधळ काही ठिकाणी माझ्यामुळे राहिलेल्या space मुळे झालाय. notepad मध्ये मराठी टाईप केले असता फॉन्ट बारीक होतो, त्यामुळे मला space लक्षात नाही आली. —usernamekiran (talk) १९:४७, १३ जून २०२२ (IST)Reply
@Shantanuo: सध्या स्क्रिप्ट मध्ये पुढील (दुरुस्त केल्यानंतरच्या) एन्ट्रीज आहेत. —usernamekiran (talk) २०:०५, १३ जून २०२२ (IST)Reply
			('अंथरूणा', 'अंथरुणा'),
			(' अंथरुण ', ' अंथरूण '),
			('अपशकूना', 'अपशकुना'),
			(' अपशकुन ', ' अपशकून '),
			('अपीला', 'अपिला'),
			(' अपिल ', ' अपील '),
			('अमीरा', 'अमिरा'),
			(' अमिर ', ' अमीर '),
			('अशीला', 'अशिला'),
			(' अशिल ', ' अशील '),
			('असूडा', 'असुडा'),
			(' असुड ', ' असूड '),
			('वडीला', 'वडिला'),
			(' वडिल ', ' वडील '),
			('कंजूसा ', 'कंजुसा'),
			(' कंजुस ', ' कंजूस '),
			('कंदीला ', 'कंदिला'),
			(' कंदिल ', ' कंदील '),
			('काँक्रीटा', 'काँक्रिटा'),
			(' काँक्रिट ', ' काँक्रीट '),
			('कारकूना', 'कारकुना'),
			(' कारकुन ', ' कारकून '),
			('कारखानीसा', 'कारखानिसा'),
			(' कारखानिस ', ' कारखानीस '),
			('कारागीरा', 'कारागिरा'),
			(' कारागिर ', ' कारागीर '),
			(' वीटा', ' विटा'),
			(' वीटे', ' विटे'),
			(' विट ', ' वीट '),
			('कीटा', 'किटा'),
			(' किट  ', ' कीट '),
			('कीसा', 'किसा'),
			(' किस ', ' कीस '),
			('कूटा', 'कुटा'),
			(' कुट ', ' कूट '),
			('कूडा', 'कुडा'),
			(' कुड ', ' कूड '),
			('कूला', 'कुला'),
			(' कुल ', ' कूल '),
			('कुलूपा  ', 'कुलुपा'),
			(' कुलुप ', ' कुलूप '),
			('कूळा', 'कुळा'),
			(' कुळ ', ' कूळ '),
ही यादी ५० टक्केच बरोबर आहे. म्हणजे (' किस ', ' कीस '), ही नोंद बरोबर आहे. पण ('कीसा', 'किसा'), ही नोंद चुकीची आहे. त्यात शब्दाच्या सुरुवातीला स्पेस पाहिजे. ('_कीसा', '_किसा'), नाहीतर "वाहतुकीसाठी” असे शब्द मॅच होतील. सगळ्यात सुरक्षित मार्ग म्हणजे दोन अक्षरी शब्द घेऊच नका. म्हणजे कीस, वीट असे शब्द स्क्रिप्टमध्ये नसले तरी चालतील. मी स्पेल चेकर बनविण्याच्या दृष्टीने ही एक परिपूर्ण यादी बनविली आहे.
दुसरी गोष्ट म्हणजे तुम्ही github.com ही साईट वापरता का? git हे स्क्रिप्टच्या विविध आवृत्त्या साठवून ठेवण्यासाठी जगभर वापरले जाणारे टूल आहे. तुम्ही तिकडे एक रिपोझिटरी तयार करून त्यात तुमची स्क्रिप्ट सेव्ह करत गेलात तर स्क्रिप्टमध्ये कधी काय बदल झाले याचा मागोवा घेणे सोपे जाईल. तुमची स्क्रिप्ट (जुनी आणि नवी) जिटहबवर उपलब्ध असती तर कोणती स्पेस चुकली आहे ते मी लगेच सांगू शकलो असतो. नवीन बदल काय झाले आहेत ते त्यात फार छान रितीने समजते. विकीवरील "विविध आवृत्यांमधील फरक” सारखीच ती सुविधा आहे. तुमची स्क्रिप्ट रन करण्यापूर्वी विकीवर किंवा जिटहबवर टाकून मला (किंवा इतर कोणालाही) दाखवून घ्यावी म्हणजे अशा चुका टाळता येतील. कदाचित संजय गोरे हे सदस्य आपल्याला मदत करायला तयार होतील. Shantanuo (चर्चा) ०९:३४, १४ जून २०२२ (IST)Reply

────────────────────────────────────────────────────────────────────────────────────────────────────@Shantanuo: नमस्कार. मी स्क्रिप्टमध्ये काही ठोस बदल केले आहेत, ते तुम्ही github वर येथे, आणि सदस्य:KiranBOT II/typos च्या संपादन इतिहासात बघू शकता. —usernamekiran (talk) ०३:२१, २८ ऑगस्ट २०२२ (IST)Reply

नियम ८.१ चर्चा

संपादन

@Shantanuo: नमस्कार. कसे आहात?
१०-१० entries करत "नियम ८.१" मधील चुका दुरुस्त करणे सुरु करायचं का? —usernamekiran (talk) १२:३१, २५ जुलै २०२२ (IST)Reply

वानिवडे या लेखातील "सुखावून" हा शब्द "सुखाऊन" असा बदलला आहे. हा बदल चुकीचा आहे. त्यासाठी स्क्रिप्टमध्ये ('खावून', 'खाऊन'), या नोंदीत स्पेस द्यावी लागेल. अशी... (' खावून ', ' खाऊन '), अशा चुकांचे प्रमाण अगदी नगण्य आहे आणि अशा चुका क्षम्य आहेत हे मला माहीत असले तरी अशा चुका पाहिल्या की माझा आत्मविश्वास कमी होतो. त्यासाठी आणखी एखादा स्वयंसेवक बॉटचे बदल तपासण्यासाठी पुढे येतो का त्याची वाट पाहूया. तो मिळाला की पुढे जाता येईल असे मला वाटते. Shantanuo (चर्चा) १४:४७, २५ जुलै २०२२ (IST)Reply
आपण ह्या शब्दांचा गट पूर्वी run केला होता. त्यामुळे आपण रोज ५ ते १० शब्द वाढवत गेलो तर बदल खूप कमी होतील. bot चे प्रत्येक संपादन मी रोज पडताळून बघू शकतो. जेव्हा कधी एखादा अनपेक्षित बदल दिसला तेव्हा आपण तो दुरुस्त करू शकतो. उदाहरणार्थ "सुखाऊन". 'खावून' मध्ये space व"सुखाऊन" > "सुखावून" अशी नवीन entry टाकली असता पुर्विच्यासुद्धा चुका दुरुस्त होतील. एकाच झटक्यात १००% accuracy येणे जवळपास अशक्य आहे. पण दुरुस्त करता येतानासुद्धा होणाऱ्या चुकणाची भीती बाळगून आपण काम थांबवणे बरोबर नाही. आपण प्रयत्न करत राहिलो तर चुका होण्याची शक्यता नाकारता येत नाही, पण झालेल्या चुका दुरुस्त केल्या तर आपला end result १००% चुकहीन होईल.

तसेच आपण सर्व संपादकांना विनंती करू शकतो कि ते ज्या लेखावर काम करतात, त्यातील चुका (मग त्या bot च्या असो किंवा नसो) आपल्याला कळवाव्या. —usernamekiran (talk) २०:२२, २६ जुलै २०२२ (IST)Reply

तुमचा मुद्दा बरोबर आहे. दहा दहा एंट्रीज टाकू शकता. फक्त रोज नवीन नोंदी न करता दोन-चार दिवसांनी नोंदी वाढवा, म्हणजे मला देखील वेळ होईल तसे चुका शोधायला बरे पडेल! :) Shantanuo (चर्चा) १३:०२, २७ जुलै २०२२ (IST)Reply
हो. वेळ मिळाला तसं काम करत राहू, म्हणजे २-३ दिवसांत एक update होत राहील. मध्यंतरी मी शुद्धलेखनासाठी काही संदर्भ सापडतो का ते बघतो. मला व्याकरणासंदर्भात एक (MPSC साठीचे) पुस्तक भेटले आहे, पण मला त्याच्या योग्यतेबद्दल शंका आहे. —usernamekiran (talk) २२:५०, २७ जुलै २०२२ (IST)Reply
नवीन शब्द टाकले का स्क्रिप्टमध्ये? किरण बॉटच्या लॉगमध्ये जुन्याच चुका दुरुस्त होताना दिसत आहेत. Shantanuo (चर्चा) १३:४५, ३ ऑगस्ट २०२२ (IST)Reply
सध्यापुरते फक्त "सुखाऊन → सुखावून" व "_खावून_ → _खाऊन_" हे दोन शब्द टाकले होते. नवीन शब्द टाकल्यावर मी ते "typos" पानावर, आणि github वर update करतोय. —usernamekiran (talk) २१:२५, ३ ऑगस्ट २०२२ (IST)Reply
#नवीन यादी भाग २ मध्ये मी चुकीची स्क्रिप्ट टाकली होती. ती तुम्ही दुरुस्त करून देऊ शकता का? आपण विश्रांतीसाठी थांबलो होतो त्याच्या आधीसुद्धा माझ्या बाजूने बरेच खंड पडले होते, तेव्हापासूनच माझी लिंक तुटली होती. जर पुन्हा एकदा सुरुवात झाली तर परत काम करणे सोपे जाईल. —usernamekiran (talk) २१:३१, ३ ऑगस्ट २०२२ (IST)Reply
ती यादी बरोबर आहे. फक्त दोन अक्षरी शब्दांच्या आधी स्पेस पाहिजे. ही अशी...
(' कीटा', ' किटा'),
(' कीसा', ' किसा'),
(' कूटा', ' कुटा'),
(' कूडा', ' कुडा'),
(' कूला', ' कुला'),
(' कूळा', ' कुळा'),
Shantanuo (चर्चा) ०९:०८, ४ ऑगस्ट २०२२ (IST)Reply


उकार विभागासाठी ५ शब्द

संपादन

खाली दिलेले ५ शब्द "उकार" या विभागात टाकावेत.

रुप_ > रूप_

corrections:

ग्रूप > ग्रुप


रुपा > रूपा

corrections:

रूपाली > रुपाली

रूपारेल > रुपारेल

पहिला रुप शब्द रूप असा दुसरा केला की ग्रुप शब्द ग्रूप असा दीर्घ होईल तो सुधारण्यासाठी corrections विभागात तो शब्द ठेवावा लागेल. तीन शब्द करेक्शन विभागात जातील पण इतर बरेच शब्द सुधारून मिळतील. उदा... स्वरूप कुरूप प्रारूप अनुरूप द्रवरूप सुखरूप

Shantanuo (चर्चा) १०:१९, २९ ऑगस्ट २०२२ (IST)Reply

उकार या विभागात रुन_ > रून_ अशी नोंद आहेच. त्याखाली रूण > रुण अशी नोंद करावी. त्यामुळे तरूण वरूण अरूण यासारखे तत्सम शब्द तरुण, वरुण आणि अरुण असे बदलले जातील. तसेच त्या शब्दापासून बनणारे इतर शब्द देखील सुधारले जातील. (उदा. तरूणांचे) हा बदल झाल्यावर खाली दिलेले तीन शब्द सुधारून घ्यावे लागतील.

corrections:

अंथरुण > अंथरूण

पांघरुण > पांघरूण

भ्रुण > भ्रूण

याचे कारण संस्कृतमधून आलेले दीर्घ रूण चे शब्द नसले तरी मराठीत काही तुरळक शब्द आहेत. त्यातील हे तीन शब्द विकीवर वापरले गेले आहेत.

Shantanuo (चर्चा) ०९:४८, १ सप्टेंबर २०२२ (IST)Reply

@Shantanuo: टाकले. उद्यापासून मी पुन्हा नियमितपणे काम करू शकेन. —usernamekiran (talk) २२:२०, ५ सप्टेंबर २०२२ (IST)Reply

"आयजेन पु" या लेखात चुकीचा बदल झाला आहे. अंथरूणाला हा शब्द अंथरुणाला असा करावा. याचे कारण मी शब्दाच्या मागेपुढे स्पेस देण्याचे विसरलो होतो. "अंथरूण" हा शब्द एकटा असताना तसाच बरोबर आहे. त्यात रू दुसरा आहे. पण त्याला प्रत्यय जोडल्यावर तो रु पहिला लिहावा लागतो. असा - "अंथरुणाला". माझ्यामते खाली दिलेल्या ६ नोंदी corrections विभागात टाकाव्या लागतील.

  • ('अंथरूण', 'अंथरुण'),
  • ('पांघरूण', 'पांघरुण'),
  • ('भ्रूण', 'भ्रुण', ),
  • ('_अंथरुण_', '_अंथरूण_'),
  • ('_पांघरुण_', '_पांघरूण_'),
  • ('_भ्रुण_', '_भ्रूण_'),

हे शब्द असलेली पाने फारतर १० - २० असतील. पण तरीदेखील हा बदल स्क्रिप्टमधून आणि बॉटच्या हस्ते होऊ द्या. कारण नियम_८.१ या नियमाला काँप्युटरच्या लॉजिकमध्ये बसवायचे आहे. त्यासाठी सर्व रु आधी ऱ्हस्व करून घेतले आणि मग मूळ शब्दातील रू दीर्घ केला आहे. Shantanuo (चर्चा) ११:४१, २० सप्टेंबर २०२२ (IST)Reply

@Shantanuo: सध्या corrections सेक्शन नाहीये. github वर द्ययावत स्क्रिप्ट आहे, आणि सदस्य:KiranBOT II/typos/script वर सेक्शन व क्रॉनजॉब्सची माहिती आहे. खाली हिरालाल विभागातसुद्धा एक कंमेंट टाकलाय. —usernamekiran (talk) ०९:३९, २६ सप्टेंबर २०२२ (IST)Reply
ओके. जिटहब वर पुल रिक्वेस्ट पाठविली आहे. Shantanuo (चर्चा) १२:२३, २६ सप्टेंबर २०२२ (IST)Reply

हिरालाल केनिया to केन्या

संपादन

हिरालाल केनिया is getting changed to हिरालाल केन्या in the article "भारताच्या_सरन्यायाधीशांची_यादी". Please try negative lookback regex:

(?<!हिरालाल) केनिया > केन्या

Shantanuo (चर्चा) १५:१६, ६ सप्टेंबर २०२२ (IST)Reply

@Shantanuo: there were many unexpected changes, so I blocked the bot account. I will look into the problems at night, but would you kindly look at it as well? I have updated the script on github at the same time when I updated the bot's script. —usernamekiran (talk) १५:२५, ६ सप्टेंबर २०२२ (IST)Reply
I can see that you have removed the characters like प, भ and अ I have not recommended this and the github commit does not have any clue about it. Please revert all pages. And do not continue unless all pages are corrected. Shantanuo (चर्चा) १५:५८, ६ सप्टेंबर २०२२ (IST)Reply
I guess you have made some mistake while adding these 3 entries in the script. ('अंथरुण') > ('अंथरूण'), ('पांघरुण') > ('पांघरूण'), ('भ्रुण') > ('भ्रूण'), Therefore The first character from each group, i.e. अ, प and भ were simply removed (not replaced by something else). Can you show me the actual entry in the script? Shantanuo (चर्चा) १६:१०, ६ सप्टेंबर २०२२ (IST)Reply
There are 3 mistakes in the script and if you know python just run this line to confirm. # 'पावसाळ्यात येथे भरपूर प्रमाणात पाऊस पडतो असते'.replace('प', 'ा').replace('भ', '्').replace('अ', 'ं') This will return # ाावसाळ्यात येथे ्राूर ा्रमाणात ााऊस ाडतो ंसते that is exactly what you are getting on several pages. Since you have reverted all the changes, you can now continue your bot operation. I appreciate the quick correction :) Shantanuo (चर्चा) १७:००, ६ सप्टेंबर २०२२ (IST)Reply
@Shantanuo: I have reverted all the edits which were current. If any article was edit by someone else after the bot, such articles/edits were not changed. The entry on github is actual entry from the script. I will look into it/everything around 8-9pm. I have already blocked the bot, so now edits will not be made. —usernamekiran (talk) १७:०८, ६ सप्टेंबर २०२२ (IST)Reply
मला स्क्रिप्ट मध्ये चुकीचं काहीच दिसत नाहीये. थोड्यावेळासाठी आपण गृहीत धरलं कि, replace strings मध्ये काहीतरी चूक झालीये, तरी edit summary "(ं; थ; र;" अशी येणं शक्य नाही [१]. पूर्ण स्क्रिप्ट मध्ये अशा प्रकारची एडिट समरी नाहीये. बरेचदा चुकीची edit summary येत आहे. ह्या edit मध्ये फक्त "योग्य उकार" हि edit summary यायला पाहिजे होती, पण तिथे त्यासोबतच आणखी तीन अनावश्यक edit summaries आल्या होत्या. मला वाटते आता प्रत्येक सेक्शन मध्ये १००, व एका रन मध्ये ७ सेक्शन्स अशी विभागणी करून बघावी लागेल. मी अजून वेग-वेगळे ट्रायल करतच आहे. —usernamekiran (talk) २१:३७, ६ सप्टेंबर २०२२ (IST)Reply
अंथरुण, पांघरुण आणि भ्रुण या तीन नोंदी काढून टाकल्या तर इतर नोंदींसह बॉट अपेक्षेप्रमाणे धूळपाटीवर चालवता येत आहे का? फक्त ८-१० नोंदी वाढवल्यावर मेमरीची समस्या उद्भवणे कसे शक्य आहे? आणि तसे असेल तर कालचे बदल पूर्णपणे रद्द करा आणि पाहा. परवापर्यंत हा बॉट अगदी व्यवस्थित चालत होता. एडीट समरीचे तुम्ही दिलेले उदाहरण अपवादात्मक असून ती देखील व्यवस्थित चालत होती. स्क्रिप्टच्या अगदी शेवटी एक कंस } पूर्ण करायचा राहून गेला असावा असे मला वाटते. Shantanuo (चर्चा) ०९:५७, ७ सप्टेंबर २०२२ (IST)Reply
'अंथरुण' या शब्दाची युनिकोडप्रमाणे फोड केली तर ती अशी दिसतेः ('अ', 'ं', 'थ', 'र', 'ु', 'ण') यातील 'अ' नंतरची तीन अक्षरे 'ं', 'थ' आणि 'र' एडिट समरीमध्ये दिसत आहेत. पण ती तशी का दिसत आहेत हा प्रश्नच आहे. मेटावरील तज्ज्ञांना विचारण्याआधी विकीवरील प्रचालकांशी बोलून घ्या. Shantanuo (चर्चा) १०:४०, ७ सप्टेंबर २०२२ (IST)Reply
  • @Shantanuo: मी ही जुनी script server वर अपलोड केली. त्यातील fix ५, ७, आणि ८ हे दुसऱ्या cronjob मध्ये टाकले, आणि fix18 (पररूप संधी - इक प्रत्यय) तात्पुरता disable केला. shellscript मधील पॅरामीटर बदलले, जेणेकरून bot आता फक्त धुळपाटीवर edit करेल. आपण तिथे बघू शकतो कि आता काय बदल घडतात. एक प्रश्न: आपण पूर्वी पररूप संधी disable केला होता, तो कशामुळे disable केला होता ते तुम्हाला आठवते का? मी उद्या पुन्हा auto -save चा पर्याय न वापरता bot लेख नामविश्वात वापरून बघतो. —usernamekiran (talk) २२:५५, ७ सप्टेंबर २०२२ (IST)Reply
"प्रमाणीकरण" या शब्दाने प्रमाणाबाहेर त्रास दिल्यावर पररूप संधी तात्पुरता डिसेबल केला होता. पण तो लगेच परत चालू केला होता. "गणनयंत्र" या लेखात नुकताच म्हणजे ४ सप्टेंबरला आंतरीक हा शब्द आंतरिक असा बदललेला आहे. त्या लेखाची एडिट समरी देखील अगदी बरोबर आहे. (शुद्धलेखन — इंग्रजी colon चा मराठी विसर्ग; शुद्धलेखन — पररूप संधी - इक प्रत्यय; शुद्धलेखन — योग्य रकार) कारण 'आंतरिक' बरोबरच 'करणाऱ्या' आणि 'विशेषतः' हे दोन शब्द देखील सुधारलेले आहेत.
मी आज केलेल्या मोजणीनुसार ४३३० लेखात चुकीचा बदल झाला होता आणि ते सर्व लेख दुरुस्त झाले. बॉटने बदल केल्यावर त्यातील कोणत्याच लेखात कोणी काही बदल न केल्यामुळे आणि तुम्ही लगेच सुधारणा केल्यामुळे हे जमले आहे. :) Shantanuo (चर्चा) ०९:०९, ८ सप्टेंबर २०२२ (IST)Reply
Usernamekiran आणि Shantanuo तुमच्या अभ्यासाला, मेहनतीला आणि तत्परतेला सादर प्रणाम. -संतोष गोरे ( 💬 ) १०:१४, ८ सप्टेंबर २०२२ (IST)Reply
@संतोष गोरे: धन्यवाद. पण खरं पाहिलं तर bot च्या कार्यप्रणालीत Shantanuo चा सुद्धा खूप मोठा वाट आहे. मी केवळ तांत्रिक बाजू बघतोय, तर Shantanu व्याकरणाची बाजू बघत आहेत. मला जेवढे जमेल तेवढे योगदान मी नेहमीच देत राहील :-) —usernamekiran (talk) २३:५८, ८ सप्टेंबर २०२२ (IST)Reply
@Shantanuo: मी ५ तारखेला जस होतं सगळं तसच केलं. फक्त फरक एवढा आहे कि fix5, ७, ८, आणि, १८ मी दुसऱ्या cronjob मध्ये टाकलेत. मी बरेच वेगवेगळे प्रयोग करून बघितले, आता सर्वकाही व्यवस्थित वाटत आहे. मी bot ला unblock केलंय, उद्या अडीच व साडेचार वाजता काय होते बघू. नेहमीप्रमाणे हा एक अनपेक्षित बदल झालाय. —usernamekiran (talk) २३:५८, ८ सप्टेंबर २०२२ (IST)Reply
"आंतरिक्ष" हा शब्द चुकीचा असून तो "अंतरीक्ष" असा पाहिजे असे त्या अनपेक्षित बदलावरून जो निष्कर्ष तुम्ही काढला आहे तो नक्की बरोबर आहे का? आपण दोघांनीही इयत्ता दहावीपर्यंतच मराठी भाषेचा अभ्यास केला आहे. तेव्हा कोणत्यातरी अभ्यासकाचे मत विचारात घ्यावे लागेल.
बॉट दुरुस्त केल्याबद्दल धन्यवाद. आता अधिक काळजी घेऊ. नाहीतर "खाया पिया कुछ नही, ग्लास तोडा बारा आना” अशा स्वरूपाचा आरोप आपल्या दोघांवर होईल. :) Shantanuo (चर्चा) ०९:१९, ९ सप्टेंबर २०२२ (IST)Reply
internet वर शोध घेतला असता अं‍तरिक्ष, आणि अंतरीक्ष अशे दोन्ही वापर दिसले. हिंदी मध्ये "अंतरिक्ष" हा निर्विवादपणे बरोबर आहे, पण मराठीत कोणती वेलांटी योग्य आहे ते कळालं नाही. वेगवेगळे शब्दकोश वेगळी वेलांटी वापरत आहेत, तर सरकारी शब्दकोशामध्ये हा शब्दच सापडला नाही, त्याऐवजी "अवकाश" हा शब्द आहे.
यापुढे कोणतेही शब्द/entries वाढवल्यावर आधी फक्त धूळपाटीवर रन करून परिणाम बघुत. —usernamekiran (talk)
अशा वादांवर गूगल निर्णय देऊ शकत नाही. एखादा तज्ज्ञ भविष्यात ही चर्चा वाचेल व आपल्याला मार्गदर्शन करेल. तोवर काही नवीन फेरफार करता येणार नाहीत. आता मूळ मुद्दा. हिरालाल किंवा जयकिसनदास यांचे आडनाव केनिया असेल तर ते देखील केन्या करणार का? धूळपाटीवर "जयकिसनदास केनिया" असे लिहिले आणि बॉटच्या स्क्रिप्टमध्ये असे लिहिले (?<!हिरालाल।जयकिसनदास) केनिया > केन्या तर चालेल का? Shantanuo (चर्चा) ०९:०३, १० सप्टेंबर २०२२ (IST)Reply
हिरालाल केन्या हे अयोग्य नाव असून ते हिरालाल कनिया असे आहे. असेच अजून एक पान मधुकर हिरालाल कनिया आहे. तेव्हा केन्या अथवा केनिया आडनावाचे कनिया करावे ही विनंती. Khirid Harshad (चर्चा) १४:४०, १२ सप्टेंबर २०२२ (IST)Reply
  • @Khirid Harshad आणि Shantanuo: प्रत्येक अवांछित शब्दासाठी एन्ट्री तयार करणं किंवा regex वापरणं थोडं काउंटर प्रोडक्टीव्ह वाटते, तसेच त्यामुळे स्क्रिप्टसुद्धा मोठी होत राहील. हिरालालच्या बाबतीत nowiki टॅग वापरणे जास्त सोयीस्कर राहील. हर्षद यांच्या म्हणण्याप्रमाणे "हिरालाल कनिया" हे नाव योग्य असल्यास काहीच करायची गरज नाही. पण उदाहरणासाठी जर "हिरालाल केनिया" नाव योग्य असल्यास "<nowiki>हिरालाल केनिया</nowiki>" असं लिहिणे सगळ्यात सोयीस्कर राहील. तुमचे काय मत आहे? —usernamekiran (talk) १२:२१, १९ सप्टेंबर २०२२ (IST)Reply
तुमच्या म्हणण्याप्रमाणे nowiki टॅग वापरणे योग्य आहे. पण रेग्युलर एक्स्प्रेशनमध्ये lookback वापरता येतो का हे मला या निमित्ताने जाणून घ्यायचे आहे. Shantanuo (चर्चा) १२:५६, १९ सप्टेंबर २०२२ (IST)Reply
nowiki टॅग वापरण्यास हरकत नाही, परंतु आडनाव कनिया असल्याने तो बदल करणे योग्य ठरेल असे मला वाटते. Khirid Harshad (चर्चा) २१:२९, १९ सप्टेंबर २०२२ (IST)Reply
हो पण फक्त धूळपाटीसाठीच! Shantanuo (चर्चा) ११:४९, २० सप्टेंबर २०२२ (IST)Reply
@Shantanuo: एन्ट्री टाकल्यानंतर काहीच एरर न येता संपादन झालं, पण अपेक्षित बदल झाला नाही. —usernamekiran (talk) ०९:५७, २१ सप्टेंबर २०२२ (IST)Reply
@Shantanuo: इतर fixes डिसेबल केले असता योग्य बदल झाले. —usernamekiran (talk) १०:१९, २१ सप्टेंबर २०२२ (IST)Reply
माझा पूर्वीचा एक अनुभव: regex (किंवा pywikibot) मराठी अक्षरांना non-alphabet character ग्राह्य धरते. —usernamekiran (talk) १०:३१, २१ सप्टेंबर २०२२ (IST)Reply
@Shantanuo: ('हिरालाल (?!केनिया)', 'हरिलाल') ही एंट्री टाकली. दुपारी २:३५ वाजता केवळ धुळपाटीवर रन होईल. —usernamekiran (talk) १३:२२, २४ सप्टेंबर २०२२ (IST)Reply
('हिरालाल (?!केनिया)', 'हरिलाल') ही एन्ट्री टाकल्यानंतर काही एडिट्स झाले, पण मी मॅनुअली सुद्धा काही एडिट केले होते. ह्यामध्ये स्पेस रिमूव्ह झाली आहे. regex वाल्या दोन्ही एंट्रीस exp ह्या सेक्शन मध्ये आहेत, व त्याची एडिट समरी "धूळपाटीवर प्रयोग" आहे. लेखांवर काम करणारे सर्व सेक्शन्स धुळपाटीवर काम करतात, आणि त्यांची एडिट समरी लेखांसारखीच आहे. मला वाटते अजून ४ दिवस स्क्रिप्ट कशी काम करते हे धुळपाटीवर बघावे. त्यासाठी तुम्ही हिरालालचे सर्व variations धुळपाटीवर टाकसाल का? म्हणजे आपल्याला त्यांनतर झालेले बदल लक्षात येतील. —usernamekiran (talk) ०९:३८, २६ सप्टेंबर २०२२ (IST)Reply
चारच का? चांगले सात-आठ दिवस टेस्ट होऊ द्या. काही घाई नाही. lookback आणि lookahead रेग्युलर एक्स्प्रेशनने काम सोपे होणार आहे. Shantanuo (चर्चा) १२:२३, २६ सप्टेंबर २०२२ (IST)Reply

आयोजीत --> आयोजित

संपादन

शुद्धलेखन -- अभय नातू (चर्चा) १२:२१, ७ सप्टेंबर २०२२ (IST)Reply

@अभय नातू: काल bot मध्ये काहीतरी बिघाड झाला होता. २-३ दिवसात ठीक होईल. दुरुस्ती झाली कि शब्द टाकतो. —usernamekiran (talk) २२:५६, ७ सप्टेंबर २०२२ (IST)Reply
संशिप्त --> संक्षिप्त
अभय नातू (चर्चा) ०५:२३, ११ सप्टेंबर २०२२ (IST)Reply
ॲंड --> अँड Khirid Harshad (चर्चा) १७:५०, १२ सप्टेंबर २०२२ (IST)Reply

हर्षद यांची वरील सूचना बरोबर आहे. "कॉंग्रेस शब्दाची फोड" या मथळ्याखालील माझी सूचना चुकीची आहे.

  • ('बॅंक', 'बँक') अशी नोंद गट १ विभागात आहेच. त्यापुढे हे दोन शब्द घेता येतील.
  • ('ॲंड', 'अँड')
  • ('कॉंग्रेस' , 'काँग्रेस')

वास्तविक व्याकरणाच्या नियमाप्रमाणे यातील पहिला शब्द बरोबर आहे. ब + ऍ + अनुस्वार हा क्रम बरोबर कारण देवनागरीत अनुस्वाराचे स्थान वेगळे आहे. 'बेंच' या शब्दात ब + ए + अनुस्वार असा क्रम आहे की नाही? मग क + ऑ + अनुस्वार का नको? याचे कारण म्हणजे युनिकोडने एक बाईट वाचविण्यासाठी ऑ + अनुस्वार = चंद्रबिंदी नावाचे नवीन चिन्ह वापरात आणले आहे. आपल्या पूर्वजांनी कागद वाचविण्यासाठी जोडाक्षरांची उभी मांडणी प्रचलित केली. तसे युनिकोडने एक बाईट वाचविण्यासाठी चंद्रबिंदू आणला. कागदाची जागा आता वायरने घेतली आहे. आपल्याला युनिकोडची मांडणी स्वीकारणे भाग आहे. pending या विभागात "जोडाक्षरे - स्वर" असा उप-विभाग आहे. त्यात या तीन नोंदी करता येतील.

  • ॅं > ँ
  • ॲं > अँ
  • ॉं > ाँ

स्वराचा बदल बॉटद्वारे करणे धोकादायक ठरू शकते. त्यासाठी पुरेशा चाचण्या करणे आवश्यक आहे. अभय सरांनी सुचविलेले शब्द गट २ मध्ये टाकता येतील.

Shantanuo (चर्चा) १०:४१, १५ सप्टेंबर २०२२ (IST)Reply

इस्लामीकरण की इस्लामिकरण

संपादन

"देवबंद" या लेखात इस्लामीकरण हा शब्द इस्लामिकरण असा झाला आहे. हा बदल चुकीचा आहे. शब्दाच्या पुढेमागे स्पेस असताना हा शब्द मॅच कसा झाला?

_इस्लामीक_ → _इस्लामिक_

"योग्य दीर्घ वेलांटी" या विभागात नागरिकरण → नागरीकरण अशी नोंद असताना "नाग नदी (नागपूर)" या लेखात उलट नोंद झाली. "पररूप संधी - इक प्रत्यय" या विभागातील नोंद हे त्याचे कारण आहे. ती नोंद बरोबर आहे त्यात स्पेसची गरज नाही. फक्त इक प्रत्यय चे शब्द बदलून झाले की योग्य दीर्घ वेलांटीचे शब्द लगेच बदलून टाकावेत म्हणजे एकाच वेळी चुकीची दुरुस्ती होईल. जर या दोन शब्दांमुळे (इस्लामिक, नागरिक) फारच गोंधळ होत असेल तर ते शब्द वगळावेत. Shantanuo (चर्चा) १४:२३, १२ सप्टेंबर २०२२ (IST)Reply

@Shantanuo: मी स्पेसचा बदल माझ्या लोकल फाईल मध्ये केला होता, पण काही तांत्रिक कारणांमुळे मला server वर लॉगिन करता येत नव्हतं. आज अपलोड केली. तसेच हे पानसुद्धा अपडेट केलं. उद्या मी वेळेवर ऑनलाईन राहील, जर काही गडबड झालीच तर लगेच निस्तरता येईल. —usernamekiran (talk) २३:३५, १२ सप्टेंबर २०२२ (IST)Reply
@Shantanuo: मी आत्ता दुसऱ्या क्रॉनजॉब मधील स्क्रिप्ट मॅनुअली रन करून तीन संपादने केली. अजूनतरी काही गडबड दिसली नाही. उद्या नेहमीप्रमाणे दोन्ही क्रॉनजॉब्स चालतील, बघू काय होते ते. —usernamekiran (talk) २२:२४, १३ सप्टेंबर २०२२ (IST)Reply
आजपर्यंतचे सर्व बदल तपासले. तुम्ही केलेले काम अगदी व्यवस्थित झालेले आहे. नाव ठेवायला कुठेच जागा नाही. एक बार्नस्टार दिला असता पण आधीच एक देऊन झाला आहे आणि तसेही असे स्टार देणं घेणं आता औट ऑफ फॅशन झाले आहे. इच्छा चे ऐच्छिक, इतिहास चे ऐतिहासिक होते तर इस्लाम चे ऐस्लामिक न होता इस्लामिक असे का? याचे कारण तो इक प्रत्यय नसून इंग्रजी शब्द आहे. मी सोयीनुसार तो या ग्रुपमध्ये ठेवला आहे. सहा तारखेला बॉटमध्ये काय बिघाड झाला होता ते समजले का? तुमचा अनुभव इथे मांडला तर इतरांना त्याचा भविष्यात उपयोग होईल. Shantanuo (चर्चा) ०९:३३, १५ सप्टेंबर २०२२ (IST)Reply
प्रशंसा, व विश्वासाबद्दल खूप धन्यवाद. मी काही बदल केलेत. fix४a या नावाचा नवीन फिक्स तयार केला, व ५/६ सप्टेंबर च्या एंट्रीस त्यामध्ये टाकल्या. हा फिक्स केवळ धुळपाटीवर चालेल. त्याच चुका परत होतात का बघता येईल. मी फाईल github वर अपडेट केली आहे. —usernamekiran (talk) २२:४८, १६ सप्टेंबर २०२२ (IST)Reply
मी नवीन क्रॉनजॉब (fix४a असलेला) मॅनुअली वापरून चार एडिट्स केले. मला काहीच संशयास्पद दिसले नाही. त्यापैकी हा एक एडिट आहे. —usernamekiran (talk) १२:४१, १९ सप्टेंबर २०२२ (IST)Reply

notes

संपादन

@Shantanuo: मी माझी निरीक्षणे सदस्य:KiranBOT II/notes इथे मांडली आहेत, पण मला त्यातून काहीच निष्पन्न झाले नाही. तुम्हाला काही संशयास्पद दिसते का? —usernamekiran (talk) ११:४९, १९ सप्टेंबर २०२२ (IST)Reply

Corrections as per Rule 5.5

संपादन

सामासिक शब्द लिहिताना समासाचे पूर्वपद तत्सम ऱ्हस्वान्त असेल तर ते पूर्वपद ऱ्हस्वान्तच लिहावे. शुद्धलेखनाचे_नियम#नियम_५.५

रेग्युलर एक्स्प्रेशनमध्ये lookahead वापरता येतो, असे असेल तर ही नोंद धूळपाटीवर करून पहा. शक्ती(?=शाली|पीठ|मान) > शक्ति याचा अर्थ असा की शक्तीशाली, शक्तीपीठ, शक्तीमान असे सर्व शब्द ऱ्हस्व पाहिजेत. उदा. "आदिशक्तीपीठे" हा शब्द "आदिशक्तिपीठे" असा बदलून मिळाला पाहीजे. हा बदल यशस्वी झाला तर या नियमात बसणारे इतर शब्द देता येतील. Shantanuo (चर्चा) १०:४०, २४ सप्टेंबर २०२२ (IST)Reply

खाली दिलेले रेग्युलर एक्स्प्रेशन हे negative lookahead या प्रकारातील असून स्क्रिप्टमधील सुमारे ४० ओळी एकाच लाईनमध्ये आणल्या आहेत. याचा अर्थ लेखात गुरुपदाचे आणि गुरुचे असे दोन शब्द असतील तर त्यातील फक्त गुरुचे हा शब्द बदलून गुरूचे असा दीर्घ होईल. पण गुरुपदाचे या शब्दात काहीच बदल होणार नाही.

('गुरु(?!कुल|कृप|गीत|गृह|ग्रंथ|चरित्र|त्व|दक्षिण|दत्त|देव|द्वार|नाथ|नानक|पत्नी|पद|परंपर|पौर्णिम|प्रसाद|मंत्र|महिम|माउली|वार|शिष्य|सिन्हा|किल्ली|कुंज|ग्राम|दास|पुष्य|बंधू|भक्त|मुख|राज|वर्य|स्थान|वायुर|जन)', 'गुरू'),

धूळपाटीवर अपेक्षित बदल झाले की नवीन सेक्शनमध्ये ही नोंद करावी लागेल ही अशीः

'msg': {'mr': 'शुद्धलेखन — (शुद्धलेखनाचा नियम ५.५)'},

Shantanuo (चर्चा) ११:५५, ३० सप्टेंबर २०२२ (IST)Reply

@Shantanuo: github प्रमाणे स्क्रिप्ट अद्ययावत केली. धूळपाटीवर आता फक्त exp2 रन होईल. संध्याकाळी व्यवस्थित टिप्पणी करतो. आत्ता घाईत आहे. —usernamekiran (talk) १४:२४, ३० सप्टेंबर २०२२ (IST)Reply
@Shantanuo: अंथरुण → अंथरूण, पांघरुण → पांघरूण, आणि भ्रुण → भ्रूण (तिन्हींच्या "णा" प्रकारासह) ह्या शब्दांचे अपेक्षेप्रमाणे बदल होत आहेत का?
regex वापरण्यास माझी हरकत नाही, पण "गुरु_ → गुरू_" व "गुरू → गुरु" केवळ ह्या दोन एंट्रीस टाकल्या तर जमणार नाही का? कि दुसरे/अजून काही conflicting शब्द आहेत? —usernamekiran (talk) २३:०१, १ ऑक्टोबर २०२२ (IST)Reply
१) त्या तीन शब्दांपैकी एक शब्द काही ठिकाणी चुकला आहे. भ्रुणहत्या हा शब्द भ्रूणहत्या असा हवा. म्हणून मी ही एक नोंद वाढवली आहे. ('भ्रुणह', 'भ्रूणह'), जिटहबवर हे बदल तुम्हाला पाहता येतील. २) तुम्ही म्हणता तशा दोन नोंदी केल्या तर 'गुरूचे' हा शब्द 'गुरुचे' असा बदलला जाईल. त्याचा अर्थ "जनावराचे" असा होईल कारण गुरु हा शब्द (विशेषतः ग्रामीण भागात) गाई-गुरे ह्या अर्थाने वापरला जातो. म्हणून तुम्ही दिलेल्या दोन नोंदी न करता मी दिलेली रेग्युलर एक्स्प्रेशनची नोंद स्वीकारावी लागेल. ती नोंद वापरण्याच्या आधी हवे तर "गुरू → गुरु" असा बदल करता येईल. म्हणजे आधी सर्व दीर्घ रू पहिल्या रु मध्ये बदलून घेऊ आणि मग ठरावीक शब्दातील ऱ्हस्व रु बदलून दुसरा रू करू. दोन्ही नोंदी एकाखाली एक अशा पद्धतीने एकाच वेळी रन झाल्या पाहीजेत. धूळपाटीवर अपेक्षित परिणाम मिळत आहेत का ते पहावे लागेल. Shantanuo (चर्चा) ११:५९, २ ऑक्टोबर २०२२ (IST)Reply
त्या तीन शब्दात अपेक्षेप्रमाणे बदल होत नाहीयेत हे तुमचे निरीक्षण बरोबर आहे. त्याचे कारण ते तीन शब्द म्हणजे ('रूण', 'रुण'), या नियमाचे अपवाद आहेत आणि त्यामुळे ते त्या नियमानंतर यायला हवे होते प्रत्यक्षात ते नियमाच्या आधी रन होत आहेत. मी त्याचा क्रम सुधारलेला आहे जिटहबवर. Shantanuo (चर्चा) १५:०३, ३ ऑक्टोबर २०२२ (IST)Reply
स्क्रिप्ट सर्वर वर अद्ययावत केली. एंट्रीच्या, व क्रॉनजॉबच्या क्रमासाठीच मी धुळपाटीवर २-३ दिवस स्क्रिप्ट चालवण्याचे म्हणत होतो, जेणेकरून आपल्याला क्रमवारी लक्षात येईल. —usernamekiran (talk) २२:३१, ३ ऑक्टोबर २०२२ (IST)Reply

आजचे सर्व बदल बरोबर आहेत. फक्त "गगनगिरी महाराज" या लेखात "अंथरुण, पांघरुण " हे दोन शब्द "अंथरुण, पांघरूण " असे बदलले आहेत. म्हणजेच केवळ पांघरुण शब्द सुधारला गेला. अंथरुण शब्दात बदल झाला नाही कारण त्यापुढे स्पेस नसून स्वल्पविराम आहे. त्यासाठी नियमात हा बदल केला आहे.

  • जुना नियमः (' अंथरुण ', ' अंथरूण '),
  • नवीन नियमः ('अंथरुण(?=\,|\.|\?|\-|\ )', 'अंथरूण'),

धूळपाटीवर हे रेग्युलर एक्स्प्रेशन अपेक्षेप्रमाणे चालत असेल तर इतर सर्व ठिकाणी शब्दानंतर जिथे फक्त स्पेस आहे तिथे याचा उपयोग करू शकता. कारण अपेक्षित शब्दानंतर काही वेळा स्पेस नसते तर डॅश किंवा इतर एखादे चिन्ह असते (उदा. भ्रूण-हत्या) Shantanuo (चर्चा) १४:२१, ५ ऑक्टोबर २०२२ (IST)Reply

@Shantanuo: मी दोन - तीन दिवसांसाठी गावाबाहेर असणार आहे, त्यामुळे मला फाइल्स सर्वर वर अपलोड करता नाही येणार, पण मी मोबाईलवर बरेचदा github व विकिपीडिया बघत असतो. —usernamekiran (talk) २२:२३, ५ ऑक्टोबर २०२२ (IST)Reply

सर्वसाधारण चुका

संपादन
  • डिग्री सेल्सियस → अंश सेल्सियस > ok
  • डिग्री सेल्सिअस → अंश सेल्सियस > ok
  • सेल्सिअस → सेल्सियस > ok
  • त्यावरूण - त्यावरुण > त्यावरून
  • खर्चीक → खर्चिक > added to #पररूप संधी - इक प्रत्यय
  • राखिव → राखीव > ok
  • किंगडम → किंग्डम > ok
  • अबक.यरल > अबक. यरल (पूर्णविराम नंतर स्पेस नाही. असं भरपूर लेखांमध्ये आहे, उदाहरण.)
regex to add space after fullstop ('\.(?=[^ ])', '\. ') needs extensive testing :)
  • github वर pull request मध्ये conflict तयार झाला होता, तो मी दुरुस्त केलाय. भरपूर लेखांमध्ये पूर्णविरामाच्या आधी व नंतर स्पेस नसणे हे बरोबर आहे. हे जास्त करून आकड्यांसंदर्भात आहे (उदा. पाय (स्थिरांक) ३.१४१५). गीतसंदर्भातील बऱ्याच लेखात math टॅग वापरलेले आहेत, टॅगच्या आत bot काम करत नाही, पण बऱ्याच लेखात math टॅग नाही. दुसरी अडचण म्हणजे pywikibot/regex हे मराठी अक्षर, आणि आकडे या दोन्हींना special character असं ग्राह्य धरते. थोडक्यात सांगायचं तर A B C ह्यांना alphabates असं ग्राह्य धरल्या जाईल, आणि अ ब क हे non-alphabatical ग्राह्य धरल्या जातील. —usernamekiran (talk) २२:३२, ८ ऑक्टोबर २०२२ (IST)Reply
('\.(?!([ ]|\w|१|२|३|४|५|६|७|८|९|०|\.|\(|\)|\[|\]|\{|\}|\<|\>|\,|\=|\:|\|))', '\. ') Shantanuo (चर्चा) १२:०४, ९ ऑक्टोबर २०२२ (IST)Reply
इंग्रजी अक्षरे, इंग्रजी आकडे, मराठी आकडे आणि विरामचिन्हे वगळली तर फक्त देवनागरी अक्षरे शिल्लक राहतात. दोन मराठी अक्षरांच्या मध्ये पूर्णविराम दिसल्यास आणि त्यापुढे स्पेस नसल्यास ती द्यावी असा वरील रेग्युलर एक्स्प्रेशनचा अर्थ आहे. Shantanuo (चर्चा) १२:१९, ९ ऑक्टोबर २०२२ (IST)Reply
@Shantanuo: मी bot पूर्वीसारखाच पूर्णपणे कार्यरत केला आहे, उद्यापासून संपादने सुरु होतील. —usernamekiran (talk) २२:३२, २३ ऑक्टोबर २०२२ (IST)Reply

क्रियापदांची -ऊन प्रत्यय असलेली रूपे

संपादन

मराठीत बऱ्याच वेळा वापरल्या जाणाऱ्या "असून","नसून", "करून" इत्यादी क्रियापदांची रूपे विकिपीडियावर विविध ठिकाणी "असुन","नसुन", "करुन" अशी दिसतात. त्यांच्यासाठी काही नियम करता येईल काय? किंवा त्यांना यादीत लिहावे काय ? मंदार १ (चर्चा) २३:४९, १६ एप्रिल २०२३ (IST)Reply

काही आढळून आलेले शब्द

संपादन

कृपया खालील शब्दांची योग्य रूपे bot ला जोडण्यात यावी :
हनूमान -> हनुमान ,
हनूमानाला ->हनुमानाला
हनूमानाच्या ->हनुमानाच्या
स्थितित -> स्थितीत
भिंति ->भिंती
मंदार १ (चर्चा) ००:०४, १७ एप्रिल २०२३ (IST)Reply

Return to the user page of "KiranBOT II/typos".