कुल पेज दृश्य

शुक्रवार, 15 अक्तूबर 2010

मशीन पठनीय शब्दकोश [तकनीकी आलेख] - डॉ. काजल बाजपेयी

मशीन पठनीय शब्दकोश [तकनीकी आलेख] - डॉ. काजल बाजपेयी


सभ्यता और संस्कृति के उदय से ही मानव जान गया था कि भाव के सही संप्रेषण के लिए सही अभिव्यक्ति आवश्यक है। सही अभिव्यक्ति के लिए सही शब्द का चयन आवश्यक है। सही शब्द के चयन के लिए शब्दों के संकलन आवश्यक हैं। शब्दों और भाषा के मानकीकरण की आवश्यकता समझ कर आरंभिक लिपियों के उदय से बहुत पहले ही आदमी ने शब्दों का लेखाजोखा रखना शुरू कर दिया था। इस के लिए उस ने कोश बनाना शुरू किया। कोश में शब्दों को इकट्ठा किया जाता है।


शब्दकोश एक बड़ी सूची होती है जिसमें शब्दों के साथ उनके अर्थ व व्याख्या लिखी होती है। शब्दकोश एक भाषीय हो सकते हैं द्विभाषिक हो सकते हैं या बहुभाषिक हो सकते हैं। अधिकतर शब्दकोशों में शब्दों के उच्चारण के लिये भी व्यवस्था होती है जैसे अन्तर्राष्ट्रीय ध्वन्यात्मक लिपि में देवनागरी में या आडियो संचिका के रूप में। कुछ शब्दकोशों में चित्रों का सहारा भी लिया जाता है। अलग अलग कार्य क्षेत्रों के लिये अलग अलग शब्दकोश हो सकते हैं जैसे विज्ञान शब्दकोश चिकित्सा शब्दकोश विधिक ;कानूनी शब्दकोश गणित का शब्दकोश आदि।


शब्दकोशों के अनेक रूप आज विकसित हो चुके हैं और हो रहे हैं। वैज्ञानिक और शास्त्रीय विषयों के सामूहिक और उस विषय के अनुसार शब्दकोश भी आज सभी समृद्ध भाषाओं में बनते जा रहे हैं । शास्त्रों और विज्ञानशाखाओं के परिभाषिक शब्दकोश भी निर्मित हो चुके हैं और हो रहे हैं । इन शब्दकोशों की रचना एक भाषा में भी होती है और दो या अनेक भाषाओं में भी । कुछ में केवल पर्याय शब्द रहते हैं और कुछ में व्याख्याएँ अथवा परिभाषाएँ भी दी जाती है। विज्ञान और तकनीकी या प्रविधिक विषयों से संबद्ध नाना पारिभाषिक शब्दकोशों में व्याख्यात्मक परिभाषाओं तथा कभी कभी अन्य साधनों की सहायता से भी बिलकुल सही अर्थ का बोध कराया जाता है । दर्शन भाषाविज्ञान मनोविज्ञान समाजविज्ञान और समाजशास्त्र राजनीतिशास्त्र अर्थशास्त्र आदि समस्त आधुनिक विद्याओं के कोश विश्व की विविध संपन्न भाषाओं में विशेषज्ञों की सहायता से बनाए जा रहे हैं और इस प्रकृति के सैकडों हजारों कोश भी बन चुके हैं । शब्दार्थकोश संबंधी प्रकृति के अतिरिक्त इनमें ज्ञानकोशात्मक तत्वों की विस्तृत या लघु व्याख्याएँ भी संमिश्रित रहती है । प्राचीन शास्त्रों और दर्शनों आदि के विशिष्ट एवं पारिभाषिक शब्दों के कोश भी बने हैं और बनाए जा रहे हैं ।


मशीन पठनीय शब्दकोश ;एमआरडी कागज पर मुद्रित करने के बजाय एक मशीन; कंप्यूटर डेटा के रूप में संग्रहित शब्दकोश है । यह एक इलेक्ट्रॉनिक शब्दकोश और शाब्दिक डेटाबेस है।


मशीन पठनीय शब्दकोश इलेक्ट्रॉनिक रूप में शब्दकोश है जोकि डेटाबेस में लोड किया जा सकता और अनुप्रयोग सॉफ्टवेयर के माध्यम से पूछा जा सकता है। यह दो या अधिक भाषाओं को या दोनों के संयोजन के बीच अनुवाद का समर्थन देने के लिए एक भाषा व्याख्यात्मक शब्दकोश या बहु भाषा शब्दकोश हो सकते हैं। एकाधिक भाषाओं के बीच अनुवाद सॉफ्टवेयर आमतौर पर द्विदिशात्मक शब्दकोशों पर लागू होते हैं। एमआरडी शब्दकोश एक ट्रेडमार्क युक्त संरचना हो सकती है जोकि एक ही कार्य करने में सक्षम सॉफ्टवेयर; उदाहरण के लिए इंटरनेट के माध्यम से ऑनलाइन द्ध के द्वारा पूछे जा सकते हैं या यह एक शब्दकोश भी हो सकता है जिसकी खुली संरचना है और कंप्यूटर डेटाबेस में लोड करने के लिए उपलब्ध है और इस प्रकार विभिन्न सॉफ्टवेयर अनुप्रयोगों के जरिए प्रयोग किया जा सकता है । पारम्परिक शब्दकोशों में विभिन्न विवरण के साथ लैमा होते हैं। मशीन पठनीय शब्दकोश में अतिरिक्त क्षमताएँ हो सकती हैं और इसलिए कभी कभी इसे अच्छा शब्दकोश भी कहा जाता है।


इलेक्ट्रॉनिक शब्दकोश या शब्दावली के प्रयोग के रूप में उदाहरण के लिए वर्तनी जाँचकर्ता में उद्घृत करने के लिए शब्दकोश का भी प्रयोग किया जाता है। यदि शब्दकोश अवधारणाओं के उपप्रकार महाप्रकार पदानुक्रम में व्यवस्थित होते हैं तो इसे वर्गीकरण विज्ञान कहा जाता है। यदि इसमें अवधारणाओं के बीच अन्य संबंध भी होए तो इसे वस्तुरूप विज्ञान कहा जाता है। खोज इंजन या तो शब्दावलीए वर्गीकरण विज्ञान या वस्तुरूप विज्ञान का उपयोग करने के लिए खोज परिणामों को अनुकूलित कर सकते हैं। विशेष इलेक्ट्रॉनिक शब्दकोश आकृति संबंधी शब्दकोश या वाक्यात्मक शब्दकोश हैं।


मशीन पठनीय शब्दकोशों में निम्ननिर्दिष्ट बातों का अनुयोग आवश्यक है


देवनागरी लिपि के लिए यूनीकोड फॉन्ट
खोजे गये शब्द का उच्चारण
स्पष्ट लेआउट / जी यू आई प्रयोग में आसान
तीन अक्षरों पर शब्द सूची
पूर्ण शब्द खोज
द्विआयामी खोज
शब्दों की सूची में से खोजने की सुविधा
सही मौखिक उच्चारण और संबंधित जानकारी
अर्थ एवं संबंधित जानकारी
शब्द पदबंध का प्रयोग
शब्द पदबंध का सचित्र चित्रण ;जहॉं उचित हो
 ******                                                           
डॉ. काजल बाजपेयी, संगणकीय भाषावैज्ञानिक, सी.डैक पुणे, साभार : साहित्य शिल्पी.

कोई टिप्पणी नहीं: