نقش نمايه در نظامهاي بازيابي اطلاعات

در اين بخش مي‌توانيد در مورد علوم دانشگاهي در سطوح و گرايشهاي مختلف به بحث بپردازيد

مدیران انجمن: شوراي نظارت, شوراي نظارت

ارسال پست
Major I
Major I
پست: 5234
تاریخ عضویت: پنج شنبه 25 خرداد 1385, 2:47 pm
سپاس‌های ارسالی: 1747 بار
سپاس‌های دریافتی: 4176 بار
تماس:

نقش نمايه در نظامهاي بازيابي اطلاعات

پست توسط ganjineh » شنبه 28 دی 1387, 7:29 pm

كليدواژه ها:
نمايه نظامهاي بازيابي  بازيابي اطلاعات  بانكهاي اطلاعاتي جامعيت مانعيت

چكيده
در اين مقاله پس از تعريف مفهوم نمايه،‌ از ضرورت آن در نظامهاي بازيابي اطلاعات بحث مي شود. تعريف بانك اطلاعاتي و پايگاه اطلاعاتي از ديگر مباحثي است كه در مقاله بدان اشاره مي گردد. در پايان، نقش و كاربرد نظامهاي بازيابي اطلاعات و عواملي كه مستقيماً از طرف نمايه بر بازيابي مدارك مرتبط تاثير مي گذارند توضيح داده مي شود.

مقدمه
ايجاد امكان دسترسي به اطلاعات،‌ از مهمترين وظايفي است كه بايد موسسه هاي اطلاع رساني سرلوحه اهداف خود قرار دهند. با بروز پديده انقلاب صنعتي و پيدايش و تكوين تكنولوژيهاي نوين،‌ حجم مواد انتشاراتي افزايش يافت. افزايش حجم انتشارات كه خود معلول دو عامل افزايش اختراعات و پيشرفتهاي تكنولوژي در حوزه دستگاه هاي چاپ و گسترش تحقيقات علمي و فني بود،‌ دستيابي به چنين هدفي را تحث تاثير قرار داد. افزايش مواد چاپي از يك طرف و افزايش تحقيقات از طرف ديگر،‌ دستيابي به مدارك منتشره در حوزه هاي مختلف موضوعي و تشخيص منابع مرتبط و مفيد از منابع و مدارك غيرمرتبط غيرمفيد را ميان انبوه اطلاعات منتشره دشوار كرد. ضرورت تحقيق كه پيش نياز توسعه در هر كشوري است، لزوم جستجوي راهي براي دستيابي سريع به مدارك مرتبط و آشكار كرد. محقق، ديگر نمي توانست براي دستيابي به مدارك، از ارتباطات شخصي استفاده كند؛ چرا كه كثرت محقق در يك حوزه موضوعي، تخصصي شدن رشته ها و افزايش اطلاعات موضوعي،‌ اتكا به چنين ابزاري را براي تبادل اطلاعات مورد سوال قرار داد. مجله ها به منزله اولين ابزار ارتباطي، جايگزين چنين روابط دوستانه اي شدند.
در قرن نوزدهم با افزايش بيش از پيش اطلاعات، ارتباطات بين رشته اي علوم،‌ افزايش اطلاعات تخصصي و ضرورت يافتن راهي براي پاسخگويي به نيازهاي محققان، به تدريج موج مخالفت با كتابداري سنتي بالا گرفت؛ چرا كه اين شيوه كتابداري توان پاسخگويي به نيازهاي اطلاعاتي محققان را نداشت. از دهه 1950 به بعد،‌ نمايه همچون راه حلي براي تسهيل دسترسي به نيازهاي اطلاعات محققان پا به منصه ظهور نهاد.

نمايه
«اصطلاح نمايه كه در مقابل كلمه اند اندكس قرار گرفته از معدود برابر نهادهايي است كه با اصطلاح اصلي از لحاظ مفهومي سازگاري بسيار دارد. اندكس در زبان فرنگي به معناي وسيله نشان دادن و مشخص كردن است و در فارسي،‌ نمايه با پسوند «ه» آلت به منزله وسيله اي براي نشان دادن است.»(1)
همانگونه كه پيش از اين اشاره شد، افزايش مواد چاپي و ناتواني روشهاي سنتي كتابخانه اي در پاسخگويي به نيازهاي استفاده كننده، محققان را بر آن داشت تا راهي را براي تسهيل دستيابي به منابع مرتبط جستجو كنند- ابزاري كه بايد توانايي برآوردن نيازهاي محققان را در كمترين زمان و با حداكثر اطلاعات مرتبط و ممكن فراهم آورد. از اين رو،‌ نمايه به منزله اولين نتيجه چنين كاوشي پديدار شد. همانگونه كه «روتمن» اشاره مي كند «نمايه، خط ارتباطي بين منابع اطلاعات و استفاده كننده است.(2)
به عبارت ديگر، ميتوان گفت كه نمايه «صورتي از موضوع ها و واژه هاي مهم، اساسي و ديگر مطالب يك يا چند كتاب، مقاله يا ساير مدارك با ارجاع به صفحات يا منابعي است كه اين مطالب در آنها واقع شده‌اند.»(3)
نمايه انواع گوناگوني دارد. نمايه ها مي توانند ناظر بر يك اثر، مجموعه اي خاص،‌ يا گروهي از مجموعه ها و يا ناظر بر بانك يا پايگاه اطلاعاتي ويژه اي باشند، وقتي صحبت از نمايه موضوعي و واژه اي به ميان مي آيد، از جهت اصطلاحي نمايه ها را مي توان به دو دسته تقسيم كرد.

1.نمايه واژه اي يا الفبايي: از اين نظام،‌ براي سهولت بازيابي مدارك از خنثي ترين شيوه نظم دهي كه براي همگان آشناست،‌ يعني نظم الفبايي، استفاده مي شود. نمايه واژه اي يا الفبايي خود به سه دسته تقسيم مي شود: الف. نمايه كنترل شده؛ ب. نمايه سازي آزاد؛ ج. نمايه سازي طبيعي. اولين نمايه ها با تاكيد بر زبان طبيعي ساخته شدند. در اين روش تاكيد بر استفاده طبيعي كلمات متن است. با ورود كامپيوتر دو نوع نمايه ماشيني كوئيك و كووك از نوع نمايه سازي واژه اي پيش كشيده شد. اين دو نوع نمايه از نوع نمايه حذفي است.»(4)يعني با تهيه فهرستي از كلمات، از كامپيوتر مي خواهيم تا آنها را به عنوان مدخل برگزيند. تنها دخالت انسان در تهيه اين نوع نمايه ها، همان تهيه سياهة كلمات ممنوعه (Stop list) است.

2. نمايه موضوعي: كه غالباً ناظر بر مجموعه اي از مدارك مانند كتابهاي يك كتابخانه،‌ مطالب چند مجله و .... است. در اين گونه نمايه،‌ هر مدرك مورد مطالعه قرار مي گيرد و تعدادي واژه كه بيانگر محتواي اطلاعاتي آن مدرك يا مقاله است از درون متن استخراج مي شود. معمولاً انتساب واژه به هر مدرك با استفاده از واژگان كنترل شده صورت مي پذيرد. استفاده از سرعنوانهاي موضوعي يا اصطلاحنامه،‌ روند موضوع دهي و همگوني واژه هاي انتسابي به مدارك مشابه را تسهيل مي كند. اين روند براي تمامي مدارك تكرار مي شود. پس از استخراج، اين واژه ها الفبايي مي شوند. معمولاً هر واژه به شماره يا علامتي كه بيانگر صفحه يا مدركي است كه واژه مورد نظر در آن قرار دارد ارجاع مي دهد. در ساختار چاپي، استفاده كننده پس از يافتن واژه، آدرس مدرك مرتبط را يادداشت و به آن مراجعه مي كند.
در نظامهاي بازيابي اطلاعات، وقتي صحبت از نمايه به ميان مي آيد، معمولاً تركيبي از چند شيوه نمايه سازي را مدنظر قرار مي دهد. امروزه، گرايش به سمت نمايه سازي موضوعي است. در نظام موضوعي،‌ براي پرهيز از ناهمگوني نمايه و تسهيل بازيابي،‌ از واژه هاي كنترل شده استفاده مي شود. يعني، در مواردي چون مترادفات، معناي متفاوت،‌ شكل نوشتاري مختلف و ... يكي از كلمه ها را به منزله كلمه يا واژه پذيرفته شده در نظر مي گيرند و از ساير كلمات مترادف و يا شيوه نگارش مختلف كلمه به آن ارجاع مي دهند. مثلاً كلمه «كليدواژه» را به عنوان موضوع پذيرفته شده در نمايه وارد مي كنند و از كلمات مترادف ديگري چون «واژه راهنما»‌، «واژه شاخص»،‌ «كلمه كليدي» و «واژه كليدي» به موضوع پذيرفته «كليدواژه» ارجاع مي دهند. اگر محقق يا جستجوگر،‌ ذيل هريك از كلمات «واژه راهنما»، «واژه شاخص» و... جستجو كند با ارجاع «نگاه كنيد به» (نك) به واژة پذيرفته شده «كليدواژه» راهنمايي مي شود. ويژگي اين نظام آن است كه اولاً: استفاده كنندگان مختلف يك نمايه در موضوعي واحد به اطلاعات مشابه و در عين حال كاملي دست مي يابند. ثانياً: وجود نظام ارتباطي بين واژه ها ميزان اطمينان را بالا مي برد،‌ چرا كه جوينده يا پژوهشگر با مراجعه به نمايه،‌ اطمينان مي يابد كه با دانستن يك واژه مي تواند به تمامي مدارك مرتبط با موضوع تحقيق خود دست يابد؛ هر چند كه تمامي مترادفات يا شيوه هاي مختلف نگارش آن كلمه را نداند.
انتخاب واژه اي به منزله «واژه پذيرفته شده يا توصيفگر» برتوافق استوار است. براي مثال، براساس توافق در موسسه اي،‌ نمايه سازان ممكن است از ميان واژه هاي «تز» «رساله دانشگاهي» و «پايان نامه» را به منزله موضوع پذيرفته شده انتخاب كنند و از دو واژه ديگر به آن ارجاع دهند. در موسسه اي ديگر، ممكن است توافق بر پذيرش واژه ديگري – مثلاً «تز» - به منزله توصيفگر استوار باشد.
به رغم تفاوتهاي عمده اي كه در نوع نمايه ها وجود دارد،‌ تمام نمايه ها از دو جنبه هدف و ساختار،‌ در يك راستا قرار دارند. هدف تمام نمايه ها افزايش ميزان دسترسي مراجعه كننده به مطالب موضوعي مورد جستجو است. از اين لحاظ ممكن است كه نمايه ها بسته به جامعه استفاده كننده و نيازهاي اطلاعاتي آنها با هم متفاوت باشند. گزينش مواد از ميان مطالب منتشره،‌ توجه به موضوعي خاص، سوگيري زباني، توجه به مدرك و منبعي خاص و ... از جمله عواملي هستند كه مي توانند بر هدف نمايه ها تاثير بگذارند. از نظر ساختار،‌ نمايه ها،‌ بويژه نمايه هاي موضوعي از اجزاي تقريباً يكساني تشكيل شده اند. همانگونه كه در شكل 1 نشان داده شده است، اين اجزا عبارت اند از:

تصویر


الف: مدخل (Entry) كه عبارت از موضوع پذيرفته شده و نشده است.
ب. سرعنوان يا توصيفگر (Discriptor) كه موضوع يا اصطلاح پذيرفته شده را گويند. همانگونه كه پيش از اين توضيح داده شد،‌ پذيرش كلمه اي به عنوان توصيفگر بر توافق استوار است.
ج. بيانگر (Modifier)،‌ موضوعات يا واژه هايي هستند كه گرچه پذيرفته نشده و در جايگاه توصيفگر قرار نگرفته اند؛ اما جزئي از نمايه اند و در بازيابي مدارك مورد استفاده قرار مي گيرند. از بيانگرها به توصيفگرها ارجاع داده مي شود.
هريك از موضوعات پذيرفته شده و نشده مورد اشاره،‌ در نظام الفبايي قرار مي گيرند با اين تفاوت كه از موضوعات پذيرفته نشده يا «بيانگر» به موضوعات پذيرفته شده يا «توصيفگر» ارجاع داده شده است.


بانك اطلاعاتي و پايگاه اطلاعاتي
پيدايش تكنولوژي كامپيوتر و تواناييهاي شگفت انگيز آن در پردازش داده ها سبب شد كه بزودي اين پديده نوظهور جايگاه خود را در تمامي رشته ها باز كند. كتابخانه ها نيز از اين امر مستثنا نماندند. در ابتدا،‌ هرچند كامپيوترها براي ذخيره اطلاعات و موجودي كتابخانه ها مورد استفاده واقع شدند؛ توانايي آنها در امر پردازش سبب شد تا در ساير بخشهاي كتابخانه – از جمله فهرستنويسي،‌ ميز امانت،‌ خدمات مرجع و ... نيز به كار گمارده شوند. اوج استفاده از كامپيوترها در خدمات كتابخانه اي را بايد در ايجاد و تكوين نظامهاي بازيابي اطلاعات سراغ گرفت. سرعت پردازش،‌ توان بالاي ذخيره اطلاعات،‌ صرفه جويي در فضا و ساير موارد سبب شد كه نظام سنتي كتابداري اندك اندك جايگاه خودش را به نظامهاي كامپيوتري بسپارد. بدين سان مجموعه كتابخانه ها وارد حافظه هاي كامپيوتر شدند و پايگاههاي اطلاعات علمي را بوجود آوردند. آنگونه كه «لنكستر» خاطر نشان مي سازد. «پايگاه هاي اطلاعاتي غالباً براي برآوردن نيازهاي اطلاعاتي جامعه استفاده كننده خود ايجاد مي شوند.» (5)
به عبارت ديگر، فشارهاي ناشي از نيازهاي استفاده كنندگان اطلاعات،‌ سبب تكوين نظامهاي بازيابي و در نتيجه پيدايش پايگاههاي اطلاعاتي شد. پايگاه هاي اطلاعاتي عمدتاً وظيفه ارجاعي و مرجع دارند ولي غالباً به ارائه اصل مدرك نيز مي پردازند كه ممكن است از لحاظ نوع خدمات و ميزان مدارك موجود در آنها با يكديگر متفاوت باشند. هر پايگاه بسته به گستره پوششي خود مي تواند از مجموعه يك كتابخانه تا ارجاع به هزاران مدرك و مجموعه هاي چندين كتابخانه در سطح بين المللي متفاوت باشد. توان دسترسي به اطلاعات بايگانيهاي سازمان يا موسسه اي از طريق تمام بخش هاي آن سازمان،‌ مي تواند مثالي از يك پايگاه اطلاعاتي باشد. در عين حال، پايگاه اطلاعاتي مي تواند دسترسي به مجموعه هزاران كتابخانه يا مجموعه را در سطح جهان فراهم آورد. هر پايگاه اطلاعاتي معمولاً از مجموعه هاي متفاوتي تشكيل شده است. هر مجموعه مجزا از پايگاه اطلاعاتي را يك بانك اطلاعاتي مي گويند. بانك اطلاعاتي مجموعه اي از مدارك مرتبط و غالباً‌ در يك حوزه موضوعي خاص است كه معمولاً‌ در فايلي جداگانه نگهداري مي شوند و از طريق ابزار بازيابي ويژه اي قابل جستجو هستند. در مثال فوق،‌ اگر اطلاعات مربوط به امور پرسنلي،‌ اطلاعات مربوط به كارمندان،‌ امور مالي و ... در فايلهاي جداگانه اي نگهداري شوند،‌ هر يك از اين اطلاعات مرتبط و در عين حال مجزا را يك بانك اطلاعاتي گويند. اگر موسسه اي با ايجاد برنامه اي كامپيوتري،‌ امكان دسترسي كارمندان بخش هاي گوناگون به بايگانيهاي يكديگر را فراهم آورد،‌ توان دسترسي به اين فايلهاي مجزا،‌ بانكهاي اطلاعاتي مجزا را به پايگاه اطلاعاتي تبديل مي كند. بانكهاي اطلاعاتي از لحاظ تعداد مجلات تحت پوشش و سال هاي پوششي با يكديگر اختلاف دارند. براي مثال بانك اطلاعاتي CAB‌ بيش از ده هزار عنوان مجله را ازسال 1980 به بعد نمايه مي كند. در صورتي كه بانك اطلاعاتي Medline‌ اطلاعات كتابشناختي سه هزار و دويست مجله را از سال 1966 به بعد نمايه مي نمايد. در يك پايگاه اطلاعاتي،‌ مسئله اساسي توان برقراري ارتباطات درون پايگاهي اطلاعات است؛ يعني،‌ ارتباط بين بانكهاي اطلاعاتي مختلف در يك پايگاه به سهولت انجام پذيرد. از طرف ديگر،‌ يافتن هر چه سريع تر مدارك مفيد و مرتبط،‌ كاهش بازيابي مدارك نامرتبط،‌ از اهداف عمده پايگاه هاي اطلاعاتي هستند.
بنابراين،‌ توانايي بازيابي مدارك مرتبط با نيازهاي استفاده كننده را «جامعيت» (Recall) و توان جلوگيري از بازيابي مدارك غيرمرتبط با نيازهاي استفاده كننده را «مانعيت» (Pre-cision) پايگاه اطلاعاتي گويند.
بانك هاي اطلاعاتي از لحاظ نوع اطلاعات ذخيره شده در آنها به سه دسته كلي تقسيم مي شوند:

الف: بانكهاي اطلاعاتي كتابشناختي (Biblio-graphic Database). در اين بانك ها كه به بانكهاي ارجاعي نيز مشهورند، اطلاعات كتابشناختي مدارك از جمله عنوان،‌ نويسنده،‌ محل دستيابي به مدرك،‌ تاريخ انتشار،‌ سال نشر و ... را غالباً همراه با چكيده و كليدواژه ها ارائه مي دهند. در واقع در اين بانك ها امكان دسترسي به اصل مدرك وجود ندارد. با استفاده از اطلاعات ارائه شده در اين بانك ها مي توان به محل دستيابي به مقاله دست يافت.

ب. بانك هاي اطلاعاتي تمام متن: (Full Text Database). در اين بانك ها،‌ متن مجله هاي ويژه اي وارد كامپيوتر مي شود. يعني همزمان با جستجو مي توان از متن مدرك نيز كپي تهيه كرد.

ج. بانكهاي اطلاعاتي تصويري: (Image Database). اين بانكها مشابه بانكهاي اطلاعاتي تمام متن هستند،‌ با اين تفاوت كه به جاي تايپ مدرك در كامپيوتر،‌ توسط دستگاه هاي ويژه اي به نام اسكنر (Scanner)، اطلاعات مدارك وارد كامپيوتر مي شوند. بنابراين ايجاد چنين بانك هايي باسرعت انجام مي شود و تعداد مدارك بيشتري را مي توان وارد كامپيوتر نمود.

ابزارهاي بازيابي اطلاعات
همانگونه كه اشاره شد پايگاه هاي اطلاعاتي،‌ مجموعه اي از منابع مرتبط اند كه در يك يا چند حوزة موضوعي به ارائه اطلاعات كتابشناختي يا اطلاعات كامل مدارك مي پردازند. اطلاعات ذخيره شده در اين پايگاه ها بايد براي كاربردهاي تحقيقي و علمي مورد استفاده واقع شوند. بنابراين،‌ براي دستيابي به چنين اطلاعاتي بايد از ابزارهايي استفاده كرد كه توان دستيابي سريع به مدارك مورد نياز را فراهم مي آورند. پديدآوردندگان پايگاه هاي اطلاعاتي عمدتاً‌ نرم افزار ويژه اي را براي دستيابي به اطلاعات موجود در پايگاه هاي اطلاعاتي طراحي مي كنند. اين نرم افزارها كه از چندين برنامة ساده يا پيچيده كامپيوتري تشكيل شده اند در پايگاه هاي اطلاعاتي مختلف داراي طرح و ساختار متفاوتي اند. هر پايگاه اطلاعاتي از چند بانك اطلاعاتي تشكيل شده است. در اين بانكهاي اطلاعاتي مختلف، غالباً نرم افزار واحدي براي جستجوي اطلاعات طراحي مي شود. بنابراين، با فراگيري يك نرم افزار بازيابي،‌ مي توان بانك هاي اطلاعاتي مختلفي را جستجو كرد. براي مثال،‌ مي توان از نرم افزار بازيابي ديالوگ نام برد كه امكان جستجو در بيش از چهارصد و پنجاه بانك اطلاعاتي در حوزه هاي مختلف علمي را فراهم مي آورد. بعضي از موسسه هاي تجاري با قبول سفارش از موسسه هاي توليد كننده اطلاعات اقدام به تهيه نرم افزار بازيابي مي كنند.
از جمله اين موسسه ها مي توان موسسه سيلورپلنز (Silver Platter) را نام برد. كليه بانك هايي كه نرم افزار اين موسسه روي آنها نصب شده است از طرح و ساختار تقريباً مشابهي براي كاوش برخوردارند.

نمايه و نظامهاي بازيابي اطلاعات
براي تسهيل و امكان پذير ساختن كاوش در پايگاه هاي اطلاعاتي،‌ توسل به نظامي كه برپايه اصول و منطقي خاص پايه ريزي شده باشد ضروري است. چنين نظامي علاوه بر افزايش توانايي دستيابي به مدارك مرتبط با موضوع پژوهش،‌ باعث افزايش سرعت بازيابي نيز مي شود.
هر پايگاه اطلاعاتي از هزاران مدرك تشكيل شده است. نمايه به منزله مهم ترين ابزار ايجاد امكان دسترسي به منابع مرتبط،‌ در ساختار بانك هاي اطلاعاتي استفاده مي شود. اصولاً توليدكنندگان بانك هاي اطلاعاتي،‌ با توجه به جامعه استفاده كننده و اهداف خود،‌ دست به گزينش مي زنند. گزينش در سه حوزه «نوع مدرك»‌ «سطح نمايه» و «زبان مدرك» صورت مي پذيرد. بسياري از بانك هاي اطلاعاتي به ارائه مقالات منتشر شده در مجلات مي پردازند. وسعت انتشار گسترة موضوعي مجلات منتشره سبب مي شود كه تاسيس كنندگان بانكهاي اطلاعاتي از لحاظ موضوع و تعداد مجلات، دست به گزينش بزنند. براي مثال، بانك اطلاعاتي Adonis‌ صرفاً كل مقالات تقريباً هفتصد مجله پزشكي را به صورت تمام متن ارائه مي كند.
در بسياري از موارد،‌ مشكلات زباني سبب مي شود تا ايجاد كنندگان بانكهاي اطلاعاتي صرفاً مقالات مجلات را به زبانهاي ويژه اي نمايه كنند. در پايگاه هاي اطلاعاتي، پس از مشخص شدن مداركي كه در حوزه شمول آنها قرار مي گيرند، هر مدرك به وسيله عده اي از متخصصان خوانده مي شود. اغلب،‌ اين متخصصان را نمايه سازان يا تركيبي از نمايه سازان و متخصصان تشكيل مي دهند. نمايه ساز به دقت مدرك را بررسي مي كند. در نتيجه بررسي دقيق مدرك،‌ توان تصميم گيري درباره شامل شدن واژه در امر نمايه سازي را فراهم مي آورد؛ يعني كدام واژه بايد در نمايه سازي بكار گرفته شود.(6) معمولاً اين واژه ها از درون متن بيرون كشيده مي شوند. محل قرارگرفتن هر واژه در متن مدرك نمايه شده،‌ داراي اهميت فراواني است. براي مثال، واژه اي كه در عنوان مقاله اي وجود دارد، نسبت به واژه اي كه از چكيده مدرك بيرون كشيده شده به مراتب ارزش بيشتري دارد. در ارزش دهي به كلمات در بخش هاي مختلف مدرك،‌ بويژه عنوان،‌ اصل بر مرتبط بودن كلمات با محتويات اثر است. در نمايه سازي، دقت در انتخاب واژه داراي اهميت فراواني است. گزينش واژه نامرتبط با موضوع مدرك سبب گمراهي استفاده كننده و در عين حال كاهش استحكام و صحت نمايه مي شود.
نمايه ساز با توجه به اهميت و محل قرارگرفتن واژه ها،‌ موضوع مدرك و نيازهاي اطلاعاتي جامعه استفاده كننده،‌ واژه هايي را به هر مدرك منتسب مي كند. بنابراين،‌ روند نمايه سازي در بانكهاي اطلاعاتي دو مرحله دارد: «الف. تحليل مفاهيم (Concept Analysis) ب. ترجمه (7)
در مرحله تحليل مفاهيم،‌ نمايه ساز با اين مسئله روبه روست كه مدرك درباره چه چيزي بحث مي كند. در مرحله ترجمه، نمايه ساز درگير تبديل مفاهيم استخراج شده از متن به گروهي از واژه هاي پذيرفته شده نمايه اي است. «در اين مرحله،‌ گاه واژه هاي پذيرفته شده نمايه اي است.‌« در اين مرحله،‌گاه واژه ها از متن مدرك استخراج مي شوند،‌ يعني واژه هاي برگزيده دقيقاً در متن به كار رفته اند. گاهي واژه ها ،‌واژه هايي از پيش تعيين شده اند.» (8) براي موثر بودن نمايه، نمايه ساز بايد از علايق جامعه مورد نظر آگاهي داشته باشد. در سازماني ويژه،‌ گاهي نمايه ساز به واژه هاي از پيش تعيين شده اي استناد مي كند و گاه به هيچ منبعي استناد نمي كند. بنابراين نمايه سازي ممكن است به دو شيوه انجام گيرد؛ الف. نمايه سازي از طريق گزينش آزاد واژه ها، ب. نمايه سازي از طريق واژگان كنترل شده.
در بيشتر بانكهاي اطلاعاتي، نمايه غالباً ناظر بر مجموعه اي از لغات كنترل شده است. نمايه سازان از اصطلاحنامه هاي موضوعي براي ايجاد هماهنگي و انسجام بين واژه هاي نمايه استفاده مي كنند. در اصلاحنامه روابط سلسله مراتبي، واژه هاي مرتبط و واژه هاي اعم و اخص مشخص شده اند. با استفاده از ارجاعات، از موضوعات پذيرفته نشده به موضوعات پذيرفته شده ارجاع داده شده است. اصولاً، هدف از بكارگيري واژه هاي كنترل شده در نمايه، افزايش امكان دستيابي به مدارك مرتبط با موضوع مورد كاوش است. استفاده از روابط سلسله مراتبي كل به جزء‌ و استفاده از نظام ارجاعات «نگاه كنيد» به براي ارجاع موضوعات پذيرفته نشده به موضوعات پذيرفته شده و ارجاع «نيز نگاه كنيد به» براي ارتباط دادن موضوعات همسنگ سبب مي شود تا جستجوگر به سهولت مطالب مورد نياز خود را كاوش كند. بنابراين، «نمايه خط ارتباطي بين منابع اطلاعات و استفاده كننده است».(9)
پس از انتخاب كليدواژه ها، براي هر مدرك، ركورد يا سابقه اي اطلاعاتي تشكيل مي دهند. معمولاً در سابقه هر مدرك فقره هاي اطلاعاتي مختلفي چون عنوان نويسنده (گان) مدرك، محل دستيابي به مقاله، محل نشر، ناشر،‌ تاريخ نشر،‌ زبان مدرك و كليدواژه هاي آن ارائه مي شوند.
كليدواژه ها همان اصطلاحاتي اند كه نمايه ساز به مدرك منتسب ميكند. بيشتر بانكهاي اطلاعاتي چكيده اثر را نيز ارائه مي دهند. پس از ورود اطلاعات مربوط به هر مدرك در كامپيوتر، كليدواژه هاي آن استخراج و به صورت الفبايي و گاه براساس نظام اصطلاحنامه،‌ الفبايي مي شود و شماره سابقه هر مدرك نيز در مقابل كليدواژه قرار مي گيرد. بنابراين،‌ با رجوع به نمايه و يافتن واژه مرتبط با موضوع مورد جستجو،‌ به راحتي مي توان با نوشتن شماره سابقه،‌ به اطلاعات كامل مدارك مورد نظر دست يافت. امروزه،‌ با كاربرپسند شدن برنامه هاي كامپيوتري، پيشرفتهاي فراواني در امر بازيابي از طريق نمايه به وجود آمده است. بنابراين، ميتوان گفت كه در نظامهاي بازيابي،‌ نقش نمايه تسريع و كاوش مواد مرتبط است.
بانكهاي اطلاعاتي با تركيب چند ويژگي و استفاده از تواناييهاي كامپيوتر در كار بازيابي،‌ توان جستجو را افزايش داده اند. امروزه،‌ علاوه بر كاوش از طريق نمايه، جستجوي آزاد در سابقه مدارك موجود در بانكهاي اطلاعاتي نيز فراهم آمده است؛‌ يعني،‌ با وارد كردن كليدواژه يا اصطلاح مورد نظر در كامپيوتر،‌ مي توان در تمام فقره هاي اطلاعاتي موجود،‌ در سابقه مدرك جستجو كرد. حتي،‌ امكان جستجو در فقره اطلاعاتي خاصي نيز وجود دارد. مثلاً با استفاده از دستوراتي، مي توان صرفاً عنوان مدرك را كاوش كرد. علاوه بر اين،‌ با استفاده از دستورات "and"، "Or" و "not" امكان كاوشهاي پيچيده نيز ميسر است.

نقش نمايه در كاوش مدارك مرتبط
همان گونه كه پيش از اين اشاره شد،‌ بيشتر بانكها يا پايگاه هاي اطلاعاتي به ارائه اطلاعات كتابشناختي مدارك مي پردازند. از آنجا كه دسترسي به اصل مدارك در پايگاه هاي اطلاعاتي به صورت فراگير ميسر نبوده و اصولاً هدف بانكهاي اطلاعاتي نيز فراهم آوري اصل مدارك نيست؛‌ كليدواژه هايي كه در سابقه هر مدرك قرار مي گيرند از اهميت فراواني برخوردارند. هر چه كليدواژه هاي انتخابي براي انتساب به مدرك همخواني بيشتري با مطالب ارائه شده در مدرك داشته باشد، امكان جستجوي منابع مرتبط با نياز جستجوگر افزايش مي يابد. علاوه بر اين، در بسياري از بانكهاي اطلاعاتي،‌ براي افزايش امكان جستجوي منابع مرتبط،‌ براي هر مدرك چكيده اي تهيه مي كنند و در سابقه آن مدرك قرار مي دهند. هرچه اطلاعات چكيده بيشتر باشد،‌ حوزة‌ موضوعي مدرك مشخص تر و خواننده يا جستجوگر بهتر مي تواند از مرتبط بودن مدرك با نيازهاي اطلاعاتي خويش آگاهي يابد. از طرف ديگر،‌ ارائه اطلاعات بيشتر توان فراهم آوري نقاط دستيابي (Access Point) بيشتري را فراهم مي آورد.
«هنگام جستجو در پايگاه يا بانك اطلاعاتي،‌ جستجوگر مي خواهد مداركي كه نيازهاي اطلاعاتي اش را برآورده مي كنند بازيابي كند و از بازيابي مداركي كه با نيازهاي اطلاعاتي او سازگاري ندارند جلوگيري شود. دو اصطلاح «مرتبط» (Rel-evant)‌ و مناسبت (Pertinent)‌ براي بيان مفيد بودن مدرك به كار گرفته مي شود.» (10)
از اين لحاظ، نمايه سازان بايد هنگام استخراج واژه از مدرك در گزينش كليدواژه دقت لازم را مبذول دارند. توجه به انتخاب واژه هاي مناسبي كه بتواند گوياي محتواي اطلاعاتي مدرك باشد،‌ در استحكام نظامهاي بازيابي پايگاه هاي اطلاعاتي نقشي اساسي دارد. علاوه بر اين،‌ بايد توجه داشت كه واژه يا اصطلاحي كه به منزلة‌ كليدواژه انتخاب مي شود بايد داراي ويژگيهاي ذيل باشد:
1. احتمال مراجعه به آن واژه يا اصطلاح وجود داشته باشد.
2. تداول عام داشته باشد.
3. از زبان جوينده نشات گرفته باشد.
بنابراين،‌ نمايه ساز با توجه به سه ويژگي مطروحه فوق،‌ بايد واژه هايي را به مدرك منتسب كند كه در ميان متخصصان آن حوزه موضوعي رواج داشته و بارها مورد استفاده قرار گرفته باشد.
دو عامل نمايه اي بر نظامهاي بازيابي اطلاعات،‌ تاثير مستقيم دارند. اين دو عامل عبارت اند از:‌ الف. خط مشي نمايه سازي وب. صحت و دقت نمايه سازي. خط مشي نمايه سازي را مديران مراكز اطلاع رساني تعيين ميكنند. بنابراين، از كنترل نمايه ساز خارج است؛ اما، صحت و دقت نمايه سازي در كنترل نمايه ساز قرار داد.» (11) از اين رو، مديران مراكز اطلاعاتي نقش بسيار مهمي در ميزان استحكام نمايه در پايگاه اطلاعاتي دارند؛ چرا كه تصميم گيري صحيح و تعيين خط مشي اصولي براي نمايه كردن مدارك مستقيماً بر نظام بازيابي تاثير مي گذارد.
هر چند عوامل ديگري مانند حوزة‌ پوششي پايگاه اطلاعاتي،‌ شيوة نمايه سازي،‌ شيوه و نوع چكيده ارائه شده، كيفيت واژه ها و اصطلاحات به كار رفته در نمايه و كيفيت راهبرد كاوشي (Search Strategy) در افزايش ميزان رضامندي جستجوگر تاثير مي گذارند، اما تعيين خط مشي نمايه مهم ترين عامل تاثيرگذار بر استحكام نمايه است. تعيين تعداد واژه هاي انتسابي به هر مدرك، تاثير مستقيمي بر بازيابي مدارك در بانكهاي اطلاعاتي دارد و سبب شكل گرفتن سلسله مباحثي چون «كلي نگري» (Exhaustivity)، «جزءنگري» (Specifity)‌ و ميزان «سازگاري» (Consistency)‌ مي شود كه در اينجا،‌ به ترتيب به آنها پرداخته ميشود.

كل نگري
مهمترين عاملي كه در خط مشي نمايه سازي بايد دربارة‌ آن تصميم گيري شود،‌ كل نگري در نمايه است. كل نگري به معناي متوسط اصطلاحات يا واژه هايي است كه براي مدركي در نظر گرفته مي شود. «كل نگري» بر استفادة مناسب و كافي از واژه يا اصطلاح براي تحت پوشش قرار دادن كامل مباحث موضوعي مدرك دلالت دارد. (12) هرچه واژگان مورد استفاده در نمايه بيشتر باشد، امكان دستيابي و احتمال بازيابي مدارك افزايش مي يابد. افزايش كل نگري باعث افزايش جامعيت (جستجوي منابع مرتبط) و عمق نمايه‌سازي مي شود. اما، بايد توجه داشت كه انتساب واژه به مدرك،‌ نبايد از حد خاصي فراتر رود؛ چرا كه افزايش واژه هاي منتسب به مدرك باعث كاهش مانعيت (حذف مدارك غيرمرتبط) مي شود. اين امر به دو دليل عمده پيش مي آيد:
اول آنكه هر چه نقاط دسترسي بيشتر باشد، امكان وجود كلمات غيرمرتبط با متن افزايش مي يابد. بنابراين،‌ در بازيابي مدارك،‌ استفاده از كلمات نامرتبط سبب دسترسي به مدارك نامرتبط ميشود. دليل دوم آن است كه هرچه نقاط بازيابي و به عبارتي، كلمات منتسب به مدركي بيشتر باشد،‌ هنگام ارتباط دادن واژگان به يكديگر، احتمال وجود ارتباط كاذب بيشتر مي شود. پيوند غلط و اشتباه واژگان و به كارگيري واژه نادرست و نامرتبط، از پيامدهاي ارتباط كاذب در نمايه سازي است. بنابراين، براي افزايش جامعيت «بايد واژه هاي اعم را برگزيد. با گزينش واژه هاي اخص تر،‌ مانعيت افزايش مي يابد.» (13) كل نگري نقش بسيار مهمي در بازيابي مدارك دارد و به نظر مي رسد كه افزايش كل نگري تا سطح معيني سبب افزايش بازيابي مي شود. تعيين سطحي كه افزايش واژه منتسب به مدرك از آن سطح سبب كاهش مانعيت مي شود به عوامل متعددي چون تجربه نمايه ساز،‌ نوع مدرك مورد نمايه،‌ سياست نمايه سازي،‌ نوع مخاطبان و ... وابسته است.
نتيجه آنكه هر چه اصطلاحات انتسابي به مدركي و به عبارتي، كل نگري،‌ بيشتر باشد، هزينه نمايه افزايش مي يابد. و اگر كل نگري نمايه ازسطح خاصي فراتر رود،‌ مفاهيم كمتري در نمايه وجود خواهد داشت كه اين باعث خواهد شد نمايه نتواند نيازهاي استفاده كننده را كاملاً برآورده كند.

جزء نگري
ميزان جزء نگري نمايه عامل ديگري است كه بر نظامهاي بازيابي تاثير مي گذارد و اين تاثير مستقيماً ناشي از نمايه است. جزئيت به اين معناست كه موضوع يا واژه هاي منتسب به مدرك بايد تمام مدرك را ازلحاظ موضوع، كاملاً مورد بحث قرار دهد. بنابراين، به مقاله اي درباره «كشت پرتقال»‌ بايد ترجيحاً موضوع «پرتقالها» و نه موضوع «مركبات»‌ يا «ميوه»‌ را داد.
بنابراين، جزء نگري نمايه با مرتبط بودن موضوع منتسب به مدرك و مفاهيم مورد بحث در همان مدرك سروكار دارد. هر چه واژه هاي انتخاب شده اخص تر باشد،‌ جزء نگري نمايه بيشتر مي شود. بهتر اين است كه به جاي استفاده از اصطلاحي كلي، از چند واژه يا اصطلاح اخص استفاده شود. براي مثال اگر مقاله اي درباره «ليموشيرين»، «پرتغال» و «نارنگي»‌ بحث مي كند،‌ بهتر است كه به جاي استفاده از موضوع كلي «مركبات» سه موضوع «ليموشيرين»، «پرتغال» و «نارنگي» را به مقاله بدهيم تا باعث افزايش امكان بازيابي مدارك مرتبط و در عين حال، استحكام نمايه شود. جزء نگري نيز داراي سطوح مختلف است و ممكن است از موسسه اي به موسسه ديگر متفاوت باشد. سطح دانش و انتظارات استفاده كننده نيز متخصص تر باشد، جزء نگري بايد به همان نسبت افزايش يابد.
كل نگري و جزء نگري از مهم ترين عواملي اند كه بر ارائه نمايه اي منسجم تاثير مي گذارند. توجه به كل نگري و جزء نگري در نمايه و ارائه سطح مناسبي از اين دو عامل در انتساب واژه به مدرك،‌سبب استحكام نمايه مي شود. افزايش جزء نگري سبب افزايش مانعيت (حذف مدارك غيرمرتبط) مي شود؛‌ اما،‌ اگر اين جزء نگري از سطحي فراتر رود بسياري از مدارك،‌ مورد بازيابي قرار نخواهند گرفت. دليل اين امر آن است كه انتساب واژه اخص به مدرك،‌ سبب مي شود كه مداركي كه با موضوع مورد جستجو ارتباط اندكي دارند و يا بخشي از مدرك با موضوع مورد كاوش ارتباط دارد،‌ بازيابي نشوند. نتيجه آنكه كل نگري،‌ با گستره پوششي انتساب واژه مرتبط است و جزء نگري با عمق مفاهيم ارتباط مي يابد. كل نگري تعيين كننده خط مشي نمايه است؛‌ اما جزء نگري بر اخص شدن و تخصصي تر شدن لغات مورد استفاده در نمايه دلالت مي كند. بنابراين،‌ در طراحي نمايه بايد كوشيد تا به سطح مناسبي از جزء نگري كه توان برآوردن نيازهاي استفاده كننده را داشته باشد، دست يافت.

سازگاري
در نمايه سازي، تكيه بر انتخاب واژه هاي با اهميت تر سبب افزايش سازگاري مي شود و تكيه بر اصطلاحات كم اهميت ميزان سازگاري را كاهش مي دهد (14) به عبارت ديگر،‌ در نمايه سازي، سازگاري به درجه اي اشاره دارد كه كه براي هر مدرك مي توان تا آن سطح اصطلاح تعريف كرد به گونه اي كه ساير نمايه سازان نيز تقريباً موضوعات يكساني را تا آن سطح به مدرك منتسب نمايند. نمايه سازي امري ذهني است؛ بنابراين،‌ ممكن است كه افراد مختلف در برخورد با مدركي واحد، واژه هاي متفاوتي را براي انتساب واژه هاي بيشتري به مدرك وجود داشته باشد،‌ سازگاري كاهش مي يابد. براي مثال،‌ اگر در موسسه اي اين سطح،‌ دوازده واژه و در موسسه ديگري شش واژه باشد،‌ امكان يكسان بودن واژه هاي انتسابي به مدرك در موسسه اي كه سطح شش واژه اي را براي نمايه در نظر گرفته شده است،‌ بيشتر است. هنگامي كه تعداد اصطلاحات گزينشي يكسان است،‌ اين امكان وجود دارد كه نمايه سازان درباره ترتيب ارائه اصطلاحات از لحاظ اهميت،‌ هم عقيده نباشند. بنابراين،‌ هرچه تعداد واژگان انتسابي بيشتر باشد، امكان عدم توافق در گزينش واژه هاي با اهميت تر بيشتر مي شود.
عوامل متعددي در سازگاري نمايه نقش دارند كه از جمله مي توان عوامل زير را برشمرد:
1. تعداد اصطلاحات گزينشي
2. استفاده از زبان طبيعي يا كنترل شده
3. كل نگري و جزء نگري در گزينش واژگان
4. نقش نمايه ساز در تشخيص واژگان مرتبط
5. ابزارهاي نمايه سازي
6. حجم مدرك نمايه شده
تعيين اصطلاحات كافي در نمايه،‌ باعث افزايش همخواني مي شود؛ اما همانگونه كه پيشتر اشاره شد امكان همخواني بين،‌ مثلاً دوازده واژه و شش واژه در يك نمايه متفاوت است. بنابراين با تركيب مناسب كل نگري و جزء نگري مي توان همخواني را در نمايه افزايش داد.

نتيجه
پس از پيدايش كامپيوتر و استفاده از آن در امور كتابخانه اي،‌ تغييرات عديده اي در روند كتابداري سنتي پديد آمد. با پيدايش ابزارهاي بازيابي كامپيوتري، نمايه ها نقشي اساسي را در كاوش مدارك مرتبط با نيازهاي استفاده كننده ايفا كرده اند. دقت در تنظيم و تهيه نمايه هاي كامپيوتري، باعث دستيابي سريع تر محقق به تمام اطلاعات مرتبط در يك پايگاه اطلاعاتي و حذف مدارك غيرمرتبط مي گردد. بنابراين كتابداران بايد در انتخاب يا ايجاد پايگاههاي اطلاعاتي، توجه ويژه اي به شيوه و ساختار نمايه پايگاه معطوف نمايند. هرچه نمايه از استحكام،‌ سازگاري، كل نگري و جزء نگري متناسبي برخوردار باشد. ميزان رضامندي از جستجو بيشتر خواهد شد. اين امر باعث كاهش هزينه و صرفه جويي در وقت محقق مي گردد.

فهرست منابع و ماخذ


1. از تقريرات دكتر عباس حري در درس نمايه سازي

2. Rothman, John. "Communicating with Indexes." Special Libraries, 57(8), 1966.pp. 569-570.

3. سلطاني، پوري؛ فروردين راستين. اصطلاحنامه كتابداري. تهران: كتابخانه ملي ايران، ‌1365
4. از تقريرات دكتر عباس حري در درس نمايه سازي

5. Lancaster, F.W. Indexing and Abstracting in Theary and Practice. Virginia: IRP, 1990.
6.7.8.IBID
9. Rothman, Joh,…
10.Lancaster, 1990…P.60.
11. IBID,p.22.
12. Lancaster, F.W. Vocabulary Control for information retrieval. IRP, 1986. p.22.
13. Brown, F.W. Vocabulary Control for information retrieval. Virginia: IRP, 1986.p.22.
14. Seely, Barbara,[et al]. "Indexing depth and retrieval effectivencess." Library Quarterly, 8(2). 1972.pp. 201-208.
مرکز انجمنهای تخصصی گنجینه دانش
[لینک خارجی برای کاربران مهمان مخفی است، لطفا برای مشاهده لینک ثبت نام نموده و یا وارد سایت شوید]
مرکز انجمنهای اعتقادی گنجینه الهی
[لینک خارجی برای کاربران مهمان مخفی است، لطفا برای مشاهده لینک ثبت نام نموده و یا وارد سایت شوید]

ارسال پست

بازگشت به “علوم”