Pengindeksan (indexing) terjadi pada tahap masukan sistem informasi dan mencakup berbagi proses seperti pencatatan ciri-ciri dokumen yang penting , baik ciri fisik, maupun isi (subyek), yang menghasilkan wakil-wakil dokumen ringkas (condensed document representations atau surrogates). Kumpulan wakil dokumen yang disusun menurut sistematika tertentu adalah indeks (dalam arti luas), yaitu sarana atau kunci yang menunjukan pada pencari informasi dokumen-dokumen mana dalam “gudang informasi” yang secara potensial relevan dengan suatu permintaan pengguna (query). Sarana ini dapat berbentuk bibliografi, katalog, maupun indeks, yang memungkinkan ditemukannya dokumen yang relevan dengan suatu permintaan dengan cepat.
Pengatalogan Deskriptif
Permintaan dapat merupakan permintaan mencari dokumen dad pengarang tertentu atau dengan judul tertentu. Agar permintaan seperti ini dapat dilayani, maka pada tahap masukan dilakukan pengatalogan deskriptif, yaitu pencatatan_semua ciri fisik dokumen yang penting. Hasilnya ialah deskripsi bibliografi dokumen, yang kemudian.dilengkapi dengan titik temu (access points) atau tajuk berupa nama pengarang dan judul. Lewat titik temu ini penelusur dapat mencari dan menemukan entri-entri yang sesuai dengan suatu permintaan.
Pengindeksan subyek
Permintaan dapat merupakan permintaan untuk mencari dokumen mengenai subyek tertentu. Agar permintaan seperti ini dapat dilayani, maka pada tahap masukan dilakukan pengindeksan subyek, yang mencakup analisis terhadap isi dokumen, dan pemilihan nomor kelas, tajuk • subyek atau deskriptor yang dapat mewakili subyek dokumen.
Apabila dokumen yang relevan dengan suatu permintaan dapat ditemukan kembali, maka ini berarti bahwa telah terjadi kecocokan (match) antara informasi yang diminta (dicari) dan informasi yang ditemukan. Atau dengan perkataan lain: lnformasi yang terdapat dalam dokumen dalam batas-batas tertentu cocok dengan informasi yang dikehendaki. Untuk meningkatkan kemungkinan terjadinya match, maka dalam proses simpan dan temu kembali perlu digunakan kosa kata terkendali (controlled vocabulary) atau bahasa indeks (indexing language).
Bahasa indeks atau kosa kata terkendali
Controlled vocabulary atau bahasa indeks adalah sekelompok istilah terbatas yang harus digunakan untuk mewakili subyek dokumen dalam suatu sistem simpan dan temu kembali.
Temu balik informasi (information retrieval) sulit berhasil apabila dilakukan dengan menggunakan bahasa alamiah (natural language). Bahasa alamiah memiliki kosa kata yang jumlahnya tak terbatas dan sangat beraneka ragam. Bahasa alamiah memungkinkan bierbagai variasi dan nuansa dalam mengekspresikan pikiran, pendapat, maupun perasaan. Ciri ini justru menjadikan bahasa alamiah suatu medium yang kurang cocok untuk temu kembali informasi. Beberapa gejala bahasa alamiah yang menjadi penghambat ialah:
Sinonim menyebabkan terpencamya informasi tentang subyek yang sama
Homograf menyebabkan terjaringnya dokumen yang tidak relevan
Dengan menggunakan bahasa indeks masalah seperti ini dapat dicegah.
Ciri bahasa indeks (kosa kata terawasi atau terkendali):
1. Kosa kata terdiri atas kosa terpilih dan terawasi yang jumlahnya terbatas.
2. Tiap konsep hanya dapat diwakili oleh satu istilah atau kode (misalnya nomor kelas). Tidak boleh ada sinonim. Bila satu konsep dapat dinyatakan dengan 2 atau Iebih istilah, maka satu dipilih sebagai istilah terpilih (preferred term atau istilah indeks) yang akan mewakili konsep tsb.
3. Homograf (penulisan 2 kata sama, tetapi makna berbeda) harus dibedakan dengan penambahan istilah penjelas (qualifier).
4. Istilah yang dapat menimbulkan keraguan karena memungkinkan penafsiran berbeda harus dijelaskan dengan catatan ruang lingkup (scope note).
5. Hubungan antar istilah diperlihatkan. Misalnya hubungan antara istilah terpilih dengan sinonimnya yang tidak boleh dipakai, atau antara istilah umum dengan istilah Iebih khusus yang berhubungan.
6. Kombinasi kosa kata diatur: hanya satu urutan diperbolehkan.
Fungsi kosa kata terkendali atau bahasa indeks ialah memperbesar kemungkinan terjadinya match dengan cara:
1. Memungkinkan pengindeks menyatakan subyek (konsep) secara konsisten. Artinya, subyek yang sama di mana dan bilamana saja ia muncul, akan diwakili oleh istilah atau kode yang sama.
2. Memungkinkan terjadi pertemuan / persamaan antara istilah yang digunakan oleh pengindeks dan penelusur.
3. Memungkinkan perivasan atau penyempitan ruang lingkup penelusuran dengan memperlihatkan hubungan-hubungan semantik antara istilah/kode bahasa indeks tersebut.
Ada 2 jenis bahasa indeks:
Bahasa indeks yang non-verbal: Skema (bagan) klasifikasi (classification scheme)
Bahasa indeks verbal: Daftar tajuk subyek (list of subject headings) dan Tesaurus
Bagan klasifikasi
1. Dalam bagan klasifikasi pengetahuan dibagi menjadi sejumlah kelas utama yang mewakili suatu disiplin ilmu atau subdisiplin ilmu. Kelas utama dibagi lagi menjadi sub-kelas (subdivisi), yang dapat dibagi lagi menjadi kelas-kelas yang semakin khusus (spesifik).
2. Tiap kelas diwakili atau dinyatakan dengan menggunakan notasi yang menunjukkan tempat / urutan kelas dalam bagan klasifikasi. Notasi dapat terdiri atas angka, huruf, atau kombinasi angka dan huruf.
3. Hubungan antar subyek bersifat hirarkis. Bagan menampilkan hubungan dari subyek umum ke khusus dan sebaliknya.
4. Karena subyek-subyek dinyatakan dengan notasi (jadi ringkas), maka klasifikasi dapat digunakan untuk menyusun dokumen di rak.
Beberapa contoh bagan klasifikasi:
• Dewey Decimal Classification (DDC)
• Library of Congress Classification (LCC)
• Universal Decimal Classification (UDC)
• Colon Classification (CC)
Daftar Tajuk Subyek
1. Tiap konsep diwakili satu istilah atau frase yang disebut tajuk subyek. Ada konsep tunggal dan konsep majemuk. Disusun menurut abjad menjadi daftar tajuk subyek.
2. Ada pengawasan terhadap sinonim. Satu istilah dipilih dan dipakai sebagai tajuk subyek (subject heading). Istilah yang tidak dipilih ditandai X. Ini berarti bahwa harus dibuat acuan (rujukan — reference) lihat dari istilah tidak terpilih ke tajuk subyek. Acuan ini disusun sesuai dengan urutannya menurut abjad dalam katalog subyek berabjad. Dalam daftar tajuk subyek yang mutakhir tidak digunakan X dan lihat, tetapi G(unakan) dan G(unakan) U(ntuk).
3. Tiap konsep harus diwakili oleh istilah yang jelas, yang hanya mempunyai satu arti. Oleh sebab itu homonim diberi istilah penjelas (qualifier).
Contoh:
BUNGA (BAGIAN TANAMAN)
BUNGA (BANK)
4. Hubungan antar subyek diperlihatkan_dengan menggunakan tanda XX atau lihat juga.- ini berarti bahwa harus dibuat acuan lihat juga yang menunjukkan hubungan antara satu subyek dengan subyek lain.
Contoh daftar tajuk subyek:
• Sears List of Subject Headings
• Library of Congress Subject Headings (LCSH)
• Daftar Tajuk Subyek untuk Perpustakaan
Tesaurus
Tesaurus agak mirip daftar tajuk subyek, tetapi ada beberapa perbedaan prinsipiil antara kedua bahasa indeks verbal ini
1. Tesaurus biasanya mencakup satu bidang khusus (berbeda dengan daftar tajuk subyek yang biasanya mencakup semua bidang ilmu pengetahuan)
2. Tiap konsep diwakili oleh suatu istilah yang disebut descriptor atau index term. Diperagakan dalam susunan menurut abjad, dan biasanya dilengkapi susunan lain, misalnya susunan hirarki, kategori, dan susunan lain yang berguna.
3. Sedapat mungkin diusahakan agar tiap deskriptor mewakili konsep tunggal.
4. Hubungan antar deskriptor ditunjukkan dengan menggunakan singkatan seperti:
U Use G Gunakan
UF Use For GU Gunakan Untuk
BT Broader Term IL Istilah luas
NT Narrow Term IK Istilah khusus
RT Related Term IB Istilah Berhubungan
Artikel keren lainnya:
Belum ada tanggapan untuk "PENGINDEKSAN DAN BAHASA INDEKS"
Post a Comment