1. Sebutkan dan jellaskan operasi – operasi dasar yang berkenaan dengan basis data (data base) ?
2. Jelaskan dan berikan contoh masalah redundancy dalam suatu basis data (database) ?
3. Jelaskan keuntungan – keuntungan apa saja dengan ditetapkannya basis data (database) pada sesuatu perusahaan ?
4. Jelaskan Kerugian - kerugian apa saja dengan ditetapkannya basis data (database) pada sesuatu perusahaan ?
5. Berikan contoh suatu data base, kelompokan mana saja sebagai file/table, dan field/ artibutnya ?
6. Jelaskan operasi manipulasi apa saja yang dapat dilakukan berkenaan dengan pembentukan basis data (database) ?
7. Jelaskan pengertian level konseptual pada abstraksi data ?
Basis data adalah sekumpulan data yang terletak pada suatu tempat, dimana data tersebut saling berhubungan, dan nantinya dapat dimanfaatkan.
Adapun beberapa contoh Operasi Dasar Basis Data. Untuk mempermudah pemahaman, saya akan melakukan perumpamaan basis data tersebut sebagai lemari. Misalkan, basis data itu kita ibaratkan lemari. Hal yang bisa kita lakukan dengan lemari, yaitu:
- Membuat sebuah lemari sendiri. Entah dari apa bahannya, yang penting lemari itu jadi. Baru setelah lemari itu jadi, kita dapat mengisinya dengan barang yang kita sukai (create database).
- Membuang lemari atau melenyapkan lemari. Kalo dalam hal ini, isi didalam lemari itupun ikut hilang. (drop database).
- Untuk mengisi lemari tersebut, kita harus membagi lemari tersebut agar lemari tersebut cukup dan sesuai keinginan kita. Entah itu pakaian, makanan, atau peralatan yang lainnya (create table).
- Kita juga dapat menghilangkan isi didalam lemari tersebut tanpa harus membuang lemari tersebut. Karena suatu saat, kita dapat menggunakan lemari tersebut untuk tempat yang lain (drop table).
- Pada tiap bagian dari lemari tersebut, kita dapat melakukan operasi pengisian (insert).
- Operasi lain yang dapat dilakukan pada bagian lemari tersebut, yaitu: pengambilan (select).
- Perubahan isi bagian dari lemari tersebut (update).
- Dan yang terakhir ialah penghapusan (delete)
Berikut tadi beberapa Operasi Dasar Basis Data yang dapat dilakukan pada sebuah basis data. Apabila ada yang kurang, mohon dimaklumi. Semoga bermanfaat..
2. REDUNDANCY DALAM BASIS DATA (DATABASE)
Tidak sedikit orang yang salah dalam mengartikan redundancy (kerangkapan data dalam database). Ada yang menyangka bahwa contoh redundancy adalah: memasukkan data yang sama berulang-ulang dalam database, atau dalam sebuah file;
Contoh 1: kesalahan pengertian mereka di file KRS:
NPM | Nama Mahasiswa | Kode_MK | Nama_MK |
123 | Ali | IT-001 | Logika dan Algoritma |
123 | Ali | IT-002 | Sistem Operasi |
Dan seterusnya, sehingga si Ali mengambil 8 mata kuliah.
Katanya, penulisan nama ’Ali’ ditulis berulang-ulang, sehingga disebut dengan redundancy, sehingga atribut Nama Mahasiswa harus dipisah di tabel lain.
Di pisah ke dalam tabel lain, itu jelas, karena antara MASTER FILE tidak boleh bercampur dengan TRANSACTION FILE. Jadi, selain nama mahasiswa, nama mata kuliah (nama_mk) juga tidak boleh ada di sana. Jadi, meskipun nama mata kuliah tidak rangkap, tetap tidak boleh di sana.
Kini, NPM berulang juga, tetapi mereka bilang ’kalau NPM boleh rangkap, karena itu kunci atribut’, lho, kok tidak konsisten ?, kalau satu atribut tidak boleh rangkap, ya atribut lain juga tidak boleh rangkap dong, mau jenisnya apapun.
Nah, jadi pengertian rangkap (redundancy) itu salah di sana. Cara tersebut memang kewajiban sebelum membentuk sebuah file, harus dipisahkan mana file master (contoh file mahasiswa, dosen, mata kuliah, dan sebagainya) dan mana file transaksi (KRS, DNS, Peminjaman Buku, Pengembalian Buku, Pembayaran Uang Kuliah, dsb.)
Hal itu senada dengan proses normalisasi data ke-3 di mana setiap atribut yang tidak tergantung secara fungsional dengan kunci atributnya, maka harus dipisahkan ke dalam file lain dan membentuk atribut kunci sendiri.
JADI, APA ITU REDUNDANCY ??
Redundancy atau kerangkapan data terjadi di jaman sebelum ada sistem basis data, yaitu pada jaman sistem pemrosesan file atau sistem file tradisional. Di saat itu, setiap orang bekerja sendiri-sendiri, meski dalam satu kantor.
Sehingga, pada saat itu diperlukan disket yang banyak untuk saling tukar-menukar data. Si A mengcopy data untuk si B, si B mengcopy data untuk si A, dan seterusnya sebanyak orang yang saling bertukar data.
Sehingga di kantor itu, ada banyak data pegawai. Si A punya data pengawai, si B punya data pegawai, si C, si D, dan semua punya data pegawai. Tetapi isinya belum tentu sama, bisa saja si X alamatnya di Jl. M di komputernya si A, tetapi alamatnya di Jl. J di komputernya si B, dan seterusnya. (Baca di ”Catatan Manajemen Basis Data”)
Jadi, kerangkapan data adalah adanya data (file) rangkap di suatu kantor (yang saat itu memang harus rangkap, kalau tidak rangkap mereka tidak bisa bekerja dengan baik). Nah kerangkapan itulah yang dihilangkan dengan dimunculkannya sistem basis data dengan cara dibuat jaringan (network), sehingga data yang sama (rangkap) cukup dibuat satu kali saja di server, semua mengambil data dari sana. Salah satu keuntungannya, semua orang yang bekerja di kantor itu akan menerima data yang sama (konsisten, dan valid).
3. KEUNTUNGAN DATA BASE TERDISTRIBUSI
1. Pengawasan distribusi dan pengambilan data
Jika beberpa site yang berbeda dihubungkan, seorang pemakai yang berada pada satu site dapat mengakses data pada site lain.
Contoh : sistem distribusi pada sebuah bank memungkinkan seorang pemakai pada salah satu cabang dapat mengakses data cabang lain.
2. Reliability dan availability
Sistem distribusi dapat terus menerus berfungsi dalam menghadapi kegagalan dari site sendiri atau mata rantai komunikasi antar site.
3.Kecepatan pemrosesan query
Contoh : jika site-site gagal dalam sebuah sistem terdistribusi, site lainnya dapat melanjutkan operasi jika data telah direplikasi pada beberapa site.
4. Otonomi lokal
Pendistribusian sistem mengijinkan sekelompok individu dalam sebuah perusahaan untuk melatih pengawasan lokal melalui data mereka sendiri. Dengan kemampuan ini dapat mengurangi ketergantungan pada pusat pemrosesan.
5. Efisiensi dan fleksibel
Data dalam sistem distribusi dapat disimpan dekat dengan titik diman data tersebut dipergunakan. Data dapat secara dinamik bergerak atau disain, atau salinannya dapat dihapus.
4. KERUGIAN DATABASE TERDISTRIBUSI
1. Harga software mahal
Hal ini disebabkan sangat sulit untuk membuat sistem database distribusi.
2. Kemungkinan kesalahan lebih besar
Site-site beroperasi secara paralel sehingga lebih sulit untuk menjamin kebenaran dan algoritma. Adanya kesalahan mungkin tak dapat diketahui.
3. Biaya pemrosesan tinggi
Perubahan pesan dan penambahan perhitungan dibutuhkan untuk mencapai koordinasi antar site.
5.
Atribut / field : nim,nama_m,tpt_lhr_m,tgl_lhr_m,j_kelamin,alm_m,kota_m,aama_m dan kode_jur
Data value / Isi data :
Pada record pertama : 01031417 adalah isi data untuk kolom nim, Mulyanti untuk kolom nama_m dan seterusnya
Gambar 1.3. Contoh file, field, record dan data value
6. Secara sederhana, data mining merujuk pada ekstraksi atau penggalian pengetahuan dari sejumlah besar data. termin ini sebetulnya adalah salah kaprah. Karena penggalian emas dari batu atau dari pasar disebut dengan penggalian emas, bukan penggalian batu atau penggalian pasir. Oleh karena itu, data mining seharusnya diberi nama knowledge mining from data. Termin pendeknya knowledge mining sama sekali tidak menggambarkan proses penggalian data untuk mendapatkan pengetahuan. Oleh karena itu kesalahkaprahan yang menggambarkan data dan mining tetap digunakan.
Banyak orang yang memperlakukan Knowledge Discovery in Databases atau KDD sebagai sinonim dari data mining. Selain itu, sebagian orang melihat data mining sebagai langkah esensial dalam pencarian pengetahuan (knowledge discovery) dalam database. Pencarian pengetahuan sebagai sebuah proses terdiri dari urutan berulang dari langkah-langkah sebagai berikut:
Ø Data Cleaning. Untuk membuang noise atau data yang tidak konsisten
Ø data integration. Dimana multiple sumber data digabungkan.
Ø Data selection. Dimana data yang relevan dengan analisis didapat dari database
Ø Data transformation. Dimana data ditransformasikan dan dikonsolidasikan kedalam bentuk yang sesuai untuk penggalian dengan melakuka operasi penjumlahan atau agregasi.
Ø Data Mining. Sebuah proses esensial dimana metode cerdas diaplikasikan untuk mengekstrak pola data
Ø Pattern evaluation. Untuk mengidentifikasi pola tertentu yang merepresentasikan pengetahuan berdasar pada pengukuran ketertarikan
Ø Knowledge presentation. Dimana visualisasi dan teknik representasi pengetahuan digunakan untuk menghadirkan pengetahuan yang telah digali pada user
Langkah data mining memungkinkan untuk berinteraksi dengan user atau berbasis pengetahuan. Pola yang menarik ditampilkan pada user, dan dapat disimpan sebagai pengetahuan baru dalam basis pengetahuan (knowledge base). Berdasarkan pandangan ini, data mining adalah sebuah bagian dari keseluruhan proses. Meskipun merupakan proses yang esensial karena akan mengungkapkan pola tersembunyi untuk dievaluasi lebih lanjut.
Jadi, data mining, yang menjadi termin yang lebih populer daripada KDD, adalah proses pencarian pengetahuan tertentu dari sejumlah besar data yang disimpan baik dalam database, data warehouse, maupun penyimpanan informasi lainnya.
Arsitektur umum dari sistem data mining dapat memiliki komponen sebagai berikut:
Database, data warehouse, maupun penyimpanan informasi lainnya.
Server database atau data warehouse. Server database atau data warehouse bertanggung jawab untuk mengambil data yang relevan, berdasarkan pada permintaan data mining user
Knowledge base. Bagian ini merupakan domain pengetahuan yang digunakan untuk membimbing pencarian atau mengevaluasi ketertarikan pada pola hasil. Pengetahun in dapat termasuk konsep hirarki, digunakan untuk mengorganisir atribut atau nilai atribut ke dalam berbagai level abstraksi.
Data mining engine. Modul ini merupakan bagian yang esensial dalam sistem data mining dan idealnya terdiri dari modul funsional untuk tugas-tugas misalkan seperti karakterisasi, asosiasi, klasifikasi, analisa kluster, dan analisa evolusi dan deviasi
Pattern evaluation module. Komponen ini secara umum mengatur tingkat kepentingan dan berinteraksi dengan modul data mining sehingga dapat memfokuskan pencarian terhadap pola tertentu.
Graphical user interface. Modul ini mengkomunikasikan user dengan sistem data mining, mengizinkan user untuk berinteraksi dengan sistem dengan mendefinisikan query atau tugas data mining, menyediakan informasi agar user terbantu untuk tetap fokus dalam pencarian. Sebagai tambahan, komponen ini mengizinkan user untuk mencari skema atau struktur data database dan data warehouse, mengevaluasi pola yang telah digali, dan memvisualisasi pola dalam bentuk yang berbeda.
Server database atau data warehouse. Server database atau data warehouse bertanggung jawab untuk mengambil data yang relevan, berdasarkan pada permintaan data mining user
Knowledge base. Bagian ini merupakan domain pengetahuan yang digunakan untuk membimbing pencarian atau mengevaluasi ketertarikan pada pola hasil. Pengetahun in dapat termasuk konsep hirarki, digunakan untuk mengorganisir atribut atau nilai atribut ke dalam berbagai level abstraksi.
Data mining engine. Modul ini merupakan bagian yang esensial dalam sistem data mining dan idealnya terdiri dari modul funsional untuk tugas-tugas misalkan seperti karakterisasi, asosiasi, klasifikasi, analisa kluster, dan analisa evolusi dan deviasi
Pattern evaluation module. Komponen ini secara umum mengatur tingkat kepentingan dan berinteraksi dengan modul data mining sehingga dapat memfokuskan pencarian terhadap pola tertentu.
Graphical user interface. Modul ini mengkomunikasikan user dengan sistem data mining, mengizinkan user untuk berinteraksi dengan sistem dengan mendefinisikan query atau tugas data mining, menyediakan informasi agar user terbantu untuk tetap fokus dalam pencarian. Sebagai tambahan, komponen ini mengizinkan user untuk mencari skema atau struktur data database dan data warehouse, mengevaluasi pola yang telah digali, dan memvisualisasi pola dalam bentuk yang berbeda.
Tidak semua “sistem data mining” yang digunakan dalam kehidupan nyata dapat melakukan proses data mining yang sebenarnya. Sebuah sistem analisis data yang tidak menangani data dalam jumlah besar seharusnya dikategorikan dalam sistem mechine learning, alat analisa data statistik, atau prototipe sistem eksperimental. Sebuah sistem yang hanya dapat melakukan temu kembali data atau informasi, termasuk mencari nilai agregasi, atau yang melakukan penjawaban query dalam database yang besar harusnya dikategorika sebagai sistem database, atau sistem temu kembali informasi, atau sistem database deduktif.
Data mining melibatkan sebuah integrasi teknik dari berbagai disiplin seperti teknologi database, statistik, machine learning, pengenalan pola, neural network, visualisasi data, temu kembali informasi, pemrosesan citra dan sinyal, dan analisa data spasial. Dengan melakukan data mining, pengetahuan tertentu, informasi level biasa atau level tinggi dapat diekstrak dari database dan dapat dilihat atau dicari dari sudut pandang yang berbeda. Pengetahuan yang ditemukan dapat digunakan untuk pembuatan keputusan, kontrol proses, manajemen informasi, dam pemrosesan query. Oleh karena itu, data mining disadari merupakan salah satu dari bagian terpenting dalam sistem database dan salah satu pengembangan interdisiplin paling menjanjikan dalam industri informasi
7. Tiga level dalam Abstraksi data antara lain:
a. Level Phisik
Level abstraksi paling rendah yang menggambarkan (How) bagaimana data disimpan.
b. Level Konseptual
Level ini menerangkan / menggambarkan data apa (what) yang disimpan dalam database, dan hubungan relasi yang terjadi antar data. Level ini digunakan oleh database administrator, yang memutuskan data apa yang akan dipelihara dalam satu database.
c. Level Pandangan Pemakai
Level ini menggambarkan hanya satu bagian dalam database.
a. Level Phisik
Level abstraksi paling rendah yang menggambarkan (How) bagaimana data disimpan.
b. Level Konseptual
Level ini menerangkan / menggambarkan data apa (what) yang disimpan dalam database, dan hubungan relasi yang terjadi antar data. Level ini digunakan oleh database administrator, yang memutuskan data apa yang akan dipelihara dalam satu database.
c. Level Pandangan Pemakai
Level ini menggambarkan hanya satu bagian dalam database.
Tidak ada komentar:
Posting Komentar