Minggu, 16 Oktober 2011

DATA MINING & DATA WAREHOUSE


Resume 1
Apakah Sistem Informasi?
Sekumpulan orang-orang, hardware, software, jaringan komunikasi  dan data yang saling terkait  dan   bertujuan untuk  mengumpulkan, mengolah, menyimpan, dan menyebarkan   informasi untuk  mendukung pengambilan keputusan,  koordinasi, dan pengendalian
Data VS Informasi
      Data:  serangkaian fakta mentah yang menyatakan kejadian (event) yang terjadi dalam organisasi atau pada lingkungan fisik, sebelum diatur dan disusun ke dalam bentuk yang dapat dimengerti dan dapan digunakan oleh manusia.
      Informasi:  data yang telah diolah menjadi bentuk yang memiliki makna.

Elemen-elemen Sistem Informasi
      INPUT : menangkap atau mengumpulkan data mentah dari dalam organisasi atau dari lingkungan.
      PROSES : mengkonversi input mentah ke dalam bentuk yang dapat dimengerti.
      OUTPUT : menyampaikan informasi yang telah diproses kepada orang atau kegiatan yang akan menggunakan.
Organisasi Berbasis TI dalam Perkenomian DigitalOrganisasi Berbasis TI dalam Perkenomian Digital
Ø  Berbisnis  dalam era digital à Menggunakan sistem berbasis web di internet dan berbagai jaringan elektronik lain untuk melakukan bisnis.
Ø  Teknologi Informasi à Kumpulan dari sistem komputer  yang digunakan untuk mendukung operasional perusahaan.


Resum            e 2
Software Aplikasi
Peranan Prangkat Lunak
  Perangkat lunak=program
  Program; deretan instruksi yang digunakan untuk mengendalikan komputer sehingg komputer dapat melakukan tindakan sesuai yang dikehendaki pembuatnya
  Program dibuat oleh vendor/perseorangan
  Program dibuat dengan bahasa pemrograman
Kelompok Perangkat Lunak
  Perangkat Lunak  aplikasi; dipakai untuk tugas-tugas tertentu; membuat dokumen,manipulasi foto, membuat laporan keuangan dllà word,excell
  Perangkat Lunak sistem; untuk mengontrol sumber daya komputer seperti CPU dan I/O; kedudukan sebagai perantara antara program aplikasi dan hardware; windows,linux
Jenis Perangkat Lunak
  Commercial
  Domain Public
  Shareware
  Freeware
  Rentalware
  Free Software
  Open source
Versi dan Rilis
  Versi ; menyatakan perubahan besar pada software, umumnya dinyatakan dengan 2.0, 3.0 dst, terkadang notasi yang lain dipergunakan; microsoft office 97, office 2000 dll
  Rilis; menyatakan perubahan kecil pada versi yang sama, biasanya dinyatakan dengan angka dibelakang tanda titik. Contoh: 4.0, 4.11, 4.12 dll
Kategori Software Bisnis
  Pengolah Kata (Word Processing)
  Spreadsheet
  Basis Data (Database)
  Presentasi Grafis
  Pencatatan (Note Taking)
  Personal Information Manager (PIM)
  Perangkat Lunak untuk PDA
  Kumpulan Perangkat Lunak (Software Suite)
  Manajemen Proyek (Project Management)
  Akuntansi
  Pengelolaan Dokumen
Package Software
  Perangkat lunak yang diproduksi secara massal dan dilindungi hak cipta, yang dapat memenuhi kebutuhan dari beraneka ragam pengguna.
  Disebut juga Software lisensi (Closed-source software).
  Contoh: Microsoft Word, MS Excel
Custom Software
  Perangkat lunak yang dibuat secara khusus berdasarkan kebutuhan tertentu seseorang/perusahaan.
  Biasanya perangkat lunak ini dibuat berdasarkan pesanan pengguna.
  Dibuat oleh seorang programmer.
  Umumnya tidak diperjual-belikan.
  Contoh: Sistem Penjualan pada PT X
Shareware
  Adalah perangkat lunak yang dilindungi hak cipta, namun dapat didapatkan secara gratis dengan batasan-batasan tertentu.
  Batasan tsb dapat berupa waktu penggunaan software atau berupa batasan fitur-fitur software.
  Jika ingin mendapatkan software secara penuh, kita diharusnya membelinya atau menge-crack-nya.
  Contoh: GameHouse, SQLYog Enterprise
Spreadsheet
  Merupakan perangkat lunak yang memungkinkan kita mengatur data dalam baris-baris dan kolom-kolom, serta melakukan perhitungan-perhitungan matematis dari data tersebut.
Fitur-fitur Spreadsheet
  Layar terbagi atas kolom dan baris.
  Di MS Excel ada berapa baris? Berapa kolom?
  Dapat melakukan perhitungan-perhitungan matematis secara cepat.
  Tersedia fungsi-fungsi perhitungan.
  Perhitungan otomatis saat data berubah
  Pembuatan diagram dan grafik
Spreadsheet
  Microsoft Office Excel (Microsoft)
  OpenOffice Calc (OpenOffice)
  StarOffice Calc (Sun)
  Quattro Pro (Corel
Resume 3
Konsep Dan Manajemen Teknologi Informasi
Konsep Sistem Informasi
v  Sekumpulan orang-orang, hardware, software, jaringan komunikasi  dan data yang saling terkait  dan   bertujuan untuk  mengumpulkan, mengolah, menyimpan, dan menyebarkan   informasi untuk  mendukung pengambilan keputusan,  koordinasi, dan pengendalian.
v  Sebagai bidang studi, SI menjembatani bidang usaha multidisiplin dan ilmu bidang komputer yang berkembang menuju disiplin ilmu baru.
v  Sebuah sistem informasi disiplin karena itu didukung oleh dasar-dasar teoritis informasi dan perhitungan sehingga mahasiswa memiliki kesempatan unik untuk mengeksplorasi akademisi berbagai model bisnis serta proses algoritmik yang terkait dalam disiplin ilmu komputer
v  Biasanya, sistem informasi  orang, prosedur, data, perangkat lunak, dan perangkat keras yang digunakan untuk mengumpulkan dan menganalisis informasi digital.
Infrastruktur TI
  Dalam teknologi informasi dan Internet, infrastruktur perangkat keras (fisikal) yang digunakan untuk menghubungkan komputer dan pengguna.
  Infrastruktur mencakup media transmisi, termasuk saluran telepon, saluran televisi kabel, dan satelit dan antena, dan juga router, repeater, dan perangkat lain yang mengontrol jalur transmisi.
  Infrastruktur juga mencakup perangkat lunak yang digunakan untuk mengirim, menerima, dan mengelola sinyal yang ditransmisikan.
  Namun, untuk beberapa pengguna teknologi informasi, infrastruktur dipandang sebagai segala sesuatu yang mendukung aliran dan pengolahan informasi.
  Perusahaan infrastruktur memainkan peran penting dalam mengembangkan internet, baik dari segi interkoneksi ,akses dan kecepatan akses informasi.
 Mainframe dan Lingkunganya
  Mainframe adalah komputer yang berukuran  besar dan kuat yang digunakan terutama oleh organisasi-organisasi besar untuk aplikasi kritis.
  Mainframe memiliki prosesor lebih dari satu, sehingga lebih cepat dibanding dengan mini komputer.
  Mainframe secara umum membutuhkan ruangan yang besar dan khusus dimana faktor lingkungan yang terdiri dari temperatur, kelembaban udara ataupun gangguan asap dapatlah dimonitor.
 PC dan Lingkunganya
  Pada awalnya, komputer jenis ini diciptakan untuk memenuhi kebutuhan per-orangan (personal).
  Keunggulan harganya relatif murah, bentuknya kecil dan teknologi yang dimiliki diangap sudah memadai, maka personal komputer menjadi begitu cepat populer.
Sekarang banyak digunakan oleh perusahaan untuk menyelesaikan pelbagai masalah yang ada diperusahaan
Resume 4
Teknologi Kolaboratif
Outline
°  Komunikasi & Jaringan
°  Komunikasi dan kolaborasi
°  Alat pendukung kolaborasi : workflow ke groupware.
°  Telecommuting dan e-learning.
 Penggunaan Teknologi Komunikasi
°  Voice mail
°  Fax
°  E-mail
°  Chatroom
°  Instant Message
°  FTP
°  Newsgroup
°  Telephony
°  Videoconference
°  Groupware
°  Global Positioning System (GPS)
­Jaringan
°  Sekumpulan komputer dan perangkat yg saling berhubungan melalui perangkat komunikasi dan media transmisi.
°  Fasilitas komunikasi antar user
°  Berbagi sumber daya dengan pengguna lainya.
 Dukungan Jaringan terhadap Proses Komunikasi
°  Tanpa komunikasi, tidak ada kerjasama /kolaburasi
°  Teknologi Informasi modern, terutama via web, menyediakan peralatan murah, kapabel dan andal.
°  Kelompok – kelompok butuh tidak hanya komunikasi tetapi Informasi dan Knowledge.
 Groupware
°  Software yang menyediakan dukungan kolaboratif bagi kelompok.
°  Aplikasi yang mendukung  waktu/tempat yang berbeda
°  Paling banyak menggunakan Teknologi Internet
°  Memiliki kemampuan sedikitnya salah satu dari berikut :
         Electronic brainstorming
        Free flow of ideas and comments
         Electronic conferencing or videoconferencing
         Group scheduling and calendars
         Conflict resolution
         Model building
         Electronic document sharing
         Voting services
°  Electronic meeting services also available
°  Enterprise-wide systems expensive in cost and human resources
 Keuntungan dan Masalah
°  Keuntungan dari kerja kelompok (groupwork)
         Process gains              
        Teknik Kelompok Nominal    
        Metode Delphi
         Teknologi yang diaplikasikan sebagai GSS   
        Kombinasi Hardware and software untuk meningkatkan groupwork
        Komputasi kolaburorasi
        Masalah-masalah dalam kerja kelompok (groupwork)
         Process losses
         Tidak efisien

Resume 5
Manjemen Basisdata
         Basis Data
Kumpulan data yg ditata dengan cara yg memungkinkan untuk di akses, dicari, dan digunakan datanya.
         Data
Kumpulan fakta yang berupa
         Text
         Angka
         Images
         Audio
         Video
         Informasi
Data yg telah di olah
         Terorganisir
         Memiliki arti
         Bermanfaat
         Integritas Data perlu dijaga sebaik-bainya (kualitas data)
         Garbage in, garbage out (GIGO) akurasi output komputer bergantungm pada inputnya.
Memelihara  Data (Maintaining Data)
      Memelihara file (File maintenance): prosedur-prosedur yg dilakukan untuk menjaga data yg tersimpan selalu terbaru.
      Users menambah records ke file ketika ada tambahan data baru.
      Menghapus Record :ketika record tidak dibutuhkan , kita hapus dari file.
      Validation: proses membandingkan data dgn selompok aturan atau nilai untuk mencari tahu apakah data tersebut benar.


Resume 6
Data Warehouse, Data Mart, OLAP, dan Data Mining
-Data Warehouse
  Data warehouse adalah basis data yang menyimpan data sekarang dan data masa lalu yang berasal dari berbagai sistem operasional dan sumber yang lain (sumber eksternal) yang menjadi perhatian penting bagi manajemen dalam organisasi dan ditujukan untuk keperluan analisis dan pelaporan manajemen dalam rangka pengambilan keputusan
  Data warehouse digunakan untuk mendukung pengambilan keputusan, bukan untuk melaksanakan pemrosesan transaksi
  Data warehouse hanya berisi informasi-informasi yang relevan bagi kebutuhan pemakai yang dipakai untuk pengambilan keputusan
 Sumber Data untuk DW
  1. Data operasional dalam organisasi, misalnya basis data pelanggan dan produk, dan
  2. Sumber eksternal yang diperoleh misalnya melalui Internet, basis data komersial, basis data pemasok atau pelanggan
  Berbagai data yang berasal dari sumber digabungkan dan diproses lebih lanjut oleh manajer data warehouse dan disimpan dalam basis data tersendiri.
  Selanjutnya, perangkat lunak seperti OLAP dan data mining dapat digunakan oleh pemakai untuk mengakses data warehouse
Sifat Data Warehouse
  Multidimensional yang berarti bahwa terdapat banyak lapisan kolom dan baris (Ini berbeda dengan tabel pada model relasional yang hanya berdimensi dua)
  Berdasarkan susunan data seperti itu, amatlah mudah untuk memperoleh jawaban atas pertanyaan seperti: “Berapakah jumlah produk 1 terjual di Jawa Tengah pada tahun n-3?”
 Petunjuk Membangun DW
  Menentukan misi dan sasaran bisnis bagi pembentukan data warehouse
  Mengidentifikasi data dari basis data operasional dan sumber lain yang diperlukan bagi data warehouse
  Menentukan item-item data dalam perusahaan dengan melakukan standarisasi penamaan data dan maknanya
  Merancang basis data untuk data warehouse
  Membangun kebijakan dalam mengarsipkan data lama sehingga ruang penyimpanan tak menjadi terlalu besar dan agar pengambilan keputusan tidak menjadi terlalu lamban.
  Menarik data produksi (operasional) dan meletakkan ke basis data milik data warehouse
 Data Mart
  Bagian dari data warehouse yang mendukung kebutuhan pada tingkat departemen atau fungsi bisnis tertentu dalam perusahaan. Karakteristik yang membedakan data mart dan data warehouse adalah sebagai berikut (Connolly, Begg, Strachan 1999).
  Data mart memfokuskan hanya pada kebutuhan-kebutuhan pemakai yang terkait dalam sebuah departemen atau fungsi bisnis.
  Data mart biasanya tidak mengandung data operasional yang rinci seperti pada data warehouse.
  Data mart hanya mengandung sedikit informasi dibandingkan dengan data warehouse. Data mart lebih mudah dipahami dan dinavigasi.

Contoh Software Data Mart
  SmartMart (IBM)
  Visual Warehouse (IBM)
  PowerMart (Informatica

 Kemampuan OLAP
  Konsolidasi melibatkan pengelompokan data. Sebagai contoh kantor-kantor cabang dapat dikelompokkan menurut kota atau bahkan propinsi. Transaksi penjualan dapat ditinjau menurut tahun, triwulan, bulan, dan sebagainya. Kadangkala istilah rollup digunakan untuk menyatakan konsolidasi
  Drill-down adalah suatu bentuk yang merupakan kebalikan dari konsolidasi, yang memungkinkan data yang ringkas dijabarkan menjadi data yang lebih detail
  Slicing and dicing (atau dikenal dengan istilah pivoting) menjabarkan pada kemampuan untuk melihat data dari berbagai sudut pandang
Software OLAP
  Express Server (Oracle)
  PowerPlay (Cognos Software)
  Metacube (Informix/Stanford Technology Group)
  HighGate Project (Sybase)

Data Mining
  Perangkat lunak yang digunakan untuk menemukan pola-pola tersembunyi maupun hubungan-hubungan yang terdapat dalam basis data yang besar dan menghasilkan aturan-aturan yang digunakan untuk memperkirakan perilaku di masa medatang
  Data mining sering dikatakan berurusan dengan “penemuan pengetahuan” dalam basis data. Suatu aturan yang dihasilkan oleh data mining misalnya seperti berikut : “Kebanyakan pembeli mobil Forsa adalah wanita berusia di atas 30 tahun”.
Teknologi Untuk Data Mining
  Statistik
  Jaringan saraf (neural network)
  Logika kabur (fuzzy logic)
  Algoritma genetika
  dan berbagai teknologi kecerdasan buatan yang lain
Data Mining : Visualisasi Data
  Pendekatan data mining juga ada yang melalui visualisasi data
  Pada sistem seperti ini, pemakai akan dibantu untuk menemukan sendiri pola dari sejumlah data berukuran besar dengan didasarkan visualisasi oleh data mining







Tidak ada komentar:

Posting Komentar

Recent Posts

Pages

Recent Comments

Recent Posts

Followers


Get your own Digital Clock

Cari Blog Ini

OKK STIKOM Surabaya