Tuesday, April 25, 2017

Tugas Softskill Mapreduce

ABSTRAK
Audimas Firian (51413488)
Dimas Edra Octama (52413489)
Syafril Rahimansyah P. (58413730)
PENGANTAR KOMPUTASI MODERN “MAPREDUCE”
JURNAL. Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Gunadarma 2017.
Kata Kunci : Jurnal, Pengantar, Komputasi, Modern, MapReduce
Dewasa ini pemecahan masalah dilakukan tidak hanya dengan logika tetapi dengan algoritma yang di gabungkan pada computer yang menjadikannya komputasi, komputasi yang telah ada terus berkembang, dengan adanya perkembangan komputasi maka di jaman sekarang ini sudah banyak yang melakukan pemecahan masalah dengan computer terpadu atau komputasi, dan juga memperkenalkan apa itu mapreduce, mengetahui tahapan proses Mapreduce, dan mengetahui keuntungan untuk menggunakan MapReduce.
  



PENDAHULUAN
Latar Belakang Masalah
            Dewasa ini pemecahan masalah dilakukan tidak hanya dengan logika tetapi dengan algoritma yang di gabungkan pada computer yang menjadikannya komputasi, komputasi yang telah ada terus berkembang, dengan adanya perkembangan komputasi maka di jaman sekarang ini sudah banyak yang melakukan pemecahan masalah dengan computer terpadu atau komputasi.
            Seperti bahasan penulis tentang mapreduce, apa itu mapreduce. Mapreduce adalah sebuah model perograman rilisan google yang menggunakan Bahasa pemrograman JAVA, memanfaatkan komputasi dengan system terdistribusi, menggunakan dua proses yaitu map dan reduce sehingga bisa memproses parallel ke multiple node.
            Batasan Masalah
            Batasan masalah pada penulisan ini adalah penulis hanya membahas mengenai apa itu MapReduce, Tahapan Proses MapReduce, Contoh kasus, dan Keuntungan menggunakan MapReduce.
Tujuan Penulisan
Tujuan dari penulisan ini adalah memperkenalkan apa itu mapreduce, mengetahui tahapan proses Mapreduce, dan mengetahui keuntungan untuk menggunakan MapReduce.


  
PEMBAHASAN
Definisi
MapReduce adalah model pemrograman rilisan Google yang ditujukan untuk memproses data berukuran raksasa secara terdistribusi dan paralel dalam cluster yang terdiri atas ribuan computer.



Dalam memproses data, secara garis besar MapReduce dapat dibagi dalam dua proses yaitu proses Map dan proses Reduce. Kedua jenis proses ini didistribusikan atau dibagi-bagikan ke setiap komputer dalam suatu cluster (kelompok komputer yang salih terhubung) dan berjalan secara paralel tanpa saling bergantung satu dengan yang lainnya. Proses Map bertugas untuk mengumpulkan informasi dari potongan-potongan data yang terdistribusi dalam tiap komputer dalam cluster. Hasilnya diserahkan kepada proses Reduce untuk diproses lebih lanjut. Hasil proses Reduce merupakan hasil akhir yang dikirim ke pengguna. Untuk menggunakan MapReduce, seorang programer cukup membuat dua program yaitu program yang memuat kalkulasi atau prosedur yang akan dilakukan oleh proses Map dan Reduce. Jadi tidak perlu pusing memikirkan bagaimana memotong-motong data untuk dibagi-bagikan kepada tiap komputer, dan memprosesnya secara paralel kemudian mengumpulkannya kembali. Semua proses ini akan dikerjakan secara otomatis oleh MapReduce yang dijalankan diatas Google File System.
Tahapan proses MapReduce
MapReduce terdiri atas tiga tahap, yaitu tahap map, tahap shuffle, dan terakhir tahap reduce. untuk tahapan shuffle dan reduce digabungkan kedalam satu tahap besaran-nya yaitu tahap reduce.
1. Tahap map, memproses data inputan yang umumnya berupa file yang tersimpan dalan HDFS (dapat di baca di Sistem file terdistribusi), inputan tersebut kemudian diubah menjadi tuple yaitu pasangan antara key dan value-nya.
2. Tahap reduce, memproses data inputan dari hasil proses map, yang kemudian dilakukan tahap shuffle dan reduce yang hasil data set baru-nya disimpan di HDFS kembali.

Berikut ini ilustrasi untuk mendapatkan gambaran tentang proses map dan reduce.


Contoh Kasus
Contoh kasus map reduce adalah misalnya jika kita ingin menghitung jumlah penggunaan huruf dalam sebuah buku. Misal kita punya satu file teks besar yang berisi seluruh kalimat yang menyusun sebuah buku. Maka yang dilakukan oleh Map Reduce program yang menghitung penggunaan kata dalam buku tersebut kurang lebih sebagai berikut:

Proses Map:
Membaca tiap baris kalimat di dalam file teks tersebut.
Membaca tiap kata yang ada dalam beris tersebut dan membuat sebuah map untuk kata tersebut. Key dari map itu adalah kata tersebut sedangkan value dari map itu adalah 1.
Sampai disini hasil yang kita dapatkan dari dua langkah diatas adalah daftar map untuk semua kata dari file teks tersebut dengan value 1. Karena kita tidak menyatukan perhitungan kata-kata yang sama dalam satu map, maka tersapat map dengan key yang sama. Misal ada map kata ‘Dan’ => 1 berulang kali.
Proses Reduce:
Melakukan sorting atau pengelompokan map dengan kata-kata yang sama.
Menjumlahkan untuk mencari total dari kata-kata yang sama tersebut
Sampai disini maka hasilnya adalah map dengan key yang unik setiap kata berikut dengan jumlah penggunaannya di buku tersebut.

Keuntungan pemrograman MapReduce
Keuntungan dari pemrograman MapReduce adalah -
·         Scalability
Hadoop terjadi menjadi platform yang sangat scalable. Hal ini terutama karena kemampuannya untuk menyimpan serta mendistribusikan data set besar di banyak server. Server ini bisa murah dan mereka juga beroperasi secara paralel. Also, penambahan server hanya menambah kekuatan pemrosesan.
Bertentangan dengan sistem manajemen database relasional tradisional (RDMS) yang tidak dapat skala untuk memproses data dalam jumlah besar, pemrograman Hadoop MapReduce memungkinkan organisasi bisnis untuk menjalankan aplikasi dari sejumlah besar node yang juga melibatkan penggunaan banyak ribu terabyte data.
·         solusi biaya-efektif
struktur yang sangat scalable Hadoop juga menyiratkan bahwa ia datang di sebagai biaya-efektif solusi yang sangat untuk bisnis yang perlu untuk menyimpan pernah Data berkembang.
Dalam hal sistem manajemen database relasional tradisional, menjadi biaya besar-besaran mahal untuk skala ke derajat mungkin dengan Hadoop, hanya untuk memproses data. Dengan demikian, banyak bisnis harus berhemat data dan selanjutnya melaksanakan klasifikasi berdasarkan asumsi tentang bagaimana data tertentu bisa menjadi yang paling berharga. Dalam proses, data mentah harus dihapus, mengingat mereka akan melibatkan biaya yang sangat besar untuk penyimpanan. Ini pada dasarnya berfungsi prioritas jangka pendek, dan jika bisnis yang terjadi untuk mengubah rencana suatu tempat di telepon, set lengkap data mentah akan tersedia untuk penggunaan nanti.
Pada catatan yang sama sekali berbeda, arsitektur scale-out Hadoop ini, bersama dengan pemrograman MapReduce, memungkinkan penyimpanan dan pengolahan data dengan cara yang sangat terjangkau dan juga untuk penggunaan di kemudian hari. In fact, penghematan biaya yang besar dan biaya dapat mengurangi dari ribu / sepuluh ribu angka untuk seratus angka untuk setiap terabyte data.
·         keluwesan
Organisasi bisnis dapat menggunakan pemrograman Hadoop MapReduce untuk memiliki akses ke berbagai sumber data baru dan juga beroperasi pada jenis data, apakah mereka terstruktur atau tidak terstruktur. Hal ini memungkinkan mereka untuk menghasilkan nilai dari semua data yang dapat diakses oleh mereka.
Sepanjang garis seperti, Hadoop menawarkan dukungan untuk berbagai bahasa yang dapat digunakan untuk pengolahan data dan penyimpanan. Apakah sumber data media sosial, email, atau clickstream, MapReduce dapat bekerja pada semua dari mereka. Also, pemrograman Hadoop MapReduce memungkinkan untuk banyak aplikasi, seperti sistem rekomendasi, pengolahan kayu, analisis pemasaran, pergudangan data dan deteksi penipuan.
·         Cepat
Hadoop menggunakan metode penyimpanan yang dikenal sebagai sistem file terdistribusi, yang pada dasarnya menerapkan sistem pemetaan untuk mencari data dalam cluster. Alat yang digunakan untuk pengolahan data, seperti pemrograman MapReduce, juga umumnya berada di server yang sama, yang memungkinkan untuk proses lebih cepat data.
Bahkan jika Anda kebetulan berurusan dengan volume besar data yang tidak terstruktur, Hadoop MapReduce mengambil menit untuk memproses terabyte data, dan jam untuk petabyte data.
·         Keamanan dan Otentikasi
Keamanan merupakan aspek penting dari aplikasi apapun. Jika setiap orang yang melanggar hukum atau organisasi memiliki akses ke beberapa petabyte data organisasi Anda, dapat merugikan Anda besar dalam hal urusan bisnis dan operasi.
Dalam kasus ini, MapReduce bekerja dengan HDFS dan keamanan HBase yang memungkinkan hanya disetujui pengguna untuk beroperasi pada data yang disimpan dalam sistem.
·         Proses paralel
Salah satu aspek utama dari kerja pemrograman MapReduce adalah bahwa hal itu membagi tugas dengan cara yang memungkinkan eksekusi mereka secara paralel.
pemrosesan paralel memungkinkan beberapa prosesor untuk mengambil tugas-tugas dibagi, sehingga mereka menjalankan seluruh program dalam waktu kurang.
·         Ketersediaan dan sifat ulet
Ketika data dikirim ke node individu dalam seluruh jaringan, set yang sama data juga diteruskan ke berbagai node lain yang membentuk jaringan. Thus, jika ada kegagalan yang mempengaruhi node tertentu, selalu ada salinan lain yang masih bisa diakses kapan pun kebutuhan mungkin timbul. Ini selalu menjamin ketersediaan data.
Salah satu keuntungan terbesar yang ditawarkan oleh Hadoop adalah bahwa toleransi kesalahan yang. Hadoop MapReduce memiliki kemampuan untuk cepat mengenali kesalahan yang terjadi dan kemudian menerapkan solusi pemulihan cepat dan otomatis. Hal ini membuat permainan changer ketika datang ke pengolahan data besar.
·         model sederhana pemrograman
Di antara berbagai keuntungan yang Hadoop MapReduce penawaran, salah satu yang paling penting adalah bahwa fakta bahwa itu didasarkan pada model pemrograman sederhana. Ini pada dasarnya memungkinkan programmer untuk mengembangkan program MapReduce yang dapat menangani tugas-tugas dengan lebih mudah dan efisiensi.
Program untuk MapReduce dapat ditulis menggunakan Java, yang merupakan bahasa yang tidak sangat sulit untuk pickup dan juga digunakan secara luas. Thus, mudah bagi orang untuk belajar dan menulis program yang memenuhi pengolahan data kebutuhan mereka cukup.
  

PENUTUP
Kesimpulan
            Kesimpulan dari bahasan di atas tentang MapReduce adalah sebenarnya MapReduce termasuk dalam komputasi modern yang menggunakan Bahasa pemrograman JAVA, menggunakan dua proses yaitu Map dan Reduce yang menjadikannya  bisa memproses parallel ke Multiple Node.
            Apa itu komputasi, Komputasi adalah algoritma yang digunakan untuk menemukan suatu cara dalam memecahkan masalah dari sebuah data input. Data input disini adalah sebuah masukan yang berasal dari luar lingkungan sistem. Komputasi ini merupakan bagian dari ilmu komputer berpadu dengan ilmu matematika.
            Apa itu komputasi Modern, Komputasi modern adalah sebuah konsep sistem yang menerima intruksi-intruksi dan menyimpannya dalam sebuah memory, memory disini bisa juga dari memory komputer.
Daftar Pustaka

http://seto.citravision.com/berita-39-pengantar-komputasi-cloud--map-reduce-dan-nosql-not-only-sql.html


Kelompok:
Audimas Firian                       (51413488)
Dimas Edra Octama              (52413489)
Syafril Rahimansyah P.         (58413730)