ABSTRAK
Audimas
Firian (51413488)
Dimas Edra
Octama (52413489)
Syafril
Rahimansyah P. (58413730)
PENGANTAR KOMPUTASI MODERN “MAPREDUCE”
JURNAL.
Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Gunadarma
2017.
Kata Kunci
: Jurnal, Pengantar, Komputasi, Modern, MapReduce
Dewasa ini pemecahan masalah
dilakukan tidak hanya dengan logika tetapi dengan algoritma yang di gabungkan
pada computer yang menjadikannya komputasi, komputasi yang telah ada terus
berkembang, dengan adanya perkembangan komputasi maka di jaman sekarang ini
sudah banyak yang melakukan pemecahan masalah dengan computer terpadu atau komputasi,
dan juga memperkenalkan apa itu mapreduce, mengetahui tahapan proses Mapreduce,
dan mengetahui keuntungan untuk menggunakan MapReduce.
PENDAHULUAN
Latar Belakang Masalah
Dewasa ini pemecahan masalah
dilakukan tidak hanya dengan logika tetapi dengan algoritma yang di gabungkan
pada computer yang menjadikannya komputasi, komputasi yang telah ada terus
berkembang, dengan adanya perkembangan komputasi maka di jaman sekarang ini
sudah banyak yang melakukan pemecahan masalah dengan computer terpadu atau
komputasi.
Seperti
bahasan penulis tentang mapreduce, apa itu mapreduce. Mapreduce adalah sebuah
model perograman rilisan google yang menggunakan Bahasa pemrograman JAVA,
memanfaatkan komputasi dengan system terdistribusi, menggunakan dua proses
yaitu map dan reduce sehingga bisa memproses parallel ke multiple node.
Batasan Masalah
Batasan masalah pada
penulisan ini adalah penulis hanya membahas mengenai apa itu MapReduce, Tahapan
Proses MapReduce, Contoh kasus, dan Keuntungan menggunakan MapReduce.
Tujuan Penulisan
Tujuan dari penulisan ini adalah memperkenalkan
apa itu mapreduce, mengetahui tahapan proses Mapreduce, dan mengetahui keuntungan
untuk menggunakan MapReduce.
PEMBAHASAN
Definisi
MapReduce adalah model pemrograman rilisan Google yang
ditujukan untuk memproses data berukuran raksasa secara terdistribusi dan
paralel dalam cluster yang terdiri atas ribuan computer.
Dalam memproses data,
secara garis besar MapReduce dapat dibagi dalam dua proses yaitu proses Map dan
proses Reduce. Kedua jenis proses ini didistribusikan atau dibagi-bagikan ke
setiap komputer dalam suatu cluster (kelompok komputer yang salih terhubung)
dan berjalan secara paralel tanpa saling bergantung satu dengan yang lainnya.
Proses Map bertugas untuk mengumpulkan informasi dari potongan-potongan data
yang terdistribusi dalam tiap komputer dalam cluster. Hasilnya diserahkan
kepada proses Reduce untuk diproses lebih lanjut. Hasil proses Reduce merupakan
hasil akhir yang dikirim ke pengguna. Untuk menggunakan MapReduce, seorang
programer cukup membuat dua program yaitu program yang memuat kalkulasi atau
prosedur yang akan dilakukan oleh proses Map dan Reduce. Jadi tidak perlu
pusing memikirkan bagaimana memotong-motong data untuk dibagi-bagikan kepada
tiap komputer, dan memprosesnya secara paralel kemudian mengumpulkannya
kembali. Semua proses ini akan dikerjakan secara otomatis oleh MapReduce yang
dijalankan diatas Google File System.
Tahapan proses MapReduce
MapReduce terdiri atas tiga tahap, yaitu tahap map, tahap
shuffle, dan terakhir tahap reduce. untuk tahapan shuffle dan reduce
digabungkan kedalam satu tahap besaran-nya yaitu tahap reduce.
1. Tahap map, memproses data inputan yang umumnya berupa file yang tersimpan dalan HDFS (dapat di baca di Sistem file terdistribusi), inputan tersebut kemudian diubah menjadi tuple yaitu pasangan antara key dan value-nya.
2. Tahap reduce, memproses data inputan dari hasil proses map, yang kemudian dilakukan tahap shuffle dan reduce yang hasil data set baru-nya disimpan di HDFS kembali.
Berikut ini ilustrasi untuk mendapatkan gambaran tentang proses map dan reduce.
1. Tahap map, memproses data inputan yang umumnya berupa file yang tersimpan dalan HDFS (dapat di baca di Sistem file terdistribusi), inputan tersebut kemudian diubah menjadi tuple yaitu pasangan antara key dan value-nya.
2. Tahap reduce, memproses data inputan dari hasil proses map, yang kemudian dilakukan tahap shuffle dan reduce yang hasil data set baru-nya disimpan di HDFS kembali.
Berikut ini ilustrasi untuk mendapatkan gambaran tentang proses map dan reduce.
Contoh Kasus
Contoh kasus map reduce adalah misalnya jika kita ingin
menghitung jumlah penggunaan huruf dalam sebuah buku. Misal kita punya satu
file teks besar yang berisi seluruh kalimat yang menyusun sebuah buku. Maka
yang dilakukan oleh Map Reduce program yang menghitung penggunaan kata dalam
buku tersebut kurang lebih sebagai berikut:
Proses Map:
Membaca tiap baris kalimat di dalam file teks tersebut.
Membaca tiap kata yang ada dalam beris tersebut dan membuat
sebuah map untuk kata tersebut. Key dari map itu adalah kata tersebut sedangkan
value dari map itu adalah 1.
Sampai disini hasil yang kita dapatkan dari dua langkah
diatas adalah daftar map untuk semua kata dari file teks tersebut dengan value
1. Karena kita tidak menyatukan perhitungan kata-kata yang sama dalam satu map,
maka tersapat map dengan key yang sama. Misal ada map kata ‘Dan’ => 1
berulang kali.
Proses Reduce:
Melakukan sorting atau pengelompokan map dengan kata-kata
yang sama.
Menjumlahkan untuk mencari total dari kata-kata yang sama
tersebut
Sampai disini maka hasilnya adalah map dengan key yang unik
setiap kata berikut dengan jumlah penggunaannya di buku tersebut.
Keuntungan pemrograman MapReduce
Keuntungan dari pemrograman MapReduce adalah -
·
Scalability
Hadoop terjadi menjadi platform yang sangat scalable. Hal ini
terutama karena kemampuannya untuk menyimpan serta mendistribusikan data set
besar di banyak server. Server ini bisa murah dan mereka juga beroperasi secara
paralel. Also, penambahan server hanya menambah kekuatan pemrosesan.
Bertentangan dengan sistem manajemen database relasional
tradisional (RDMS) yang tidak dapat skala untuk memproses data dalam jumlah
besar, pemrograman Hadoop MapReduce memungkinkan organisasi bisnis untuk
menjalankan aplikasi dari sejumlah besar node yang juga melibatkan penggunaan
banyak ribu terabyte data.
·
solusi
biaya-efektif
struktur yang sangat scalable Hadoop juga menyiratkan bahwa
ia datang di sebagai biaya-efektif solusi yang sangat untuk bisnis yang perlu
untuk menyimpan pernah Data berkembang.
Dalam hal sistem manajemen database relasional tradisional,
menjadi biaya besar-besaran mahal untuk skala ke derajat mungkin dengan Hadoop,
hanya untuk memproses data. Dengan demikian, banyak bisnis harus berhemat data
dan selanjutnya melaksanakan klasifikasi berdasarkan asumsi tentang bagaimana
data tertentu bisa menjadi yang paling berharga. Dalam proses, data mentah
harus dihapus, mengingat mereka akan melibatkan biaya yang sangat besar untuk
penyimpanan. Ini pada dasarnya berfungsi prioritas jangka pendek, dan jika
bisnis yang terjadi untuk mengubah rencana suatu tempat di telepon, set lengkap
data mentah akan tersedia untuk penggunaan nanti.
Pada catatan yang sama sekali berbeda, arsitektur scale-out
Hadoop ini, bersama dengan pemrograman MapReduce, memungkinkan penyimpanan dan
pengolahan data dengan cara yang sangat terjangkau dan juga untuk penggunaan di
kemudian hari. In fact, penghematan biaya yang besar dan biaya dapat mengurangi
dari ribu / sepuluh ribu angka untuk seratus angka untuk setiap terabyte data.
·
keluwesan
Organisasi bisnis dapat menggunakan pemrograman Hadoop
MapReduce untuk memiliki akses ke berbagai sumber data baru dan juga beroperasi
pada jenis data, apakah mereka terstruktur atau tidak terstruktur. Hal ini
memungkinkan mereka untuk menghasilkan nilai dari semua data yang dapat diakses
oleh mereka.
Sepanjang garis seperti, Hadoop menawarkan dukungan untuk
berbagai bahasa yang dapat digunakan untuk pengolahan data dan penyimpanan.
Apakah sumber data media sosial, email, atau clickstream, MapReduce dapat
bekerja pada semua dari mereka. Also, pemrograman Hadoop MapReduce memungkinkan
untuk banyak aplikasi, seperti sistem rekomendasi, pengolahan kayu, analisis
pemasaran, pergudangan data dan deteksi penipuan.
·
Cepat
Hadoop menggunakan metode penyimpanan yang dikenal sebagai
sistem file terdistribusi, yang pada dasarnya menerapkan sistem pemetaan untuk
mencari data dalam cluster. Alat yang digunakan untuk pengolahan data, seperti
pemrograman MapReduce, juga umumnya berada di server yang sama, yang
memungkinkan untuk proses lebih cepat data.
Bahkan jika Anda kebetulan berurusan dengan volume besar data
yang tidak terstruktur, Hadoop MapReduce mengambil menit untuk memproses
terabyte data, dan jam untuk petabyte data.
·
Keamanan
dan Otentikasi
Keamanan merupakan aspek penting dari aplikasi apapun. Jika
setiap orang yang melanggar hukum atau organisasi memiliki akses ke beberapa
petabyte data organisasi Anda, dapat merugikan Anda besar dalam hal urusan
bisnis dan operasi.
Dalam kasus ini, MapReduce bekerja dengan HDFS dan keamanan
HBase yang memungkinkan hanya disetujui pengguna untuk beroperasi pada data
yang disimpan dalam sistem.
·
Proses
paralel
Salah satu aspek utama dari kerja pemrograman MapReduce
adalah bahwa hal itu membagi tugas dengan cara yang memungkinkan eksekusi
mereka secara paralel.
pemrosesan paralel memungkinkan beberapa prosesor untuk
mengambil tugas-tugas dibagi, sehingga mereka menjalankan seluruh program dalam
waktu kurang.
·
Ketersediaan
dan sifat ulet
Ketika data dikirim ke node individu dalam seluruh jaringan,
set yang sama data juga diteruskan ke berbagai node lain yang membentuk
jaringan. Thus, jika ada kegagalan yang mempengaruhi node tertentu, selalu ada
salinan lain yang masih bisa diakses kapan pun kebutuhan mungkin timbul. Ini
selalu menjamin ketersediaan data.
Salah satu keuntungan terbesar yang ditawarkan oleh Hadoop
adalah bahwa toleransi kesalahan yang. Hadoop MapReduce memiliki kemampuan
untuk cepat mengenali kesalahan yang terjadi dan kemudian menerapkan solusi
pemulihan cepat dan otomatis. Hal ini membuat permainan changer ketika datang
ke pengolahan data besar.
·
model
sederhana pemrograman
Di antara berbagai keuntungan yang Hadoop MapReduce
penawaran, salah satu yang paling penting adalah bahwa fakta bahwa itu
didasarkan pada model pemrograman sederhana. Ini pada dasarnya memungkinkan
programmer untuk mengembangkan program MapReduce yang dapat menangani
tugas-tugas dengan lebih mudah dan efisiensi.
Program untuk MapReduce dapat ditulis menggunakan Java, yang
merupakan bahasa yang tidak sangat sulit untuk pickup dan juga digunakan secara
luas. Thus, mudah bagi orang untuk belajar dan menulis program yang memenuhi
pengolahan data kebutuhan mereka cukup.
PENUTUP
Kesimpulan
Kesimpulan
dari bahasan di atas tentang MapReduce adalah sebenarnya MapReduce termasuk
dalam komputasi modern yang menggunakan Bahasa pemrograman JAVA, menggunakan
dua proses yaitu Map dan Reduce yang menjadikannya bisa memproses parallel ke Multiple Node.
Apa itu
komputasi, Komputasi adalah algoritma yang digunakan untuk menemukan suatu cara
dalam memecahkan masalah dari sebuah data input. Data input disini adalah
sebuah masukan yang berasal dari luar lingkungan sistem. Komputasi ini
merupakan bagian dari ilmu komputer berpadu dengan ilmu matematika.
Apa itu
komputasi Modern, Komputasi modern adalah sebuah konsep sistem yang menerima
intruksi-intruksi dan menyimpannya dalam sebuah memory, memory disini bisa juga
dari memory komputer.
Daftar Pustaka
http://seto.citravision.com/berita-39-pengantar-komputasi-cloud--map-reduce-dan-nosql-not-only-sql.html
Kelompok:
Audimas Firian (51413488)
Dimas Edra Octama (52413489)
Syafril Rahimansyah P. (58413730)



