Data Benchmark for Google Big Query and Elasticsearch

  • Nisrina Akbar Rizky Putri Universitas Gadjah Mada
  • Widyawan Universitas Gadjah Mada
  • Teguh Bharata Adji Universitas Gadjah Mada

Abstract

Cloud di masa kini tidak hanya berfungsi sebagai media penyimpanan data, tetapi dapat digunakan juga sebagai media untuk mengelola ataupun menganalisis suatu data. Google menawarkan Google BigQuery sebagai platform yang mampu mengelola dan menganalisis data, sedangkan Elasticsearch merupakan mesin pencari dan analisis yang dapat digunakan untuk menganalisis data dengan menggunakan Kibana. Dengan menggunakan dataset berupa cuitan hasil proses crawling melalui http://netlytic.org/ yang mengandung tagar #COVID19 dan #coronavirus, data tersebut dianalisis dan digunakan untuk membandingkan kinerjanya dengan benchmark. Benchmark merupakan proses yang digunakan untuk mengukur dan membandingkan kinerja terhadap sebuah aktivitas, sehingga tercapai tingkat kinerja yang diinginkan. Data benchmark dilakukan pada kedua platfrom untuk menghasilkan atau mengetahui beban kerja dari platfrom. Hasil akhir yang didapatkan menunjukkan bahwa Google BigQuery memiliki hasil yang lebih unggul, baik dari wadah upload untuk dataset yang lebih besar dibandingkan Elasticsearch dan dengan dua model pengujian kueri. Waktu pengelolaan kueri pada Google BigQuery juga lebih singkat dan cepat dibandingkan dengan Elasticsearch. Selain itu, hasil visualisasi dari kedua platform ini memiliki jumlah persentase yang sama.

References

E. Pratama dan I.P. Agus, Handbook Data Warehouse. Bandung, Indonesia: Informatika Bandung, 2018.

C. Dobre dan F. Xhafa, “Intelligent Services for Big Data Science,” Futur. Gener. Comput. Syst., Vol. 37, hal. 267–281, 2014.

V.K. Jain dan S. Kumar, “Big Data Analytic Using Cloud Computing,” Proc. - 2015 2nd IEEE Int. Conf. Adv. Comput. Commun. Eng. (ICACCE 2015), 2015, hal. 667–672.

H. Tankovska (2021) “Global Social Networks Ranked by Number of Users 2021,” [Online], https://www.statista.com/statistics/272014/global-social-networks-ranked-by-number-of-users/, tanggal akses: 31-Mar- 2021).

P. Srivastava dan R. Khan, “A Review Paper on Cloud Computing,” Int. J. Adv. Res. Comput. Sci. Softw. Eng., Vol. 8, No. 6, hal. 17-20, 2018.

J. Tigani dan S. Naidu, Google BigQuery Analytics, Hoboken, USA: Wiley, 2014.

O. Dawelbeit dan R. McCrindle, “Efficient Dictionary Compression for Processing RDF Big Data Using Google BigQuery,” Proc. 2016 IEEE Glob. Commun. Conf. (GLOBECOM 2016), 2016, hal. 1–6.

V.A. Zamfir, M. Carabas, C. Carabas, dan N. Tapus, “Systems Monitoring and Big Data Analysis Using the Elasticsearch System,” Proc. - 2019 22nd Int. Conf. Control Syst. Comput. Sci. (CSCS 2019), 2019, hal. 188–193.

Y.C. Tay, “Data Generation for Application-Specific Benchmarking,” Proc. VLDB Endow., Vol. 4, No. 12, hal. 1470–1473, 2011.

A. Bog, Benchmarking Transaction and Analytical Processing Systems. Cham, Switzerland: Springer, 2014.

D.O. Baskoro, Big Data Benchmark pada Hadoop 2, Spark, dan Presto Menggunakan Metode Perbandingan Waktu Respon Query, Skripsi, Universitas Gadjah Mada, Yogyakarta, Indonesia, 2015.

P.P.I. Langi, Widyawan, W. Najib, dan T.B. Aji, “An Evaluation of Twitter River and Logstash Performances as Elasticsearch Inputs for Social Media Analysis of Twitter,” Proc. 2015 Int. Conf. Inf. Commun. Technol. Syst. ICTS 2015, 2016, hal. 181–186.

S. Gupta dan R. Rani, “A Comparative Study of Elasticsearch and CouchDB Document Oriented Databases,” Proc. Int. Conf. Inven. Comput. Technol. (ICICT 2016), 2016, hal. 1–4.

A.U. Abdullahi, R. Ahmad, dan N.M. Zakaria, “Big data: Performance Profiling of Meteorological and Oceanographic Data on Hive,” Proc. 2016 3rd Int. Conf. Comput. Inf. Sci. (ICCOINS 2016), 2016, hal. 203–208.

C. Kotas, T. Naughton, dan N. Imam, “A Comparison of Amazon Web Services and Microsoft Azure Cloud Platforms for High Performance Computing,” 2018 IEEE Int. Conf. Consum. Electron. (ICCE 2018), 2018, hal. 1–4.

Published
2021-08-26
How to Cite
Putri, N. A. R., Widyawan, & Teguh Bharata Adji. (2021). Data Benchmark for Google Big Query and Elasticsearch. Jurnal Nasional Teknik Elektro Dan Teknologi Informasi, 10(3), 196-203. https://doi.org/10.22146/jnteti.v10i3.1745
Section
Articles