Pre-Processing Kalsifikasi Karakter Baik Buruk Seseorang Menggunakan Data Twitter

  • Evi Pertiwi Munthe Institut Teknologi Telkom Purwokerto
  • Rima Dias Ramadhani Institut Teknologi Telkom Purwokerto
  • Muhammad Zidny Naf’an Institut Teknologi Telkom Purwokerto
  • Rifki Adhitama Institut Teknologi Telkom Purwokerto
Keywords: tweet, pre-processing, klasifikasi

Abstract

Jumlah pengguna Twitter di Indonesia mencapai 332 juta pengguna per bulannya pada tahun 2015. Twitter merupakan sebuah situs web yang menawarkan jejaringan sosial dalam bentuk microblog. Dari microblog pada twitter dapat diketahui karakter seseorang. Salah satu penelitian untuk mengetahui karakter dari
seseorang berdasarkan data twitter di antaranya adalah “You are what you tweet: Personality expression and perception on twitter”. Pada penelitian ini membahas tentang hubungan antara karakter seseorang dan media social berdasarkan microblog pada twitter dengan analisis linguistik. Pada penelitian menggunakan teknik pencocokan kosa kata yang digunakan oleh pengguna twitter dengan kamus data yang tergolong baik atau buruk secara manual dengan menggunakan teknik analisis linguistik. Hasil dari penelitian tersebut, didapatkan klasifikasi baik buruk yang memiliki akurasi yang baik. Namun dalam studi tersebut belum ada algoritma preprocessing yang dapat digunakan untuk menentukan karakter dari seseorang untuk mempercepat klasifikasi dengan hasil akurasi yang baik. Teknik pre-processing digunakan untuk menghilangkan noise data tweet yang sudah diperoleh. Namun dalam penelitian ini hasil dari pre-processing kurang akurat dikarenakan library dan kamus yang digunakan dalam mengelola data kurang lengkap. Penggunaan fitur tf idf dapat memberikan
informasi seberapa banyak kata tersebut muncul dalam dokumen yang sudah memiliki klasifikasi baik dan buruk netral pada masing-masing kriteria.

References

[1] E. Prasetyo, DATA MINING-Mengolah Data menjadi Informasi Menggunakan Matlab, Yogyakarta: Andi,2014.
[2] E. Prasetyo, DATA MINING-Konsep dan Aplikasi Menggunakan MATLAB, Yogyakarta: ANDI,2012.
[3] A. Maulana , “www.cnnindonesia.com,” CNN Indonesia, 23 Maret 2016. [Online]. Available: http://www.cnnindonesia.com/teknologi/2016032
2085045-185-118939/twitter-rahasiakan-jumlahpengguna-di-indonesia/. [Accessed 27 April 2017].
[4] N.Y. A. Faradhillah, R. P. Kusumawardani, dan I. Hafidz, “Eksperimen Sistem Klasifikasi Analisa Sentimen Twitter pada Akun Resmi Pemerintah Kota Surabaya Berbasis Pembelajaran Mesin (Experiments on Sentiment Classification System for Tweets of the Official Account of the City Government of Surabaya based on Mach,” Pros. Semin. Nas. Sist. Inf. Indones. 2016, pp. 15–24, 2016.
[5] L. Qiu, H. Lin, J. Ramsay dan F. Yang, “You are what you tweet: Personality expression and perception on Twitter,” Journal of Research in Personality, vol. 46, no. 6, pp. 710-718,2012.
[6] S. Urolagin, “Text Mining of Tweet for Sentiment Classification and Association with Stock Prices,” 2017 Int. Conf. Comput. Appl. ICCA 2017, pp. 384–388, 2017.
[7] I. B. N. S. Hardaya, A. Dhini, dan I. Surjandari, “Application of text mining for classification of community complaints and proposals,” 2017 3rd Int. Conf. Sci. Inf. Technol., pp. 144–149, 2017.
[8] S. M. H. Dadgar, M. S. Araghi, dan M. M. Farahani, “A novel text mining approach based on TF-IDF and support vector machine for news classification,” Proc. 2nd IEEE Int. Conf. Eng. Technol. ICETECH 2016, no. March, pp. 112–116, 2016.
[9] A. Chachra, P. Mehndiratta, dan M. Gupta, “Sentiment analysis of text using deep convolution neural networks,” 2017 Tenth Int. Conf. Contemp. Comput., no. August, pp. 1–6, 2017.
[10] P. Prameswari, “Mining Online Reviews in Indonesia ’ s Priority Tourist Destinations Using Sentiment Analysis and Text Summarization Approach,” no. iCAST, pp. 121–126, 2017.
[11] H. Alam, “Sentiment Analysis for Bangla Sentences using Convolutional Neural Network,” pp. 22–24, 2017.
[12] L.-S. Chen, C.-H. Liu, dan H.-J. Chiu, “A neural network based approach for sentiment classification in the blogosphere, ” J. Informetr., vol. 5, no. 2, pp. 313–322, 2011.
[13] D. J. Suri dan K. K. Purnamasari, “Perbandingan Seleksi Fitur Untuk Klasifikasi Sentimen SVM Pada Twitter.”
[14] J.A.Gliem dan R.R. Gliem, “Calculating, Interpreting, and Reporting Croanbach’s Alpha Reliability Coefficient for Likert-Type Scales,” p.87, 2003.
Published
2019-04-18
How to Cite
Munthe, E. P., Ramadhani, R. D., Naf’an, M. Z., & Adhitama, R. (2019). Pre-Processing Kalsifikasi Karakter Baik Buruk Seseorang Menggunakan Data Twitter. Proceedings of the National Conference on Electrical Engineering, Informatics, Industrial Technology, and Creative Media, 1(1), 97-102. Retrieved from https://centive.ittelkom-pwt.ac.id/index.php/centive/article/view/18