Kegiatan yang dilakukan pada saat Praktek Kerja Lapang di PT. Global Data Inspirasi (Datains) adalah mempelajari tentang anotasi data machine learning menggunakan label studio dan jupyter lab. Dalam kegiatan Praktek Kerja Lapang ini terdapat pokok bahasan utama yaitu anotasi data twitter yang akan digunakan pada Semantic.id.
Semantic.id merupakan implementasi teknologi Big Data yang memungkinkan pengolahan informasi dalam jumlah besar yang tersebar di media social atau media online dengan beragam jenis data. Semantic.id terdiri atas keyword monitoring, sentiment analysis, keyword comparison, social network analysis, topic classification, engagement analysis, intolerance analysis, issue analysis, dan influencer analysis. Pada Semantic.id data training harus selalu dilakukan improve karena bahasa pada twitter sangat kompleks dan dinamis sehingga mengalami perubahan. Selain itu, tujuan dari dilakukan improve pada model data agar hasil akurasi dari data bagus. Metode klasifikasi yang digunakan untuk meningkat hasil akurasi adalah algoritma support vector machine dengan hasil akurasi sebesar 80% menggunkan pengujian confusion matrix.