Artikel ini dibuat sebagai rangka pembuatan tugas besar dari mata kuliah data knowledge engineering. hal yang pertama dilakukan untuk pengerjaan tugas besar ini adalah dengan melakukan pencarian 10 artikel bebas dengan topik yang bersangkutan. Disini, artikel yang diambil adalah artikel yang berhubungan dengan “AMD VEGA”.
Selanjutnya dipastikan komputer sudah terinstall python dan package nltknya. setelah itu run source di bawah ini menggunakan python.
- Buat dataset berdasarkan 10 artikel
- Import package yang diperlukan seperti dibawah
- Selanjutnya adalah tahap preprocessing, yaitu dengan membuang karakter non ascii dan melakukan tokenisasi untuk menghasilkan kata-kata yang terdapat pada dokumen serta memberi tag.
- Setelah melalui tahap preprocessing, hal yang selanjutnya dilakukan adalah dengan mengambil informasi yang dibutuhkan. Pada kasus ini, entitas yang memiliki tag “PERSON” yang akan diambil.
- Dan kemudian, informasi yang dapat diambil dapat muncul seperti dibawah
- Tahap terakhir yaitu menghasilkan grafik keterbuhungan dari tiap-tiap kata pada artikel (dataset) yang sudah disediakan
- Sekumpulan kata pada entity diambil hasil preprocessing sebelumnya dan kemudian di salin ke potongan code ini.
Grafik yang didapatkan adalah sebagai berikut :
Jika ingin mencoba sendiri, source dapat dilihat pada :