idntechnews.com merupakan media online yang mempunyai visi Media Informasi Terpercaya. Dengan misi menyediakan informasi terbaru seputar dunia teknologi, gadget, smartphone, social media, komputer dan seputar teknologi politik olahraga sosial dan lainnya yang di himpun dari berbagai sumber yang bisa dipercaya dan dipertanggung jawabkan

Python LSI/LSA (Latent Semantic Indexing/Analysis) - DataCamp

Latent Semantic Analysis (LSA) diterapkan dengan mengambil jutaan halaman web, di mana mesin pencari dapat mempelajari kata-kata yang terkait dan konsep kata benda mana yang berhubungan satu sama lain. Mesin Searh sedang mempertimbangkan istilah terkait dan mengenali istilah mana yang sering muncul bersamaan, mungkin pada halaman yang sama, atau dalam jarak yang cukup dekat. Jadi ini terutama digunakan untuk pemodelan bahasa atau sebagian besar aplikasi lainnya.

Bagian dari proses ini melibatkan melihat konten salinan halaman, atau disertakan pada tautan, dan mencari cara bagaimana mereka terkait. Latent Semantic Analysis (LSA) didasarkan pada Teorema Dekomposisi Nilai Singular yang terkenal dari Matriks Aljabar tetapi diterapkan pada teks. Itulah sebabnya beberapa analisis semantik yang dilakukan pada tingkat konten halaman juga dapat dilakukan pada data tautan.

LSA mewakili makna kata sebagai vektor, sehingga menghitung kemiripan kata. Iit telah sangat efisien untuk tujuan itu, dan masih digunakan. Mengenai teks untuk aplikasi ini, dianggap linier. Ini membuat LSA lambat karena menggunakan metode matriks yang disebut Singular Value Decomposition untuk membuat ruang konsep. Tapi itu hanya membahas kesamaan semantik dan bukan peringkat, yang merupakan prioritas SEO.

SEO ilmiah memiliki tujuan yang sama. Mereka mencoba menemukan kata dan frasa mana yang paling semantik ditautkan bersama untuk frasa kata kunci tertentu, jadi ketika Mesin Pencari merayapi web, mereka menemukan bahwa tautan ke halaman dan konten tertentu di dalamnya secara semantik terkait dengan informasi lain yang saat ini ada dalam basis data mereka

Jadi, sebagai kesimpulan, LSA menghitung ukuran kemiripan untuk kata-kata berdasarkan kemungkinan pola kata dalam dokumen dan seberapa sering kata-kata muncul dalam konteks yang sama atau bersama-sama dengan set elemen umum yang sama.