Segala sesuatu memiliki dasar, termasuk dalam usaha search engine optimization (SEO); dan memahami dasar atau prinsip kerja search engine ad...
Segala sesuatu memiliki dasar, termasuk dalam usaha search engine optimization (SEO); dan memahami dasar atau prinsip kerja search engine adalah awal yang sangat baik untuk bisa menguasai SEO lebih dalam. Artikel ini akan berbicara mengenai bagaimana search engine bekerja. Karena Google dianggap sebagai search engine yang paling berpengaruh, maka Google akan menjadi inti dari topik ini; meskipun sistem kerja search engine lain bisa dibilang hampir sama.
Dalam perumpamaan sederhana, Google bisa disamakan dengan sebuah buku besar yang memiliki indeks sangat lengkap, mudah digunakan, dan mudah dicari. Ketika user melakukan pencarian, program-program Google melakukan cek terhadap indeks yang dimilikinya untuk menemukan dan menyusun hasil pencarian yang paling relevan sesuai dengan apa yang dicari. Ada 3 konsep atau proses kunci yang memungkinkan Google dapat melakukan hal tersebut: crawling, indexing, dan serving/delivering.Proses dan Sistem Kerja Google.
Proses perayapan Google diawali dari list URL halaman web, yang didapat dari proses crawling sebelumnya ditambah dengan referensi sitemap yang didaftarkan oleh para webmaster. Ketika Googlebot mengunjungi masing-masing halaman website, dia akan menemukan link-link baru sebagai rujukan untuk ditambahkan ke dalam indeks guna proses perayapan selanjutnya (backlink, baik internal links maupun external links). Situs-situs baru yang ditemukan (melalui backlink), perubahan pada website atau halaman website (update), dan link-link mati (dead links) atau rusak (broken links) menjadi referensi untuk mengupdate indeks dengan hasil terbaru.
Umumnya, Googlebot mengunjungi sebuah website paling banyak satu kali dalam beberapa detik. Namun demikian, apabila anda menemukan informasi log bahwa Googlebot berkunjung beberapa kali dalam jarak waktu yang sangat dekat, ini berarti proses sebelumnya belum selesai, dikarenakan delay dari jaringan karena banyaknya proses, sehingga Googlebot harus memulai dari awal lagi.
Googlebot dijalankan oleh beberapa mesin komputer raksasa sekaligus untuk meningkatkan performa dan proses perayapan. Dunia web terus berkembang dan halaman website yang harus di-crawl semakin bertambah. Mesin-mesin yang mendistribusikan Googlebot tersebut letaknya tersebar di beberapa titik server di seluruh dunia. Tujuannya adalah agar proses crawling suatu website dapat cepat dilakukan melalui server terdekat. Inilah mengapa kita sering melihat informasi log yang menunjukkan Googlebot datang dari beberapa IP berbeda, yang semuanya merujuk ke Google.
Note: Sebagai klaim Google, Google tidak memungut bayaran sepeserpun untuk proses ini, berbeda dengan program Adwords yang menampilkan hasil pencarian berbayar di bagian sponsored ads (iklan yang terkait dengan …..[sesuai keyword]).
Ingat, pagerank di sini tidak diartikan sebagai nilai PageRank toolbar, predikat ranking yang diberikan oleh Google dengan parameter 0-10 (yang saat ini semakin tidak penting). PageRank adalah algoritma Google pertama, yang digunakan untuk menilai sebuah halaman website berdasarkan popularitas link. Selain algoritma itu, masih banyak lagi algoritma lain yang juga sangat menentukan. Setelah diproses oleh semua algoritma, sebuah halaman kemudian ditentukan ranking-nya (urutannya) di SERPs (halaman hasil pencarian). Inilah yang disebut sebagai SERP rank, yang selalu berubah setiap harinya, bahkan mungkin setiap jam. Inilah mengapa halaman berpagerank (toolbar) 6 belum tentu mendapatkan hasil listing pencarian yang lebih baik daripada halaman lain yang berpagerank (toolbar) 0. Selain pagerank, ada banyak faktor lain yang sangat berpengaruh, di antaranya struktur/navigasi web, isi web, kualitas konten, popularitas link/web, dll. [Update: Kini Pagerank Toolbar sudah tidak diupdate lagi].
Background
Ketika seseorang melakukan pencarian di Google search engine, hasilnya bisa begitu cepat dihadirkan. Hanya dalam sepersekian detik saja puluhan hingga ratusan halaman pencarian (SERP; search engine result pages) dihadirkan sesuai dengan kueri yang diinginkan si pencari. Bagaimana Google dapat menemukan halaman-halaman web yang sesuai dengan kueri tersebut? Bagaimana pula cara Google menentukan urutan-urutan list dalam hasil pencarian sesuai relevansinya?Dalam perumpamaan sederhana, Google bisa disamakan dengan sebuah buku besar yang memiliki indeks sangat lengkap, mudah digunakan, dan mudah dicari. Ketika user melakukan pencarian, program-program Google melakukan cek terhadap indeks yang dimilikinya untuk menemukan dan menyusun hasil pencarian yang paling relevan sesuai dengan apa yang dicari. Ada 3 konsep atau proses kunci yang memungkinkan Google dapat melakukan hal tersebut: crawling, indexing, dan serving/delivering.Proses dan Sistem Kerja Google.
1. Crawling (Perayapan)
Crawling atau perayapan adalah proses Googlebot (disebut juga sebagai robot, bot, spider, spiderbot, dll) mencari halaman-halaman baru atau yang diupdate untuk ditambahkan ke dalam indeks Google. Google menggunakan beberapa set komputer raksasa untuk mengambil (merayapi) miliaran halaman web. Program Googlebot inilah yang bertugas melakukan pekerjaan itu. Googlebot menggunakan proses berbasis algoritma untuk menentukan situs atau halaman web mana saja yang akan dirayapi, seberapa sering perayapan (crawl) dilakukan, dan berapa banyak halaman yang akan diambil dari sebuah website.Proses perayapan Google diawali dari list URL halaman web, yang didapat dari proses crawling sebelumnya ditambah dengan referensi sitemap yang didaftarkan oleh para webmaster. Ketika Googlebot mengunjungi masing-masing halaman website, dia akan menemukan link-link baru sebagai rujukan untuk ditambahkan ke dalam indeks guna proses perayapan selanjutnya (backlink, baik internal links maupun external links). Situs-situs baru yang ditemukan (melalui backlink), perubahan pada website atau halaman website (update), dan link-link mati (dead links) atau rusak (broken links) menjadi referensi untuk mengupdate indeks dengan hasil terbaru.
Umumnya, Googlebot mengunjungi sebuah website paling banyak satu kali dalam beberapa detik. Namun demikian, apabila anda menemukan informasi log bahwa Googlebot berkunjung beberapa kali dalam jarak waktu yang sangat dekat, ini berarti proses sebelumnya belum selesai, dikarenakan delay dari jaringan karena banyaknya proses, sehingga Googlebot harus memulai dari awal lagi.
Googlebot dijalankan oleh beberapa mesin komputer raksasa sekaligus untuk meningkatkan performa dan proses perayapan. Dunia web terus berkembang dan halaman website yang harus di-crawl semakin bertambah. Mesin-mesin yang mendistribusikan Googlebot tersebut letaknya tersebar di beberapa titik server di seluruh dunia. Tujuannya adalah agar proses crawling suatu website dapat cepat dilakukan melalui server terdekat. Inilah mengapa kita sering melihat informasi log yang menunjukkan Googlebot datang dari beberapa IP berbeda, yang semuanya merujuk ke Google.
Note: Sebagai klaim Google, Google tidak memungut bayaran sepeserpun untuk proses ini, berbeda dengan program Adwords yang menampilkan hasil pencarian berbayar di bagian sponsored ads (iklan yang terkait dengan …..[sesuai keyword]).
2. Indexing (Proses Pengindeks-an)
Setelah proses perayapan, semua data yang diambil di dalam sebuah halaman website kemudian dirposes untuk mengumpulkan seluruh kata (teks) ke dalam sebuah indeks besar. Selain teks, Google juga memproses segala informasi atau tipe konten yang terdapat di dalam halaman website, baik dalam bentuk tag-tag HTML kunci/penting seperti misalnya: p (paragraf), a (link), head, body, meta, title, img (gambar), article, dan komponen-komponen HTML lainnya; dan juga atribut-atribut seperti alt, rel, href, dll. [Update] Google sekarang juga mengindeks javascript dan CSS untuk meningkatkan relevansi hasil pencarian dan penilaian kualitas (aksesibilitas) sebuah halaman website.3. Serving/Delivering (Menampilkan Hasil Pencarian)
Ketika seseorang googling dengan mengetikkan keyword tertentu di kotak pencarian (menuliskan kueri keyword), mesin pencari Google merespon dengan mencari konten di dalam indeks dan kemudian menampilkannya sebagai list hasil pencarian. Hasil pencarian tersebut dipercaya Google sebagai hasil yang paling relevan bagi user. Semakin besar nomor urutan listing (semakin ke bawah) semakin kecil nilai relevansinya. Tentu relevansi ini tidak hanya didasarkan pada keyword, tapi juga pada lebih dari 200-an faktor, salah satunya adalah PageRank.Ingat, pagerank di sini tidak diartikan sebagai nilai PageRank toolbar, predikat ranking yang diberikan oleh Google dengan parameter 0-10 (yang saat ini semakin tidak penting). PageRank adalah algoritma Google pertama, yang digunakan untuk menilai sebuah halaman website berdasarkan popularitas link. Selain algoritma itu, masih banyak lagi algoritma lain yang juga sangat menentukan. Setelah diproses oleh semua algoritma, sebuah halaman kemudian ditentukan ranking-nya (urutannya) di SERPs (halaman hasil pencarian). Inilah yang disebut sebagai SERP rank, yang selalu berubah setiap harinya, bahkan mungkin setiap jam. Inilah mengapa halaman berpagerank (toolbar) 6 belum tentu mendapatkan hasil listing pencarian yang lebih baik daripada halaman lain yang berpagerank (toolbar) 0. Selain pagerank, ada banyak faktor lain yang sangat berpengaruh, di antaranya struktur/navigasi web, isi web, kualitas konten, popularitas link/web, dll. [Update: Kini Pagerank Toolbar sudah tidak diupdate lagi].
COMMENTS