TechCrunch'daki yazıya baktım şimdi, Cuil'un yanı sıra Google ve Powerset'in çalışma yaklaşımlarının karşılaştırıldığı paragrafta Cuil için "
This is a semantic approach to search" ifadesini okuyunca, yukarıdaki yorumumda yanılmadığımı gördüm...
Altını çizmek istediğim iki tane nokta var:
1) Google semantik yaklaşımı yanlızca AdSense sisteminde kullanıyor, normal arama sonuçlarını listelerken kullanmıyor, ki bu da onların ticari bir tercihi sonuçta...
Yanılmıyorsam, hem aradığınız sözcüğün endekslenmiş sayfalar arşivi içerisindeki tekrarlanma miktarı hem de PageRank sistemini oluşturan "hedef sayfaya yönelik linklerin popülerlik hiyerarşisi", Google'ın sıralama yaparken kullandığı en temel kriterler... Eğer kullanıcıların
internet okuryazarlığı seviyesinin ortalama değerine seslenmek ve böylece de dünyada en çok kullanılan arama motoru olmak için yola çıkmışsanız, tabii ki Google'ın sistemi en doğru yol.
Zaten Cuil'un önümüzdeki yıllarda fark yaratması da, internet bilgi birikimi açısından ortalamanın biraz üzerinde olan "
nitelikli kullanıcı / nitelikli arama" hedef kitlesine seslenerek mümkün olabilir galiba...
Aslında TechCrunch'daki örnek gayet güzel: "
Fransa –peynir – şarap" sözcükleri arasında bir ilişki olabileceğini "öğrenmeye hazır" bir arama motoru algoritmasından bahsediyorum... Örneğin, sadece "
Paris – restaurant" sözcüklerini aratınca, deminki üç sözcük arasında önceden tanımlanmış ilişkiye göre endekslenmiş olan sayfaya da kolayca ulaşabilmeyi isteyen "nitelikli kullanıcı"dan bahsediyorum... :)
2) İkinci nokta, gündelik hayatımıza daha yakın: Yayınladığımız yazı ya da resimlere eklediğimiz etiket tag'leri olsun ya da del.icio.us tag'leri olsun, aslında hepsi
semantik metadata tanımlamanın basit bir uygulaması... Böylece, örneğin bizim blogumuzla ilk kez karşılaşan bir kullanıcının, ilginç bulduğu bir tag'e tıklayarak bizim o konudaki bütün yazı arşivimize ulaşmasını sağlayan basit bir "semantik arayüz" tanımlamış oluyoruz...