Kullanici Benzerliklerini Hesaplamak
Selcuk.Bozdag Tarih: 24/12/2008 Yorum: 4 adet
Okunma : 2011 Tutanlar: Bu yazıyı 6 kişi tuttu.
Web2.0'in en buyuk oyuncusu suphesiz kullanicilardir. Katki olmadan kollektif bir anlayistan soz edemeyiz. Yani her kullanicinin katkida bulundugu veriler toplanarak bir baska alanda hizmet verebiliyor. Kullanicilarin karsilastirilmasi da boyle bir hizmetin sonucu mumkun olabiliyor.
Ornegin Amazon.com'da satin almak istediginiz urunun altinda "bu urunu alanlar, su urunleri de aldi" gibi onermeler yer almaktadir. Baska kullanicilarla zevkiniz ya da ilgi alanlariniz ne kadar uyumlu olabilir gibi bir otomasyonun yapilmasi son derece akillica. Kullanicilarin mahremiyetini zedelemeden bu tip uygulamalar yapmak mumkun.
Kullanicilari karsilastirmak icin onlarca yontem oldugu soyleniyor. Ayrica eminim ki Amazon ve benzeri alisveris siteleri daha karmasik istatistiklerden yararlaniyor ve daha gelismis algoritmalari dev veri merkezlerinde calistiriyorlar. Ama bugun size anlatacagim yontem cok basit ve temek geometrik bilgi gerektiren bir yontem.
Oklid Uzakligi Yontemiyle Kullanicilari Karsilastirmak
Ornegimizde "Kemal Sunal" filmleri satin alan kullanicilari inceleyecegiz.
Yukaridaki tablo 1 ile 5 arasinda kullanicilarin filmlere verdigi puanlari gosteriyor.
Oklid uzakligini olcerken ilk iki film icin kullanicilarin verdigi puanlara gore 2D bir uzay icerisinde kullanicilari gosterelim.
GNUPlot ile cizdigim grafik asagidadir.
P ve Q noktalari icin Oklid uzakligi teorisine gore geometride iki nokta arasidaki mesafenin formulu,
olarak biliyoruz. Buna gore Ali ve Ayse arasindaki mesafeyi bulalim.
Ancak bu uzunluk iki kullanici benzerligi arttikca kisalacak ve bize aslinda bir yuzde (%) olarak sonuc donecek bir formule ihtiyacimiz var.
Bu formul,
Bu formule gore, Ali ve Ayse arasindaki benzerlik yuzdesi, bu iki filme bakarak,
0. 453687684
olarak bulunur. Yani yaklasik 45%.
Burada orneklenen sadece iki film icindi; butun filmler icin birden fazla nokta arasindaki mesafeyi toplamamiz yeterli olacaktir. P ve Q kullanicilar olmak uzere,
Bu formullerden yola cikarak Ali ve Ayse arasindaki benzerligi hesaplarsak,
Sonuc
Yukaridaki formulleri programlamak son derece kolay. Web2.0 uygulamalarinizda kullanicilariniz karsilastirmak istediginizde bu gibi onlarca yontemden faydalanabilirsiniz. Her biri farkli sonuclar uretecektir. Vurgulamak gereken bir nokta da her yontemin guclu oldugu ve zayif oldugu veri kumelerinin oldugudur. Bu nedenle verinizi iyi tanimaniz ve ona gore de matematiksel bir model secmeniz gerekiyor.
Referanslar
1. Wikipedia, http://en.wikipedia.org/wiki/Euclidean_distance 2. Toby Segaran, Programming Collective Intelligence, O'Reilly, 2007
Ek Kullanilan Editor Araclari
- GnuPlot
- LaTeX
Öklid uzaklığından ve kareköklerden bugüne değin bir şey anlamadım fakat; ben olsam bu sistemi psikolojik/psikiyatrik çalışmalarında kullanırdım, tabii daha gelişmiş olmalı, biraz da esnek olmalı.
Sonuçta, makalede bahsedildiği gibi çok çok daha karmaşık ihtimaller okyanusunu (algoritma?) hesaplayabiliyorsak eğer, otomasyon olayı yani, kişiye dair bilgilerin ve davranışların yükleneceği bir karşılaştırmalı sistem ile tarihe dayalı devasa bir veri tabanı işimizi kolaylaştıracaktır ancak makina yine hataya açık durumda elbette çünkü asli unsur insan burada.
Gelmişken devam edeyim :) Kodlardan ben çok korkuyorum açıkçası çünkü kodlara ne söylerseniz yaparlar, sizin söyleyecekleriniz ve kurduğunuz sisteme göre sonsuz bir yaratma eylemi sağlıyor. Belki, yakın gelecekte Google'ı (ya da adı başka bir şey olan ŞEY'i) yönetecek olan güç dünyanın kontrolünü tamamen ele geçirdiğinde, bu ele geçirme işini (dijital devrim) kişilerden topladığı verileri kullanarak yapacak.
Eğer ki internet hayatımızdaki her şey olursa (ki böyle olmaya doğru gitmediğini kim iddia edebilir? there is no spoon!!) interneti kontrol eden/etmek isteyenler de bizim her şeyimiz olacaklar. Bunu hiç istemeyiz öyle değil mi? Yani insan soyu olarak özgürlüğümüzden bunca çabuk nasıl vazgeçeriz? Her şeyimiz nasıl internet olur? Bunu insan nasıl kabullenir? Soruların hep değişken tonlar taşıdığını söyleyebiliriz. Bu soruların cevabı konfor şeklinde. Sonuçta, (örneğin Google) size bedava hizmet sunduğundan bahsediyor ve insanlar da bundan bahsediyorlar. G-mail'den tutun da Google-Books'a varana değin her türlü servis neredeyse ücretsiz. Dev bir şirket değilseniz Google size ölene kadar yetecek konforu şimdiden sağlamış durumda ve yeni hizmetlerle(!) karşımıza çıkıyor.
Oysa, iş asla böyle değil. Size sağlanan bu konfor sizin bütün her şeyinizi alıp götürmeyi amaçlıyor. Google burada sadece bir örnek. Microsoft da IBM de hepsi de aynı sistemin bir parçası. Sanıyorum ki yakın gelecekte sadece Google ve Microsoft'un güçlerini koruyacak, ve bir süre sonra da Microsof, Google tarafından alınacak. Bu, en kötü ihtimal çünkü böylesi bir durumda tekeller 2'den 1'e inecek ve her şey daha kötü olacak. Belki daha konforlu olacaktır ama daha iyi olacağı garanti değil.
Modern sonrası iktidarın geleceği bu: Bir avuç kod bloğu yoluyla konfor sunmak ve her şeyi alıp götürmek. Sonuçta, internetteki her adımımız takip edilebilir durumda, gayet her şey açık yani. Bir insanın söz gelimi son 3 yılda internetle olan bütün ilişkilerinin dökümünü ortaya çıkarırsak bu dediğim belki daha iyi anlaşılacaktır.
Bu ne demektir? Bu yazıyı okuyan kişi empati kursun :) son 3 yıldan beri hangi sitelere girdi, konuları nelerdi, sitelerde hangi davranışları sergiledi? hangi müzikleri ve filmleri indirdi internetten, onları kaç defa dinledi, hangi yazıyı yazdı nerede ve kime? hangi mail'e nasıl cevap verdi vesaire. Bu tip bilgiler, dilenirse ele geçirilebilir bilgiler. Sonuçta, interneti elektriğe bağlamış olmak yeterli. İşte buna sanırım Matrix diyebiliriz. Prize taktığımız fiş varsa eğer konfor var çünkü pizza sipariş verebiliriz, telefon faturamızı yatırabiliriz oturduğumuz yerden. Sanıyorum ki Baudrillard üzerine bir daha düşünmeliyiz.
Bu arada belirtelim ki Matrix, çok büyük oranda Ghost in the Shell (Kôkaku Kidôtai) adlı anime'den yapımdan araklanarak meydana getirilmiştir. Bence görsel/işitsel tasarımın her türlüsüyle uğraşıyor olup bu animeyi izlememiş olmak bir kayıp. Şuradan bir küçük bölümü izlenebilir:
http://www.dailymotion.com/video/x3ffi4_ghost-in-the-shell-2-innocence-part
Çok teşekkürler Adnan..
GitS uzun zamandır unuttuğum bir şaheserdi. Anımsattın.
Ah o ne şarkıdır "Making of a Cyborg"..
Şöyledir:
Makalede güzel bir noktaya değindiğin için ayrıca teşekkür ederim.Şuan semantik web kullanımı gündemde ve web in geleceğini oluşturan önemli öğelerden biri.Bu anlatmış olduğun konu semantik webe giriyor sanırsam.Semantik web le ilgili ayrıntılı bir şekilde faydalanacağımız web sitesi veya döküman var mı?
Makale
Haber
Ders
İlişkili ders bulunamadı.
Etkinlikler
Toplantı
Özgür Yazılım ve Linux Günleri '10
Özgür Yazılım ve Linux Günleri '10
İstanbul Bilgi Üniversitesi Bilgisayar Bilimleri Bölümü ve Linux Kullanıcıları Derneği'nin 9 yıldır düzenlemekte oldukları etkinlikler bu yıl `Özgür Y...
Kategori:
Toplantı
Kimler Burada? 
Son 1 dakika içinde MMIstanbul' da 56 (50 kayıtlı, 6 ziyaretçi) kullanıcı varmış. Login durumda olanlar aşağıda:
MMIstanbul Blog'undan
Blog Bölümü Blogevi.com'a Taşınıyor
Selam arkadaşlar MMIstanbul'da , tasarımcı ve programcıların blog yazılarını "feedleyerek" MMIstanbul okurlarını MMIstanbul dışın ...
7.500'üncü üyemiz Cem Koç!
Neler Yapılabilir?
500 Hatası Hakkında!
Reklam, MMIstanbul ve Yeni Projeler (Durumumuz Bu Tarzında)











İşte bilim!
Bu bir bilim ve başka örnekleri de çoğaltılabilir. Lisede bunlar ne işimize yarayacak ki diyorduk. Halbu ki öğrendiklerimizi uygulayabileceğimiz alanlar pek çok...
Sadece matematik ve istatistik kullanmak yeterli mi? Bence işin içerisine psikoloji ve sosyoloji gibi bilimleri de sokmak lazım. Bu şekilde daha nesnel (objective) sonuçlar elde edebiliriz. Ama önce insanların kişisel bilgilerini paylaşmaktaki çekingenliği azaltmalı veya güvenliği arttırmalıyız.
Bilimi seviyorum...