Türkiye Online Medya Araştırması
Profili Göster

Kullanici Benzerliklerini Hesaplamak

Selcuk.Bozdag Tarih: 24/12/2008 Yorum: 4 adet

Okunma : 2011 Tutanlar: Bu yazıyı 6 kişi tuttu.

Web2.0'in en buyuk oyuncusu suphesiz kullanicilardir. Katki olmadan kollektif bir anlayistan soz edemeyiz. Yani her kullanicinin katkida bulundugu veriler toplanarak bir baska alanda hizmet verebiliyor. Kullanicilarin karsilastirilmasi da boyle bir hizmetin sonucu mumkun olabiliyor.

Ornegin Amazon.com'da satin almak istediginiz urunun altinda "bu urunu alanlar, su urunleri de aldi" gibi onermeler yer almaktadir. Baska kullanicilarla zevkiniz ya da ilgi alanlariniz ne kadar uyumlu olabilir gibi bir otomasyonun yapilmasi son derece akillica. Kullanicilarin mahremiyetini zedelemeden bu tip uygulamalar yapmak mumkun.

Kullanicilari karsilastirmak icin onlarca yontem oldugu soyleniyor. Ayrica eminim ki Amazon ve benzeri alisveris siteleri daha karmasik istatistiklerden yararlaniyor ve daha gelismis algoritmalari dev veri merkezlerinde calistiriyorlar. Ama bugun size anlatacagim yontem cok basit ve temek geometrik bilgi gerektiren bir yontem.

Oklid Uzakligi Yontemiyle Kullanicilari Karsilastirmak

Ornegimizde "Kemal Sunal" filmleri satin alan kullanicilari inceleyecegiz.

MMİstanbul

Yukaridaki tablo 1 ile 5 arasinda kullanicilarin filmlere verdigi puanlari gosteriyor.

Oklid uzakligini olcerken ilk iki film icin kullanicilarin verdigi puanlara gore 2D bir uzay icerisinde kullanicilari gosterelim.

GNUPlot ile cizdigim grafik asagidadir.

MMİstanbul

P ve Q noktalari icin Oklid uzakligi teorisine gore geometride iki nokta arasidaki mesafenin formulu,

MMİstanbul, MMİstanbul MMİstanbul

olarak biliyoruz. Buna gore Ali ve Ayse arasindaki mesafeyi bulalim.

MMİstanbul

Ancak bu uzunluk iki kullanici benzerligi arttikca kisalacak ve bize aslinda bir yuzde (%) olarak sonuc donecek bir formule ihtiyacimiz var.

Bu formul,

MMİstanbul

Bu formule gore, Ali ve Ayse arasindaki benzerlik yuzdesi, bu iki filme bakarak,

0. 453687684

olarak bulunur. Yani yaklasik 45%.

Burada orneklenen sadece iki film icindi; butun filmler icin birden fazla nokta arasindaki mesafeyi toplamamiz yeterli olacaktir. P ve Q kullanicilar olmak uzere,

MMİstanbul, MMİstanbul MMİstanbul

Bu formullerden yola cikarak Ali ve Ayse arasindaki benzerligi hesaplarsak,

MMİstanbul

Sonuc

Yukaridaki formulleri programlamak son derece kolay. Web2.0 uygulamalarinizda kullanicilariniz karsilastirmak istediginizde bu gibi onlarca yontemden faydalanabilirsiniz. Her biri farkli sonuclar uretecektir. Vurgulamak gereken bir nokta da her yontemin guclu oldugu ve zayif oldugu veri kumelerinin oldugudur. Bu nedenle verinizi iyi tanimaniz ve ona gore de matematiksel bir model secmeniz gerekiyor.

Referanslar

1. Wikipedia, http://en.wikipedia.org/wiki/Euclidean_distance 2. Toby Segaran, Programming Collective Intelligence, O'Reilly, 2007

Ek Kullanilan Editor Araclari

  • GnuPlot
  • LaTeX

aç-kapa İçeriğin rss beslemesi kullanımda değil Yorumlar

Profili Göster
Salih Dincer 28/12/2008

İşte bilim!

Bu bir bilim ve başka örnekleri de çoğaltılabilir. Lisede bunlar ne işimize yarayacak ki diyorduk. Halbu ki öğrendiklerimizi uygulayabileceğimiz alanlar pek çok...

Sadece matematik ve istatistik kullanmak yeterli mi? Bence işin içerisine psikoloji ve sosyoloji gibi bilimleri de sokmak lazım. Bu şekilde daha nesnel (objective) sonuçlar elde edebiliriz. Ama önce insanların kişisel bilgilerini paylaşmaktaki çekingenliği azaltmalı veya güvenliği arttırmalıyız.

Bilimi seviyorum...

Profili Göster
Adnan ER 31/12/2008

Öklid uzaklığından ve kareköklerden bugüne değin bir şey anlamadım fakat; ben olsam bu sistemi psikolojik/psikiyatrik çalışmalarında kullanırdım, tabii daha gelişmiş olmalı, biraz da esnek olmalı.

Sonuçta, makalede bahsedildiği gibi çok çok daha karmaşık ihtimaller okyanusunu (algoritma?) hesaplayabiliyorsak eğer, otomasyon olayı yani, kişiye dair bilgilerin ve davranışların yükleneceği bir karşılaştırmalı sistem ile tarihe dayalı devasa bir veri tabanı işimizi kolaylaştıracaktır ancak makina yine hataya açık durumda elbette çünkü asli unsur insan burada.

Gelmişken devam edeyim :) Kodlardan ben çok korkuyorum açıkçası çünkü kodlara ne söylerseniz yaparlar, sizin söyleyecekleriniz ve kurduğunuz sisteme göre sonsuz bir yaratma eylemi sağlıyor. Belki, yakın gelecekte Google'ı (ya da adı başka bir şey olan ŞEY'i) yönetecek olan güç dünyanın kontrolünü tamamen ele geçirdiğinde, bu ele geçirme işini (dijital devrim) kişilerden topladığı verileri kullanarak yapacak.

Eğer ki internet hayatımızdaki her şey olursa (ki böyle olmaya doğru gitmediğini kim iddia edebilir? there is no spoon!!) interneti kontrol eden/etmek isteyenler de bizim her şeyimiz olacaklar. Bunu hiç istemeyiz öyle değil mi? Yani insan soyu olarak özgürlüğümüzden bunca çabuk nasıl vazgeçeriz? Her şeyimiz nasıl internet olur? Bunu insan nasıl kabullenir? Soruların hep değişken tonlar taşıdığını söyleyebiliriz. Bu soruların cevabı konfor şeklinde. Sonuçta, (örneğin Google) size bedava hizmet sunduğundan bahsediyor ve insanlar da bundan bahsediyorlar. G-mail'den tutun da Google-Books'a varana değin her türlü servis neredeyse ücretsiz. Dev bir şirket değilseniz Google size ölene kadar yetecek konforu şimdiden sağlamış durumda ve yeni hizmetlerle(!) karşımıza çıkıyor.

Oysa, iş asla böyle değil. Size sağlanan bu konfor sizin bütün her şeyinizi alıp götürmeyi amaçlıyor. Google burada sadece bir örnek. Microsoft da IBM de hepsi de aynı sistemin bir parçası. Sanıyorum ki yakın gelecekte sadece Google ve Microsoft'un güçlerini koruyacak, ve bir süre sonra da Microsof, Google tarafından alınacak. Bu, en kötü ihtimal çünkü böylesi bir durumda tekeller 2'den 1'e inecek ve her şey daha kötü olacak. Belki daha konforlu olacaktır ama daha iyi olacağı garanti değil.

Modern sonrası iktidarın geleceği bu: Bir avuç kod bloğu yoluyla konfor sunmak ve her şeyi alıp götürmek. Sonuçta, internetteki her adımımız takip edilebilir durumda, gayet her şey açık yani. Bir insanın söz gelimi son 3 yılda internetle olan bütün ilişkilerinin dökümünü ortaya çıkarırsak bu dediğim belki daha iyi anlaşılacaktır.

Bu ne demektir? Bu yazıyı okuyan kişi empati kursun :) son 3 yıldan beri hangi sitelere girdi, konuları nelerdi, sitelerde hangi davranışları sergiledi? hangi müzikleri ve filmleri indirdi internetten, onları kaç defa dinledi, hangi yazıyı yazdı nerede ve kime? hangi mail'e nasıl cevap verdi vesaire. Bu tip bilgiler, dilenirse ele geçirilebilir bilgiler. Sonuçta, interneti elektriğe bağlamış olmak yeterli. İşte buna sanırım Matrix diyebiliriz. Prize taktığımız fiş varsa eğer konfor var çünkü pizza sipariş verebiliriz, telefon faturamızı yatırabiliriz oturduğumuz yerden. Sanıyorum ki Baudrillard üzerine bir daha düşünmeliyiz.

Bu arada belirtelim ki Matrix, çok büyük oranda Ghost in the Shell (Kôkaku Kidôtai) adlı anime'den yapımdan araklanarak meydana getirilmiştir. Bence görsel/işitsel tasarımın her türlüsüyle uğraşıyor olup bu animeyi izlememiş olmak bir kayıp. Şuradan bir küçük bölümü izlenebilir:

http://www.dailymotion.com/video/x3ffi4_ghost-in-the-shell-2-innocence-part

Profili Göster
Safa kızılkaya 31/12/2008

Çok teşekkürler Adnan..

GitS uzun zamandır unuttuğum bir şaheserdi. Anımsattın.

Ah o ne şarkıdır "Making of a Cyborg"..

Şöyledir:

Profili Göster
seçkin YILMAZ 2/01/2010

Makalede güzel bir noktaya değindiğin için ayrıca teşekkür ederim.Şuan semantik web kullanımı gündemde ve web in geleceğini oluşturan önemli öğelerden biri.Bu anlatmış olduğun konu semantik webe giriyor sanırsam.Semantik web le ilgili ayrıntılı bir şekilde faydalanacağımız web sitesi veya döküman var mı?

yeni üyelik | şifremi unuttum

aç-kapa Toplantı Özgür Yazılım ve Linux Günleri '10

Özgür Yazılım ve Linux Günleri '10

İstanbul Bilgi Üniversitesi Bilgisayar Bilimleri Bölümü ve Linux Kullanıcıları Derneği'nin 9 yıldır düzenlemekte oldukları etkinlikler bu yıl `Özgür Y...
Kategori: Toplantı

aç-kapa Yarışma 3. Uluslararası Ekslibris Yarışması: İstanbul 2010

3. Uluslararası Ekslibris Yarışması: İstanbul 2010

İstanbul Ekslibris Dernegi, Feyziye Mektepleri Vakfı ve Işık Üniversitesi, kitaplar için mülkiyet işareti olarak kabul edilen ve üzerinde estetik dege...
Kategori: Yarışma

aç-kapa Konferans Yeni Medya ve Etkileşim Konferansı 2010 - Marmara Üniversitesi

Yeni Medya ve Etkileşim Konferansı 2010 - Marmara Üniversitesi

Generally speaking, the term "New" brought about debates. We try to open up and elucidate the term "New" along with "Interact...
Kategori: Konferans

aç-kapa Konferans 3. Uluslararası Gelecek İçin Öğrenme Alanında Yenilikler Konferansı 2010: e-Öğrenme

3. Uluslararası Gelecek İçin Öğrenme Alanında Yenilikler Konferansı 2010: e-Öğrenme

Konferans ile ilgili ayrıntılı bilgiye aşağıdaki bağlantıdan ulaşabilirsiniz: http://www.futurelearning.org.tr/katilim_cagrisitr.pdf ...
Kategori: Konferans

üyeler Son Kahramanlar...

stats Kimler Burada? web stats

Son 1 dakika içinde MMIstanbul' da 56 (50 kayıtlı, 6 ziyaretçi) kullanıcı varmış. Login durumda olanlar aşağıda:

...

Blog Bölümü Blogevi.com'a Taşınıyor

Selam arkadaşlar MMIstanbul'da , tasarımcı ve programcıların blog yazılarını "feedleyerek" MMIstanbul okurlarını MMIstanbul dışın ...

7.500'üncü üyemiz Cem Koç!

Neler Yapılabilir?

500 Hatası Hakkında!

Reklam, MMIstanbul ve Yeni Projeler (Durumumuz Bu Tarzında)

coldfusion mysql ubuntu
 
sponsor adobe istanbul