Bilgi Keşfi
/ Knowledge Discovery >> Bilgi Keşfi >> teknoloji >> bilgisayar >> bilgisayar güvenliği >>

Nasıl olabilir Internet üzerinde bir algoritma nokta troller?

ullanabilirsiniz görmek için bir çalışma yürüttük antisosyal kullanıcıları. Onlar siteler için Disqus tarafından barındırılan kullanıcı yorumlarına erişim kazanmış Breitbart.com, CNN.com ve IGN.com Ağustos 2013 ile Mart 2012 tarihinden itibaren 18 ay kapsayan veri civarında 1750000 kullanıcılar (yasaklı bunların yaklaşık 49.000) oluşuyordu, 1.260.000 iplik ve 39 milyon ileti (neredeyse bunlardan 838.000 silinmiş ve bunların 1350000 bildirdi). Onlar, Mart 2012 tarihinden sonra siteleri katıldı yaklaşık 12.000 kullanıcıya aşağı yasaklı kullanıcı verilerini daralmış en az beş Mesajları vardı ve URL'leri [kaynak: Cheng] spam dışındaki bir şey için kalıcı yasaklandı.

bilim verilerini ele sonrası içeriği, kullanıcı etkinliği, toplumsal tepki ve moderatör eylemleri de dahil olmak üzere. Onlar sürekli yasaklanmış kullanıcıların iletilerine yasak hiçbir zaman kullanıcıların mesajları karşılaştırıldığında, ve bunların zamanla yasaklı kullanıcıların davranış değişiklikleri baktı. Takım gelecek yasaklı troller mesajlar aşağıdaki özelliklere sahip eğiliminde bulundu:

  • kötü yazım ve dilbilgisi
  • Daha fazla küfür
  • daha olumsuz sözler
    Farklı jargon ve fonksiyon kelime
  • kullanın
    yasaklayan zaman doğru kötüleşti (Otomatik Okunabilirlik İndeksi dahil) çeşitli okunabilirlik deneylerine dayanmaktadır
  • az uzlaşmacı veya geçici bir dil
  • alt anlaşılabilirlik okumaları olmayan yasaklı topluluk üyelerinin
  • konu daha anlatılanlar
  • ortalama kullanıcı
  • bireysel konuda kendi yanıtlarını konsantre eğilimi daha açıklama mesajların çok daha yüksek bir sayı

  • görevlerinden sonuçlanan zamanla kötü davranış giderek yasaklayan önce silinmesini diğerlerinden daha fazla cevap kışkırtmak için bir eğilim

    CNN.com günü, ortalama bir kullanıcı eğiliminde gelecek yasaklı kullanıcılar [: Cheng, Collins kaynakları] yasaklı önce 264 kez etrafında yayınlanan oysa, 18 aylık döneminde yaklaşık 22 Mesajları göndermek için. Toplum da zamanla trol tahammül için daha az olasıdır oldu.

    ölçülebilir sonuçları kullanarak, araştırmacılar olarak kullanılan bir algoritma (bir görev, bir sorunu çözmek ya da gerçekleştirmek için kullanılan bir dizi adım) geliştirmek için başardık Beş yorum olarak birkaç yüzde 80 doğruluk ile gelecekte men edilecek kimin belirlemek için. 10 mesajlar sonuçlar yüzde 82 doğru olduğunu, ancak performans yaklaşık 10 Mesajları yükseldi. Daha önce kullanıcının mesajların

    Page [1] [2] [3] [4]