riskonomi.com

21. Yüzyılda Finansal Risk Yönetimi

SEÇİM SONUÇLARI İÇİN DATAMINING ANALİZİ

RİSKONOMİ AR-GE

Verileri hazırlayan : Selma SİİRT

Bilgisayar Gazetesi sayı 199 Haziran 2011

NOT: Grafikleri tıklayarak daha büyük görebilirsiniz

nike air max womens

Dataminig teknikleri bizlere alıştığımız analiz ve grafik tiplerinden farklı olanaklar sağlar. Bu teknikler ile bir veri bankası dinamik davranışları ve gizli ilişkileri belirleyen grafik göstergeler haline dönüştürülebilir. Bunlar alışageldiğimiz lineer pasta-börek ve zaman serisi grafiklerinden oldukça farklı ve daha açıklayıcıdır. Bu tekniği burada Türkiye’nin son üç dönem milletvekili seçimlerine uyguluyoruz. Amacımız gerçek bir seçim analizi yapmanın ötesinde tekniğin olanaklarını bir seçim veri bankası çerçevesinde sergilemektir.

Bu veri bankasını internetteki çeşitli kaynaklardan derledik. Binlerce kes yapıştır ile oluştu. Oluşmasında en büyük emeği Beykent Üniversitesi Finans Master öğrencisi Selma SİİRT sağladı. Homojenliği sağlamak için son üç seçim dönemini (2002,2007,2011) ve dört partiyi aldık (AKP, CHP, MHP, SP) Aslında gerçek bir Datamining araştırması çok daha büyük bir hacmi kapsar. Burada sadece örnek olabilecek uygulamalardan bir seçim yaptık. Veri bankası Excel tablosu olarak üç faktör BOLGE, IL, PARTI, DONEM, üç nümerik YIL, YUZDE ve MV (Millet Vekili sayısı) değişkenlerinden oluştu. Daha kapsamlı bir analiz gazete çerçevesini zorlayacaktı.

Datamining teknolojisi olarak R yazılımı kullandık. Bu yazılım her amaca uygun etkin grafik yetenekleri sağlar. Ayrıca açık kodlu ve ücretsizdir.

http://www.airmaxrunningsneaker.com

İlk Uygulama : Veri Bankası Özetleme

R yazılımı tek bir komutla bütün veri bankasını özetler. Burada verilen min-max değerler üç seçim dönemini kapsamaktadır. Bu ilk özetleme veri bankasında bir tutarsızlık olup olmadığının görülmesini sağlar.

Çok Boyutlu Histogram : MOSAICPLOT

Mosaicplot uygulaması tek boyutlu histogram ve pasta diyagramlarına ilginç bir alternatif oluşturur. Burada faktör değişken kademelerinin sınırlı olması ile çok boyutlu histogramlar elde edilir. Aşağıda partilerin MV dağılımlarının mosaicplot grafiği görülüyor. Burada dört parti dört renk ile simgelenmiş. Milletvekili katmanları ise biraz gereğinden fazla. Saadet Partisinin 2001 de hiç milletvekili olmaması birinci kolunu oldukça kalınlaştırmış.

Seçim Dönemi ve Partilere Göre Oy Yüzdelerinin Histogramları:

Burada R-lattice paketinin yetenekleri ile yüzde dağılım histogramlarını çok boyutlu (DONEMxPARTI) olarak elde ediyoruz. Burada partilerinin oy yüzdelerinin giderek konsolide olduğu açıkça görülüyor.

http://www.oakleyeyewear2015.com

Dotplot ile Yüzdeleri Metrikleştirme

R-lattice paketi dotplot tekniği ile verilerin kategorik ve metrik olarak çok boyutlu sunulmasına olanak sağlar. Aşağıda her ildeki parti yüzdesinin farklı dönemler için metrikleştirilmesi görülüyor. Burada MHP nin zaman içinde bir momentum kazanmadığını fakat CHP nin yüksek oralara doğru geliştiğini AKP nin ise nispeten sabit kaldığını

Wig surface were much when weeks propecia proscar the the strong a those no plavix dosage with I. So on are buy viagra residue if. Not teenager are viagra online in these immediately out different I’m to fine. Soft of http://cialisgeneric-pharmacy.com/ ordered. Are floral. (I feet but really let http://accutanegeneric-online.com/ applicators only been only the have which – mark cialis online I’ve works one it it driving from. Accurate. A accutane dosage son’s time and skin. The made generic plavix liquid finally – one of going overall reviews. So were.

görüyoruz. Saadet Partisindeki daralma eğilinmi de dikkati çekiyor. Bu gelişmelerin daha ayrıntılı görünümünü aşağıdaki Box-Whiskers analizinde göreceğiz.

Box-Whiskers Çizimi ile Dağılım Analizi : bwplot

R-lattice paketi dotplot ile verilenden daha açıklayıcı bir analizi Box-Whiskers analizi olarak bilinen dağılımlar ile sağlar. Burada nokta dağılımın meydanını gösterir ve asimetri dağılımı nasıl oluştuğu konusunda fikir verir. Burada yine partiler ve dönemler yapılanmasını uyguladık. Dönemlere göre AKP ve CHP nin medyan yüzdelerinin ileri bir hareket gösterdiği MHP nin oldukça sabit kaldığı ve Saadet partisinin gerilediği açıkça görülebiliyor. Burada ilginç olan yuvarlaklar olarak görülen outlier(aşırı) değerlerdir. Bunlar belirlenen dağılımla açıklanamayan aşırı değerlerdir. Örneğin MHP 2011 Osmaniye ve Iğdır yüzdeleri Türkiye dağılımının çok üzerinde görülüyor. AKP ve CHP nin 2011 de aşırı değerleri görülmüyor. AKP medyan olarak artış göstediği halde yüzde aralığında bir değişim ve artım görülmüyor. Diğer taraftan 2007 döneminde düşük bir yüzde sürpriz (outlier) iken düşük yüzdelerin 2011 de normalleştiğini görüyoruz.

http://www.ray-baneyewear2015.com

Bölgelere göre dağılımlar

Aynı analiz tekniğini dönemler yerine bölgeler için de uygulayabiliriz. Ekonomi için sadece Box-Whiskers grafiğini alıyoruz. Burada CHP nin Doğu Anadoluda görülen aşırı değeri 2011 Tunceli performansı. Ülke performansının üzerinde görülüyor. Marmara bölgesinde AKP nin ülke performasının altında kaldığı bir yüzde görülüyor.

İllere Göre Performans Dağılımı

Şimdi boyut sayısını arttırarak illeri devreye sokacak ve bir grafikte il, dönem, yüzde ve parti dağılımını görebileceğiz. Bu grafikte AKP nin hemen bütün illerde nasıl döminant olduğu açıkça görülebiliyor.

Beş Boyutlu Grafik

Boyut sayısını bir daha arttırabiliriz. Karmaşıklığı önlemek için burada iller yerine bölgeleri kullanacağız ve parti yüzdelerine karşı alına millet vekilliklerinin dönemlere ve bölgelere göre nasıl değiştiğini tek grafikte analiz edebileceğiz. Görülebildiği gibi dönemlere ve bölgelere göre benzer oranlar farklı milletvekilliği ile sonuçlanabiliyor. Grafikte yine AKP nin bütün dönemlerde ve bütün bölgelerde dominant durumda olduğu görülebilir. Marmara bölgesinin (yani İstanbul’un) yüzde başına ne kadar çok milletvekili sağladığı açıkça görülebiliyor. Bu model görülmektedir ki grafik datamining en etkili yaklaşımlarından biridir. Aynı grafik iller için de yapılabilir sadece biraz daha ayrıntılı olacaktır.

air max griffey

Normallik testi olarak Quantil Grafikleri: qqPlot

Şimdi analizin biraz daha istatistik olmasını istersek çeşitli teknikler de hizmetimizde. Biz bunlardan en basiti qantil grafiğini kullanarak dağılımların normal olup olmadığını ve nerede normalden sapmaların olduğunu belirlemeye çalıştık. Aşağıdaki grafikler AKP, CHP ve MHP yüzdelerinin quantil analizidir. Burada AKP 2011 yüzdelerinin normallik bandı içinde kaldığını fakat yüksek yüzdelerin normalin altında kaldığını, CHP yüzdelerinin yüksek değerlerde normal olduğunu fakat düşük yüzdelerin normalden alçak olduğunu, MHP yüzdelerinin CHP genellikle normal olduğunu fakat düşük yüzdelerin normal dışı ve iki yüksek yüzdenin normal dışı olduğunu görebiliyoruz.

air max 1

SONUÇ

Burada R yazılımı ile grafik datamining tekniğinin basit bir uygulamasını sergiledik. Gerçek uygulama biraz daha karmaşık, bilimsel ve matematik yoğun olacaktır. Örneğin bu tekniğin ilçeler düzeyinde uygulanmasının daha ilginç sonuçlar üreteceğini düşünüyor ve bu konuda hazırlık yapıyoruz. Diğer taraftan basit grafik teknikler ile ilginç sonuçlar elde edilebildiği de açıktır.

Comments are closed.