Veri Madenciliği 2018-2019 Final Ünite 7 Sınavı

Veri Madenciliği 2018-2019 Final Ünite 7 Sınavı sorularını bu sayfadan online olarak çözebilirsiniz.

Doğru Sayısı %%SCORE%%
Yanlış Sayısı %%WRONG_ANSWERS%%
CEVAPLARINIZ
Yanıtlarınız aşağıdaki gibidir.
Soru 1

Tam bağlantı kümeleme yönteminde uzaklıklar aşağıdaki hangi eşitlikle hesaplanmaktadır?

A
dmj=min (dkj, dlj)
B
dmj=maks (dkj, dlj)
C
dmj= (Nkdkj + Nldlj)/Nm
D
dmj= (dkj + dlj)/2
E
dmj= (Nkdkj + Nldlj)/Nm- NkNldk1/N2m
1 numaralı soru için açıklama 
Bu yöntem, en uzak komşuluk olarak da bilinmektedir. Tek bağlantı kümeleme yöntemine çok benzemekle birlikte bu yöntemdeki tek farklılık oluşturulan her kümedeki eleman çiftleri arasındaki uzaklığın maksimum olanının ele alınmasıdır. Bu yönteme tam bağlantı kümeleme yöntemi denmesinin nedeni, bir küme içindeki tüm birimlerin birbirlerine maksimum uzaklık veya minimum yakınlığa bağlı olmasıdır (Şekil 7.5). Tam bağlantı tekniğindeki uzaklıklar, dmj=maks (dkj, dlj) biçiminde hesaplanmaktadır.
Soru 2

> x=read.csv(“c:/ulkeler.txt”)
> dist.x=dist(x,method=”euclidean”)
> dist.x
> h=hclust(dist.x,method=”single”)
> h
> clusters=cutree(h, k=3)
> clusters
> plot(h,labels=x$Ulke)
> rect.hclust(h, K=3)

Yukarıda Öklid Uzaklık Matrisi ile Tek Bağlantı Kümeleme Analizi işlemi gerçekleştiren R komut kümesinde kümeleme dendrogramını görüntüleyen komut satırı hangisidir?

A
> plot(h,labels=x$Ulke)
B
> clusters
C
> h$merge
D
> dist.x
E
> h
2 numaralı soru için açıklama 
Sayfa 174-178 arasında yapılan analizler sonucunda elde edilen dendrogramın görüntülenmesi için ise plot(h,labels=x$Ulke) komutu kullanılır. Veri dosyasında bulunan ülke sütunundaki ülkelere ait isimlerin dendrogramda gösterimi için komutta bulunan labels=x$Ulke ifadesi kullanılmıştır.
Soru 3

Kümeleme analizi genellikle dört aşamada uygulanmaktadır. Seçeneklerden hangisi bu aşamalardan birisi değildir?

A
Veri matrisinin oluşturulması
B
Benzerlik matrisinin hesaplanması
C
Kümelemede esas alınacak yöntemlerin belirlenmesi
D
Strateji matrisinin oluşturulması
E
Elde edilen sonuçların yorumlanması
3 numaralı soru için açıklama 
Kümeleme analizi genellikle dört aşamada uygulanmaktadır. Bunlar; veri matrisinin oluşturulması, benzerlik veya uzaklık matrislerinin hesaplanması, kümelemede esas alınacak yöntemlerin belirlenmesi ve elde edilen sonuçların yorumlanmasıdır.
Soru 4

Başlangıçta veri setinde bulunan tüm birimlerin farklı birer küme oluşturduğunu kabul ederek analize başlamayı amaçlayan kümeleme analizi yaklaşımı hangisidir?

A
Ayırıcı aşamalı kümeleme analizi
B
Dendogram
C
Karar ağaçları
D
Birleştirici aşamalı kümeleme analizi
E
Aşamalı olmayan kümeleme analizi
4 numaralı soru için açıklama 
Birleştirici (agglomerative) aşamalı kümeleme yöntemleri, başlangıçta veri setinde bulunan tüm birimlerin farklı birer küme oluşturduğu kabul edilerek analize başlanır. Veri setinde bulunan n birimi aşamalı olarak sırasıyla; n küme, n-1 küme, n-2 küme,..., n-r küme,..., 3 küme, 2 küme, 1 kümeye yerleştirmeyi amaçlayan bir yaklaşımdır. Bu yöntemde, her birim başlangıçta tek başına farklı birer küme olarak kabul edilir. Daha sonra birbirleri ile yüksek derecede benzerlik gösteren iki birim, bir küme oluşturur. Bir sonraki adımda bu kümeye farklı benzerlik düzeylerinde diğer birimler eklenerek birimlerin tamamı bir kümede toplanacak biçimde birbirleri ile bağlanırlar(birleştirilirler, kümelenirler).
Soru 5

Başlangıçta veri setinde bulunan tüm birimlerin bir küme oluşturduğunu kabul ederek analize başlamayı amaçlayan kümeleme analizi yaklaşımı hangisidir?

A
Aşamalı olmayan kümeleme analizi
B
Birleştirici aşamalı kümeleme analizi
C
Ayırıcı aşamalı kümeleme analizi
D
Karar ağaçları
E
Dendogram
5 numaralı soru için açıklama 
Ayırıcı (divisive) aşamalı kümeleme yöntemlerinde, başlangıçta veri setinde bulunan tüm birimlerin bir küme olduğu varsayılarak analize başlanır. Diğer bir ifadeyle işlem, birleştirici aşamalı kümeleme yönteminde olan aşamaların tam tersine işler. İlk olarak tüm birimleri içeren büyük bir küme ele alınır. İzleyen aşamalarda en farklı (uzak) birimler birbirinden ayrılarak daha küçük kümeler oluşturulur. Bu aşamalar her birim kendi başına farklı bir küme oluşturuncaya kadar devam eder. Veri setinde bulunan n birimi sırasıyla aşamalı olarak 1 küme, 2 küme, 3 küme,... , n-r küme, n-3 küme, n-2 küme, n-1 küme, n kümeye ayırmayı amaçlayan bir yaklaşımdır.
Soru 6

Seçeneklerden hangisi birleştirici kümeleme analizi yöntemlerinden birisi değildir?

A
Tam Bağlantı Kümeleme Yöntemi
B
Ortalama Bağlantı Kümeleme Yöntemi
C
Küresel Ortalama Bağlantı Kümeleme Yöntemi
D
Medyan Bağlantı Kümeleme Yöntemi
E
Çok Bağlantı Kümeleme Yöntemi
6 numaralı soru için açıklama 
Birleştirici aşamalı kümeleme yöntemlerinde, birimlerin birbirleri ile birleştirilmesinde farklı yöntemler kullanılmaktadır. Bunlardan sıklıkla kullanılan ve genel kabul görmüş olanları aşağıdaki gibi sayılabilir.
• Tek Bağlantı Kümeleme Yöntemi (TekBKY, SINGLE Linkage [SLINK], En Yakın Komşuluk, Nearest Neighbour Method)
• Tam Bağlantı Kümeleme Yöntemi (TamBKY, COMPLETE linkage Method [CLINK], Furthest Neighbor Method)
• Ortalama Bağlantı Kümeleme Yöntemi (OrtBKY, AVERAGE Linkage Method, [ALINK])
• McQuitty Bağlantı Kümeleme Yöntemi (McQuitty linkage Method)
• Küresel Ortalama Bağlantı Kümeleme Yöntemi (KOBKY, CENTROID linkage Method)
• Medyan Bağlantı Kümeleme Yöntemi (MBKY, MEDIAN linkage Method)
• Ward Bağlantı Kümeleme Yöntemi (WBKY, WARD linkage Method, En Küçük Varyans Kümeleme Yöntemi)
Soru 7

Aşağıda verilenlerden hangisi verilerin standardize edilmesi ve belirli aralıklardaki değerlere dönüştürülmesi için kullanılan yöntemler arasında yer almaz?

A
z skorlarına dönüştürme
B
-1≤x≤1 aralığına dönüştürme
C
Ortalama değer -1 olacak şekilde dönüştürme
D
0≤x≤1 aralığına dönüştürme
E
Serideki maksimum değer 1 olacak şekilde dönüştürme
7 numaralı soru için açıklama 
Verilerin standardize edilmesi ve belirli aralıklardaki değerlere dönüştürülmesi için en çok kullanılan yöntemler; z skorlarına dönüştürme, -1≤x≤1 aralığına dönüştürme, 0≤x≤1 aralığına dönüştürme, serideki maksimum değer 1 olacak şekilde dönüştürme, ortalama değer 1 olacak şekilde dönüştürme, standart sapma 1 olacak şekilde dönüştürme yöntemleridir.
Soru 8

Aşağıdakilerden hangisi kümeleme analizi uygulamasının ilk basamağını oluşturur?

A
Benzerlik matrislerinin hesaplanması
B
Kümelemede esas alınacak yöntemlerin belirlenmesi
C
Elde edilen sonuçların yorumlanması
D
Veri matrisinin oluşturulması
E
Uzaklık matrislerinin hesaplanması
8 numaralı soru için açıklama 
Kümeleme analizi genellikle dört aşamada uygulanmaktadır. Bunlar; veri matrisinin oluşturulması, benzerlik veya uzaklık matrislerinin hesaplanması, kümelemede esas alınacak yöntemlerin belirlenmesi ve elde edilen sonuçların yorumlanmasıdır.
Soru 9

Uzaklık matrisini kullanarak birbirine en yakın (uzaklık değerleri en küçük) birim ya da değişkenleri birleştirerek kümelerin oluşmasını sağlayan kümeleme yöntemi hangisidir?

A
Tek Bağlantı Kümeleme Yöntemi
B
Ortalama Bağlantı Kümeleme Yöntemi
C
Tam Bağlantı Kümeleme Yöntemi
D
Ward Bağlantı Kümeleme Yöntemi
E
McQuitty Bağlantı Kümeleme Yöntemi
9 numaralı soru için açıklama 
Literatürde en yakın komşuluk olarak da bilinen tek bağlantı kümeleme yöntemi, uzaklık matrisini kullanarak birbirine en yakın (uzaklık değerleri en küçük) birim ya da değişkenleri birleştirerek kümelerin oluşmasını sağlamaktadır. Bu yöntemin ilk aşamasında uzaklık matrisindeki en yakın (en küçük uzaklık) iki birim dikkate alınarak ilk küme oluşturulur. İkinci aşamada ise bir sonraki en küçük uzaklık belirlenir ve ilk oluşturulan kümeye bu birim ya da değişken eklenir ya da bu birim ile iki birimden oluşan yeni bir küme oluşturulur. İşlem, tüm birimler bir kümeye yerleşinceye kadar devam eder.
Soru 10

İki obje arasındaki benzerliği ölçmede en yaygın kullanılan uzaklık ölçüsü olup iki obje arasına çizilecek bir doğrunun uzunluğunu temel alan ölçüye ne ad verilir?

A
Karesel Pearson uzaklığı
B
Manhattan (City-Blok) Uzaklığı
C
Korelasyon uzaklığı
D
Açısal uzaklık
E
Öklid uzaklığı
10 numaralı soru için açıklama 
Öklid uzaklığı iki obje arasındaki benzerliği ölçmede en yaygın kullanılan uzaklık ölçüsü olup iki obje arasına çizilecek bir doğrunun uzunluğunu temel alır.
Soru 11

Uzaklık matrisini kullanarak birbirine en yakın (uzaklık değerleri en küçük) birim ya da değişkenleri birleştirerek kümelerin oluşmasını sağlayan; m ve j kümeleri arasındaki uzaklığın dmj=min (dkj, dlj) eşitliği ile hesaplanan kümele yöntemi aşağıdakilerden hangisidir?

A
Tek Bağlantı Kümeleme Yöntemi
B
Tam Bağlantı Kümeleme Yöntemi
C
Ortalama Bağlantı Kümeleme Yöntemi
D
McQuitty Bağlantı Kümeleme Yöntemi
E
Küresel Ortalama Bağlantı Kümeleme Yöntemi
11 numaralı soru için açıklama 
Literatürde en yakın komşuluk olarak da bilinen tek bağlantı kümeleme yöntemi, uzaklık matrisini kullanarak birbirine en yakın (uzaklık değerleri en küçük) birim ya da değişkenleri birleştirerek kümelerin oluşmasını sağlamaktadır. Bu yöntemin ilk aşamasında uzaklık matrisindeki en yakın (en küçük uzaklık) iki birim dikkate alınarak ilk küme oluşturulur. İkinci aşamada ise bir sonraki en küçük uzaklık belirlenir ve ilk oluşturulan kümeye bu birim ya da değişken eklenir ya da bu birim ile iki birimden oluşan yeni bir küme oluşturulur. İşlem, tüm birimler bir kümeye yerleşinceye kadar devam eder. Birleştirme yapılırken kümelerin eleman sayısının birden fazla olması koşulu yoktur. Tek bir birim de bir küme oluşturabilir. Bu yöntemde, m ve j kümeleri arasındaki uzaklık; dmj=min (dkj, dlj) biçiminde hesaplanmaktadır.
Soru 12

Aşağıdakilerden hangisi Kümeleme Analizinin bir aşaması değildir?

A
Ayırma kriterlerinin belirlenmesi
B
Veri matrisinin oluşturulması
C
Benzerlik veya uzaklık matrislerinin hesaplanması
D
Kümelemede esas alınacak yöntemlerin belirlenmesi
E
Elde edilen sonuçların yorumlanması
12 numaralı soru için açıklama 
Kümeleme analizi genellikle dört aşamada uygulanmaktadır. Bunlar; veri matrisinin oluşturulması, benzerlik veya uzaklık matrislerinin hesaplanması, kümelemede esas alınacak yöntemlerin belirlenmesi ve elde edilen sonuçların yorumlanmasıdır.
Soru 13

Veri seti içerisinde yer alan kayıtların birbiriyle olan ilişkilerini inceleyerek, hangi olayların eş zamanlı olarak birlikte gerçekleşebileceklerini ortaya koymaya çalışan veri madenciliği yöntemleri seçeneklerden hangisidir?

A
Sınıflandırma
B
Karar ağaçları
C
Kümeleme analizi
D
Lojistik regresyon
E
Birliktelik kuralları
13 numaralı soru için açıklama 
Birliktelik Kuralları, veri seti içerisinde yer alan kayıtların birbiriyle olan ilişkilerini inceleyerek, hangi olayların eş zamanlı olarak birlikte gerçekleşebileceklerini ortaya koymaya çalışan yöntemler veri madenciliği yöntemleridir. Özellikle pazarlama alanında uygulanmaktadır (Pazar sepet analizleri). Bu yöntemler birlikte olma kurallarını belirli olasılıklarla ortaya koymaktadır.
Soru 14

Kümeleme analizinde sonuçların bağlantılar, uzaklıklar ve birimlerin bağlanma düzey lerinin bir ağaç biçiminde ele alınarak ayrıntılı bir biçimde özetlendiği; genellikle x ekseninde birimler ve y ekseninde de uzaklıklar olacak şekilde yapılandırıldığı; değişkenlerin ya da birimlerin hangi aşamada ve hangi uzaklık ya da benzerlik düzeyinde bir araya gelerek küme oluşturduklarının ayrıntılı biçimde görüldüğü grafiksel yöntem aşağıdakilerden hangisidir?

A
Dendrogram
B
Cluster
C
Manhattan (City-Block) uzaklığı
D
Farklılık matrisi
E
Plot
14 numaralı soru için açıklama 
Kümeleme analizinde sonuçlar dendrogram (ağaç diyagramı) adı verilen grafiksel yön temle sunulurlar. Dendrogramlarda bağlantılar, uzaklıklar ve birimlerin bağlanma düzey leri bir ağaç biçiminde ele alınarak şekillendirilir ve kümelenme süreci bu şekilde ayrıntılı bir biçimde özetlenir. Genellikle dendrogramlar; x ekseninde birimler ve y ekseninde de uzaklıklar olacak şekilde yapılandırılırlar. Dendrogramlarda değişkenlerin ya da birimlerin hangi aşamada ve hangi uzaklık ya da benzerlik düzeyinde bir araya gelerek küme oluşturdukları ayrıntılı biçimde görülmek tedir.
Soru 15

Aşağıdakilerden hangisi K-Ortalamalar Kümeleme Yönteminde küme sayısını belirlemek için kullanılan yaklaşımlardan biri değildir?

A
Kümenin en küçük ve en büyük değeri arasındaki farkı eşit aralığa bölmek
B
Aşamalı kümeleme yöntemlerinden elde edilen dendrogramları inceleyerek karar vermek,
C
Olasılıklı olarak başlangıç noktalarını rassal olarak belirlemek,
D
İlk nb birimin değişkenlere ait ortalamalarını başlangıç ortalama vektörü olarak ele alıp birimleri bu kümelere atama yaklaşımlarından birini seçmek,
E
Farklı rastgele başlatma konfigürasyonları seçerek küme sayısını bulmak,
15 numaralı soru için açıklama 
K-Ortalamalar Kümeleme Yöntemi sadece birimleri kümelemekte kullanılan bir yöntemdir. Birimlerin k-ortalamalar yöntemi ile kümelenmesi için uzaklık matrisi ya da benzerlik matrisi hesaplamak gerekmemektedir. Verilerin kümelenmesinde kullanılacak olan küme sayısını önceden belirlemek yeterlidir. Küme sayısını belirlemek için ise farklı yaklaşımlar bulunmaktadır. Bunlar; Aşamalı kümeleme yöntemlerinden elde edilen dendrogramları inceleyerek karar vermek, Olasılıklı olarak başlangıç noktalarını rassal olarak belirlemek, Ardışık olarak (Küme sayısı 2, 3, 4,..., k biçiminde) her seferinde küme sayısını bir artırarak oluşan kümelemede birimlerin hangi kümeye ait olduğuna ilişkin küme üyeliklerini belirlemek. Yeni veri yapısına Ayırma (Discriminant) Analizi uygulamak ve en yüksek önemliliği bulunan Wilk’s Lamda değerine sahip olan küme sayısını, uygun kümeleme olarak kabul etmek, İlk nb birimin değişkenlere ait ortalamalarını başlangıç ortalama vektörü olarak ele alıp birimleri bu kümelere atama yaklaşımlarından birini seçmek, Farklı rastgele başlatma konfigürasyonları seçerek küme sayısını bulmak,
Soru 16

Veri setinde bulunan gözlemlerin ya da değişkenlerin kendi aralarındaki benzerlikleri göz önünde bulundurularak gruplandırılması işlemi veri madenciliği yöntemlerinden hangisidir?

A
Birliktelik kuralları
B
Kümeleme
C
Sınıflandırma
D
Lojistik regresyon
E
Diskriminant analizi
16 numaralı soru için açıklama 
Kümeleme, veri setinde bulunan gözlemlerin ya da değişkenlerin kendi aralarındaki benzerlikleri göz önünde bulundurularak gruplandırılması işlemidir. Kümeleme yöntemlerinin çoğu veri arasındaki uzaklıkları kullanır. Uygulamada çok sayıda kümeleme yöntemi kullanılmaktadır. Bu yöntemler, değişkenler arasındaki benzerliklerden ya da farklılıklardan yararlanarak bir veri setini alt kümelere ayırmak için kullanılmaktadır. Kümeleme analizinin amacı, gruplanmamış verileri benzerliklerine göre sınıflandırmak ve araştırmacıya özetleyici bilgiler elde etmede yardımcı olmaktır.
Soru 17

Kümeleme analizi genellikle dört aşamada uygulanmaktadır. Seçeneklerden hangisi bu aşamalardan birisi değildir?

A
Veri matrisinin oluşturulması
B
Benzerlik matrisinin hesaplanması
C
Kümelemede esas alınacak yöntemlerin belirlenmesi
D
Strateji matrisinin oluşturulması
E
Elde edilen sonuçların yorumlanması
17 numaralı soru için açıklama 
Kümeleme analizi genellikle dört aşamada uygulanmaktadır. Bunlar; veri matrisinin oluşturulması, benzerlik veya uzaklık matrislerinin hesaplanması, kümelemede esas alınacak yöntemlerin belirlenmesi ve elde edilen sonuçların yorumlanmasıdır.
Soru 18

Başlangıçta veri setinde bulunan tüm birimlerin bir küme oluşturduğunu kabul ederek analize başlamayı amaçlayan kümeleme analizi yaklaşımı hangisidir?

A
Aşamalı olmayan kümeleme analizi
B
Birleştirici aşamalı kümeleme analizi
C
Ayırıcı aşamalı kümeleme analizi
D
Karar ağaçları
E
Dendogram
18 numaralı soru için açıklama 
Ayırıcı (divisive) aşamalı kümeleme yöntemlerinde, başlangıçta veri setinde bulunan tüm birimlerin bir küme olduğu varsayılarak analize başlanır. Diğer bir ifadeyle işlem, birleştirici aşamalı kümeleme yönteminde olan aşamaların tam tersine işler. İlk olarak tüm birimleri içeren büyük bir küme ele alınır. İzleyen aşamalarda en farklı (uzak) birimler birbirinden ayrılarak daha küçük kümeler oluşturulur. Bu aşamalar her birim kendi başına farklı bir küme oluşturuncaya kadar devam eder. Veri setinde bulunan n birimi sırasıyla aşamalı olarak 1 küme, 2 küme, 3 küme,... , n-r küme, n-3 küme, n-2 küme, n-1 küme, n kümeye ayırmayı amaçlayan bir yaklaşımdır.
Soru 19

Küresel ortalama ve medyan bağlantı kümeleme yöntemlerinin karma şekli olan ve küme içi varyansın minimum olduğu kümelerin belirlenip bu doğrultuda kümeleme işleminin yapıldığı birleştirici kümeleme yöntemi hangisidir?

A
Ortalama Bağlantı Kümeleme Yöntemi
B
McQuitty Bağlantı Kümeleme Yöntemi
C
Tam Bağlantı Kümeleme Yöntemi
D
Tek Bağlantı Kümeleme Yöntemi
E
Ward Bağlantı Kümeleme Yöntemi
19 numaralı soru için açıklama 
Ward Bağlantı Kümeleme Yöntemi, küresel ortalama ve medyan bağlantı kümeleme yöntemlerinin karma şeklidir. Küme içi varyansın minimum olduğu kümeler belirlenir ve bu doğrultuda kümeler oluşturulur. Minimum varyans yöntemi olarak da bilinen bu yaklaşım, bir kümede yer alan bir birimin, aynı kümenin içinde bulunan birimlerden ortalama uzaklığını dikkate almaktadır. Küme bağlantılarından ziyade küme içi kareler toplamı dikkate alınmaktadır. Bu yöntem, az birimli kümeleri birleştirme eğilimindedir. Ayrıca bu yöntemin birbirine eşit sayıda birim içeren kümeler oluşturma gibi bir eğilimi de vardır. Bundan dolayı, araştırmacının kümelerdeki birim sayılarının benzer (yakın) olduğu beklentisi durumunda bu yönteme başvurması önerilmektedir. Aşırı değerlerden etkilenmektedir. Sıklıkla kullanılan aşamalı kümeleme yöntemidir.
Soru 20

Aşağıda verilenlerden hangisi verilerin standardize edilmesi ve belirli aralıklardaki değerlere dönüştürülmesi için kullanılan yöntemler arasında yer almaz?

A
z skorlarına dönüştürme
B
-1≤x≤1 aralığına dönüştürme
C
Ortalama değer -1 olacak şekilde dönüştürme
D
0≤x≤1 aralığına dönüştürme
E
Serideki maksimum değer 1 olacak şekilde dönüştürme
20 numaralı soru için açıklama 
Verilerin standardize edilmesi ve belirli aralıklardaki değerlere dönüştürülmesi için en çok kullanılan yöntemler; z skorlarına dönüştürme, -1≤x≤1 aralığına dönüştürme, 0≤x≤1 aralığına dönüştürme, serideki maksimum değer 1 olacak şekilde dönüştürme, ortalama değer 1 olacak şekilde dönüştürme, standart sapma 1 olacak şekilde dönüştürme yöntemleridir.
SONUÇLAR
20 tamamladınız.
Liste
Geri dön
Tamamlananlar işaretlendi.
12345
678910
1112131415
1617181920
Son
Geri dön
1 Yıldız2 Yıldız3 Yıldız4 Yıldız5 Yıldız (Bu yazıya oy vermek ister misiniz?)
Loading...