Veri Madenciliği 2018-2019 Final Ünite 6 Sınavı

Veri Madenciliği 2018-2019 Final Ünite 6 Sınavı sorularını bu sayfadan online olarak çözebilirsiniz.

Doğru Sayısı %%SCORE%%
Yanlış Sayısı %%WRONG_ANSWERS%%
CEVAPLARINIZ
Yanıtlarınız aşağıdaki gibidir.
Soru 1

Karar vericinin içinde bulunduğu karar verme probleminde ortaya çıkabilecek tüm durumları ve karar vericinin karşılaşa ‐ bileceği tüm senaryoları bir arada gösterebilen bir grafiksel yaklaşıma ne ad verilir?

A
Karar ağaçları
B
Sınıflandırıcı
C
Ayırıcı
D
Sınıflayıcı
E
Karar verme
1 numaralı soru için açıklama 
Karar ağaçları, karar vericinin içinde bulunduğu karar verme probleminde ortaya çıkabilecek tüm durumları ve karar vericinin karşılaşa bileceği tüm senaryoları bir arada gösterebilen bir grafiksel yaklaşımdır.
Soru 2

Karar ağacının oluşturulmasında kök ve iç düğümlerde ayırma işlemini en iyi şekilde gerçekleştirecek olan niteliğin belirlenmesi işlemine ne ad verilir?

A
Ayırma kriterinin belirlenmesi
B
Durma kriterinin belirlenmesi
C
Yaprak düğümüne ait sınıfın belirlenmesi
D
Sınıflandırma işleminin yapılması
E
Olası karar ağaçlarının oluşturulması
2 numaralı soru için açıklama 
Karar ağaçlarını, sınıflandırma probleminin çözümlenmesinde kullanırken iki adıma ihtiyaç duyulur. Bu adımlar, 1. Karar ağacının oluşturulması 2. Veritabanında yer alan her bir kaydın (ti) sınıflandırmasının yapılması şeklindedir. Karar ağacının oluşturulması sürecinde karşılaşılabi lecek en önemli sorun, kök ve iç düğümlerde hangi niteliklerin yer alacağının tespit edil mesidir. Çünkü, sınırlı sayıda kayıttan oluşan bir veri yığını için olası tüm karar ağaçlarını oluşturmak ve bunların arasından en uygunu seçmek oldukça zor olacaktır. Bu nitelik, ayırma işlemini gerçekleştiren en iyi nitelik olacaktır ve ayırma kriteri olarak adlandırılır. Ayırma kriteri olarak öyle bir nitelik seçilmelidir ki diğer nitelikler ile karşılaştırıldığında en iyi ayırıcı nitelik olmalıdır. Karar ağacı oluşturulduktan sonra, her bir kayıt bu karar ağacının kök düğümden başlayarak, geçtiği her düğümdeki sorunun yönlendirmesine göre bir yaprak düğüme ulaşır ve böylece sınıflandırma işlemi tamamlanmış olur.
Soru 3

bir veri yığınındaki düzensizliğin, rassallığın miktarını ölçmek için kullanılan ve en iyi ayırıcı niteliğin seçilmesi için kullanılan ölçü aşağıdakilerden hangisidir?

A
Sınıflandırma hatası indeksi
B
Gini İndeksi
C
Entropi İndeksi
D
Twoing indeksi
E
En Küçük Kareler Sapması yöntemi
3 numaralı soru için açıklama 
Entropi, bir veri yığınındaki düzensizliğin, rassallığın miktarını ölçmek için kullanılan bir ölçüdür. Entropisi 0 olan bir grubun tam homojen bir grup, entropisi 1 olan grubun ise tam heterojen olduğu söylenebilir.
Soru 4

Karar ağaçlarında her biri bir sınıfı temsil eden ve karar ağacının son bölümü olan düğüm aşağıdakilerden hangisidir?

A
Yaprak düğüm
B
Kök düğüm
C
Son düğüm
D
İç düğüm
E
T düğümü
4 numaralı soru için açıklama 
Karar ağaçlarında her biri bir sınıfı temsil eden ve karar ağacının son bölümü olan düğüm yaprak düğümdür.
Soru 5

Karar vericinin içinde bulunduğu karar verme probleminde ortaya çıkabilecek tüm durumları ve karar vericinin karşılaşabileceği tüm senaryoları bir arada gösterebilen bir grafiksel yaklaşıma nedir?

A
Kavram haritası
B
Histogram
C
Karar ağaçları
D
Çoklu karşılaştırma yöntemleri
E
Bireysel seçim teorisi
5 numaralı soru için açıklama 
Karar ağaçları, karar vericinin içinde bulunduğu karar verme probleminde ortaya çıkabilecek tüm durumları ve karar vericinin karşılaşabileceği tüm senaryoları bir arada gösterebilen bir grafiksel yaklaşımdır. Karar ağaçlarının bazı avantajları, • Açıklanmalarının kolay olması, • İnsani karar almayı diğer yaklaşımlara göre daha iyi yansıtması, • Grafiksel olarak gösterilebilir olması, • Uzman olmayan kişiler tarafından da kolaylıkla yorumlanabilir olması, • Temsili değişkenlere ihtiyaç duymadan nitel değişkenleri de işleyebiliyor olmalarıdır.
Soru 6

Aşağıdakilerden hangisi karar ağaçlarının bazı avantajlarından birisi değildir?

A
Açıklanmalarının kolay olması
B
İnsani karar almayı diğer yaklaşımlara göre daha iyi yansıtması
C
Grafiksel olarak gösterilebilir olması
D
Uzman olmayan kişilerce de kolaylıkla yorumlanabilmesi
E
Sadece nicel değişkenleri işleyebiliyor olmaları
6 numaralı soru için açıklama 
Karar ağaçlarının bazı avantajları, • Açıklanmalarının kolay olması, • İnsani karar almayı diğer yaklaşımlara göre daha iyi yansıtması, • Grafiksel olarak gösterilebilir olması, • Uzman olmayan kişiler tarafından da kolaylıkla yorumlanabilir olması, • Temsili değişkenlere ihtiyaç duymadan nitel değişkenleri de işleyebiliyor olmalarıdır
Soru 7

Düğüm ve dal bileşenlerinden oluşan grafiksel tekniğe ne ad verilir?

A
Karar ağacı
B
Tableau yazılımı
C
Entropi indeksi
D
Ayırma kriteri
E
Gini indeksi
7 numaralı soru için açıklama 
Sınıflandırma tekniklerinden birisi de karar ağaçlarıdır. Karar ağaçları ile ilgili bazı kavramların detaylı bir şekilde ele alınmasında büyük fayda bulunmaktadır. En basit anlamıyla karar ağacı, düğüm ve dal bileşenlerinden oluşan ve Şekil 6.1’de yer alan ağaca benzer bir yapıya sahip grafiksel bir tekniktir.
Soru 8

Aşağıdakilerden hangisinde yaprak düğümlerinde bir sınıf kestirimi yerine sayısal bir değer kestirimini içeren regresyon ağacı da oluşturulabilmektedir?

A
ID3
B
C4.5
C
CHAID
D
CART
E
QUEST
8 numaralı soru için açıklama 
CART algoritmasının önemli bir işlevi ise, yaprak düğümlerinde bir sınıf kestirimi yerine sayısal bir değer kestirimini içeren regresyon ağacı da oluşturabilmesidir.
Soru 9

R ile sınıflandırma ve regresyon ağacı oluşturabilmek için hangi paketin kurulu olması gerekmektedir?

A
digest
B
curl
C
colorspace
D
car
E
rpart
9 numaralı soru için açıklama 
R ile sınıflandırma ve regresyon ağacı oluşturabilmek için rpart paketinin R’de kurulu olması gerekmektedir.
Soru 10

Karar ağacının oluşturulmasında kök ve iç düğümlerde ayırma işlemini en iyi şekilde gerçekleştirecek olan niteliğin belirlenmesi işlemine ne ad verilir?

A
Ayırma kriterinin belirlenmesi
B
Durma kriterinin belirlenmesi
C
Yaprak düğümüne ait sınıfın belirlenmesi
D
Sınıflandırma işleminin yapılması
E
Olası karar ağaçlarının oluşturulması
10 numaralı soru için açıklama 
Karar ağaçlarını, sınıflandırma probleminin çözümlenmesinde kullanırken iki adıma ihtiyaç duyulur. Bu adımlar, 1. Karar ağacının oluşturulması 2. Veritabanında yer alan her bir kaydın (ti) sınıflandırmasının yapılması şeklindedir. Karar ağacının oluşturulması sürecinde karşılaşılabi lecek en önemli sorun, kök ve iç düğümlerde hangi niteliklerin yer alacağının tespit edil mesidir. Çünkü, sınırlı sayıda kayıttan oluşan bir veri yığını için olası tüm karar ağaçlarını oluşturmak ve bunların arasından en uygunu seçmek oldukça zor olacaktır. Bu nitelik, ayırma işlemini gerçekleştiren en iyi nitelik olacaktır ve ayırma kriteri olarak adlandırılır. Ayırma kriteri olarak öyle bir nitelik seçilmelidir ki diğer nitelikler ile karşılaştırıldığında en iyi ayırıcı nitelik olmalıdır. Karar ağacı oluşturulduktan sonra, her bir kayıt bu karar ağacının kök düğümden başlayarak, geçtiği her düğümdeki sorunun yönlendirmesine göre bir yaprak düğüme ulaşır ve böylece sınıflandırma işlemi tamamlanmış olur.
Soru 11

Bir banka müşteri veritabanında yer alan BORÇ, GELİR, STATÜ niteliklerine göre müşterinin RİSK durumu belirlenmek istenmektedir. H entropi değeri olmak üzere, BORÇ niteliği ile ayırma yapılması istendiğinde elde edilen kazanç aşağıdaki eşitliklerden hangisi ile hesaplanır?

A
Kazanç (BORÇ, RİSK) =H(RİSK) – H (BORÇ, RİSK)
B
Kazanç (RİSK, BORÇ) =H(RİSK) – H (RİSK, BORÇ)
C
Kazanç (BORÇ) =H(RİSK) – H (BORÇ)
D
Kazanç (BORÇ, RİSK) =H(RİSK) / H (BORÇ, RİSK)
E
Kazanç (BORÇ, RİSK) =H(RİSK) * H (BORÇ, RİSK)
11 numaralı soru için açıklama 
T hedef niteliğini X niteliğine göre bölerek elde edilen bilgiyi ölçmek için kazanç ölçütünden yararlanılır ve hesaplama için izleyen eşitlik kullanılır. Kazanç (X, T) = H(T) ‒ H(X, T)
Soru 12

Ayırma kritesi olarak kazanç ölçütünden yararlanan; durdurma kriteri olarak tüm kayıtların tek bir sınıfa ait olması veya kazanç ölçütünün sıfırdan büyük olmaması durumunu kullanan; karar ağacına herhangi bir budama uygulamayan; sayısal nitelikleri ve kayıp veriyi işleyemeyen; 1983 yılında Ross Quinlan tarafından önerilen karar ağacı oluşturma algoritması aşağıdakilerden hangisidir?

A
ID3
B
C4.5
C
CART
D
CHAID
E
QUEST
12 numaralı soru için açıklama 
ID3 karar ağacı oluşturma algoritması en basit karar ağacı oluşturma algoritmasıdır. Ayırma kriteri olarak kazanç ölçütünden yararlanılmaktadır. Karar ağacının büyümesini durdurma kriteri ise tüm kayıtların tek bir sınıfa ait olması veya kazanç ölçütünün sıfırdan büyük olmaması durumudur. ID3 algoritmasında, karar ağacına herhangi bir budama işlemi uygulanmaz, ek olarak bu algoritma sayısal (ölçüm düzeyi nicel) nitelikleri ve kayıp veriyi işleyememektedir. 1983 yılında Ross Quinlan tarafından önerilmiştir. Bu nedenle doğru yanıt a) seçeneğidir.
Soru 13

İkili (binary) karar ağacı yapısından dolayı diğer algoritmalardan farklılık gösteren; ayırma kriteri için Entropi, Gini ve Twoing indekslerinden, karar ağacını budamak için ise maliyet-karmaşıklığı kriterinden faydalananan; yaprak düğümlerinde bir sınıf kestirimi yerine sayısal bir değer kestirimini içeren regresyon ağacını da oluşturulabilmesini sağlayan; 1984 yılında Breiman, Friedman, Olshen ve Stone tarafından önerilen sınıflandırma ve regresyon ağaçları algoritması aşağıdakilerden hangisidir?

A
CART
B
CHAID
C
QUEST
D
ID3
E
C4.5
13 numaralı soru için açıklama 
Kısaca CART olarak adlandırılan sınıflandırma ve regresyon ağaçları algoritması, ikili (binary) karar ağacı yapısından dolayı diğer algoritmalardan farklılık göstermektedir. Karar ağacındaki her bir düğüm yanlızca iki dala ayrılır. Ayırma kriteri için Entropi, Gini ve Twoing indekslerinden, karar ağacını budamak için ise maliyet-karmaşıklığı kriterinden faydalanılır. CART algoritmasının önemli bir işlevi ise, yaprak düğümlerinde bir sınıf kestirimi yerine sayısal bir değer kestirimini içeren regresyon ağacının da oluşturulabilmesidir. Bu durumda, ayırma kriteri olarak en küçük kareler sapması kriterine başvurulmaktadır. 1984 yılında Breiman, Friedman, Olshen ve Stone tarafından önerilmiştir.
Soru 14

Sınıflandırma ve regresyon ağacı oluşturabilmek için R’de yüklenmesi gereken paket aşağıdakilerden hangisidir?

A
rpart
B
stats
C
lsa
D
scrime
E
arules
14 numaralı soru için açıklama 
R ile sınıflandırma ve regresyon ağacı oluşturabilmek için rpart paketinin R’de kurulu olması gerekmektedir. Eğer kurulu değilse, Paketler menüsünden Paket Kur seçeneği seçilerek kurulur. Kurulum bittikten sonra, paketin hafızaya yüklenmesi için, yine aynı menüde bulunan Paket Yükle seçeneği yardımıyla veya library(rpart) komutu yardımıyla rpart paketi hafızaya yüklenebilir.
Soru 15

Karar ağaçlarında kestirim hata oranının, ortaya çıkan aşırı uyum (overfitting) sorununun giderilmesi, azaltılması ve sınıflandırma modelinin kalitesinin arttırılması amacıyla yapılan işleme ne denir?

A
Çoklu bağıntı azaltma
B
Ağırlıklandırma
C
Serpme
D
Budama
E
Standartlaştırma
15 numaralı soru için açıklama 
Budama bir ya da daha fazla dalı çıkartarak, karar ağacını daha basitleştirmek amacıyla, yaprak düğüm ile değiştirme işlemidir. Bu işlem, çıkartılmasına karar verilen dalın içerdiği kayıtların, bağlı olduğu üst düğüme dahil edilerek, düğümün yaprak düğüme dönüştürülmesine dayanır. Böylece, kestirim hata oranının, ortaya çıkan aşırı uyum (overfitting) sorununun giderilmesi, azaltılması ve sınıflandırma modelinin kalitesinin arttırılması hedeflenir.
Soru 16

R ile sınıflandırma ve regresyon ağacı oluşturabilmek için hangi paketinin R’de kurulu olması gerekmektedir?

A
data.frame
B
rpart
C
click
D
treeg
E
svrt
16 numaralı soru için açıklama 
R ile sınıflandırma ve regresyon ağacı oluşturabilmek için rpart paketinin R’de kurulu olması gerekmektedir.
Soru 17

Karar vericinin içinde bulunduğu karar verme probleminde ortaya çıkabilecek tüm durumları ve karar vericinin karşılaşabileceği tüm senaryoları bir arada gösterebilen bir grafiksel yaklaşıma nedir?

A
Kavram haritası
B
Histogram
C
Karar ağaçları
D
Çoklu karşılaştırma yöntemleri
E
Bireysel seçim teorisi
17 numaralı soru için açıklama 
Karar ağaçları, karar vericinin içinde bulunduğu karar verme probleminde ortaya çıkabilecek tüm durumları ve karar vericinin karşılaşabileceği tüm senaryoları bir arada gösterebilen bir grafiksel yaklaşımdır. Karar ağaçlarının bazı avantajları, • Açıklanmalarının kolay olması, • İnsani karar almayı diğer yaklaşımlara göre daha iyi yansıtması, • Grafiksel olarak gösterilebilir olması, • Uzman olmayan kişiler tarafından da kolaylıkla yorumlanabilir olması, • Temsili değişkenlere ihtiyaç duymadan nitel değişkenleri de işleyebiliyor olmalarıdır.
Soru 18

Aşağıdakilerden hangisinde yaprak düğümlerinde bir sınıf kestirimi yerine sayısal bir değer kestirimini içeren regresyon ağacı da oluşturulabilmektedir?

A
ID3
B
C4.5
C
CHAID
D
CART
E
QUEST
18 numaralı soru için açıklama 
CART algoritmasının önemli bir işlevi ise, yaprak düğümlerinde bir sınıf kestirimi yerine sayısal bir değer kestirimini içeren regresyon ağacı da oluşturabilmesidir.
Soru 19

R'ye excel verisi aktarımı hangi komut yardımıyla yapılmaktadır?

A
dim()
B
head()
C
read.csv()
D
help()
E
library()
19 numaralı soru için açıklama 
R’ye aktarılmak için hazır durumdadır. Aktarım için read.csv() fonksiyonundan yararlanılır.
SONUÇLAR
19 tamamladınız.
Liste
Geri dön
Tamamlananlar işaretlendi.
12345
678910
1112131415
16171819Son
Geri dön
1 Yıldız2 Yıldız3 Yıldız4 Yıldız5 Yıldız (1 Kişi oy verdi, 5 üzerinden ortalama puan: 3,00. Bu yazıya oy vermek ister misiniz?)
Loading...
0
Would love your thoughts, please comment.x
()
x