AÖF Veri Madenciliği (ybs404u) 2018-2019 Final Deneme Sınavı

0 yorum
1 kez görüntülendi.

Lütfen sayfa yüklenirken bekleyiniz, tarayıcınızda javascript desteğinin etkin olduğundan emin olunuz.

Eğer sayfa yüklenmediyse buraya tıklayınız.

Doğru Sayısı	%%SCORE%%
Yanlış Sayısı	%%WRONG_ANSWERS%%

CEVAPLARINIZ

Yanıtlarınız aşağıdaki gibidir.

Soru 1

I. Sıkıştırma
II. Düzeltme
III. Bir araya getirme
IV. İndirgeme
V. Normalleştirme
Yukarıda verilenlerden hangileri veri dönüşümünde, verilerin veri madenciliği için uygun formlara dönüştürülmesi için kullanılan işlemlerdendir?

A	I, II ve III
B	I, III ve IV
C	II, III ve V
D	II, IV ve V
E	III, IV ve V

1 numaralı soru için açıklama

Düzeltme, bir araya getirme, normalleştirme ve özellik oluşturma verilerin veri madenciliği için uygun formlara dönüştürülmesi için kullanılan işlemlerdendir.

Soru 2

Minimum değeri 100 olan bir değişkenin 300 değerinin enk-enb normalleştirme yöntemine göre dönüşümü sonucu 0,5 ise değişkenin maksimum değeri kaçtır?

A	400
B	500
C	600
D	800
E	1000

2 numaralı soru için açıklama

(X-Xenk)/(Xenb-Xenk)=0,50 ise (300- 100)/(Xenb-100)=0,5 Xenb yani maksimum değeri 500'dür.

Soru 3

Aşağıdakilerden hangisi temel değişken tiplerinden değildir?

A	İkili Değişkenler
B	Sıra Gösteren Değişkenler
C	Normalleştirilmiş Değişkenler
D	İsimsel Değişkenler
E	Aralıklı Ölçümlendirilmiş Değişkenler

3 numaralı soru için açıklama

Normalleştirilmiş değişkenler temel değişken tiplerinden değildir.

Soru 4

Aşağıdakilerden hangisi web madenciliği uygulama alanlarından değildir?

A	Bankacılık
B	E-Öğrenme
C	Dijital Kütüphaneler
D	Elektronik Ticaret
E	E- Devlet

4 numaralı soru için açıklama

Bankacılık web madenciliğinin uygulama alanlarından birisi değildir.

Soru 5

Farklı özelliklerin ortaya çıkma sıklığı hakkındaki bilgiye ne ad verilir?

A	Sığ bilgi
B	Gizli bilgi
C	Çok boyutlu bilgi
D	Derin bilgi
E	Meta bilgi

5 numaralı soru için açıklama

Farklı özelliklerin ortaya çıkma sıklığı hakkındaki bilgiye çok boyutlu bilgi denilmektedir. Bu nedenle doğru cevap C'dir.

Soru 6

Nesneler arasında 1 hiç benzerliğin olmadığını 100 ise tam benzerliğin olduğunu göstermek üzere elde edilmiş olan 65 benzerlik değerinin [0,1] aralığına düşen dönüşüm değeri nedir?

A	0,29
B	0,65
C	0,44
D	0,69
E	0,73

6 numaralı soru için açıklama

s=65 için s'=(65-1)/(100-1)=(64/99)=0,65 olur. Bu nedenle doğru cevap B'dir.

Soru 7

Aşağıda verilenlerden hangisi, kayıp verilerin neden olacağı olumsuzlukları ortadan kaldırmak amacıyla kullanılan yaklaşımlardan birisi değildir?

A	Kayıp veri içeren kaydı veri kümesinden çıkarmak
B	Kayıp verilerin olduğu düşünülen dosyayı silmek
C	Kayıp verilerin hepsi için aynı veriyi girmek
D	Kayıp veri yerine tüm verilerin ortalama değerinin girilmesi:
E	Kayıtlarda yer alan diğer değişkenler yardımıyla kayıp verilerin tahmin edilmesi

7 numaralı soru için açıklama

Kayıp verilerin neden olacağı olumsuzlukları ortadan kaldırmak amacıyla kullanılan yaklaşımlar: 1. Kayıp veri içeren kaydı veri kümesinden çıkarmak 2. Kayıp verileri tek tek yazmak: 3. Kayıp verilerin hepsi için aynı veriyi girmek 4. Kayıp veri yerine tüm verilerin ortalama değerinin girilmesi: 5. Kayıtlarda yer alan diğer değişkenler yardımıyla kayıp verilerin tahmin edilmesi:

Soru 8

Aşağıda verilen veri madenciliği uygulama konularından hangisi, eğitim alanında yapılan veri madenciliği uygulama konularından değildir?

A	Öğrenci verilerinin analiz edilmesi
B	Öğrenci başarı ve başarısızlık nedenlerinin tespit edilmesi
C	Üretim süreçlerinin kontrol edilmesi ve tespit edilmesi
D	Eğitim-öğretim ortamlarındaki aksaklıkların tespit edilmesi
E	Daha etkili eğitim-öğretim ortamlarının oluşturulması

8 numaralı soru için açıklama

Eğitim alanında yapılan veri madenciliği uygulama konuları: Öğrenci verilerinin analiz edilmesi Öğrenci başarı ve başarısızlık nedenlerinin tespit edilmesi Öğrenci başarılarının arttırılması Eğitim-öğretim ortamlarındaki aksaklıkların tespit edilmesi Daha etkili eğitim-öğretim ortamlarının oluşturulması Üretim süreçlerinin kontrol edilmesi- Endüstri ve Mühendislik Alanındaki Uygulamalarındandır.

Soru 9

D işlemler veritabanında A ve B nesne setleri içinde karar verici tarafından belirlenmiş olan destek eşik değerine eşit ya da daha büyük destek değerine sahip nesne setleri yani sık görülen nesne setleri ile A⇒B şeklinde oluşturulan bir ilişki kuralının güven değeri aşağıdaki eşitliklerden hangisi ile hesaplanır?

A	Güven(A ⇒ B) = Destek(A ⋃ B) / Destek(A)
B	Güven(A ⇒ B) = Destek(A ⋃ B) / Destek(B)
C	Güven(A ⇒ B) = Destek(A) / Destek(A ⋃ B)
D	Güven(A ⇒ B) = Destek(B) / Destek(A ⋃ B)
E	Güven(A ⇒ B) = Destek(A ⋃ B) * Destek(A)

9 numaralı soru için açıklama

İlginç ilişki kuralı elde edebilmek için kullanılan ikinci ölçüt, güven değeridir. Öncelikle karar verici tarafından belirlenmiş olan destek eşik değerine eşit ya da daha büyük destek değerine sahip nesne setleri yani sık görülen nesne setleri ile oluşturulması mümkün tüm ilişki kuralları oluşturulur. Karar verici tarafından belirlenmiş olan güven eşik değerine eşit ya da daha büyük güven değerine sahip ilişki kuralları ilginç kural elde etmek için değerlendirilmeye alınırken, bu değerin altında güven değerine sahip ilişki kuralları ise elenir, değerlendirilmez. Sık görülen nesne setleri ile A⇒B şeklinde oluşturulan bir ilişki kuralı için hesaplanacak güven değeri, D işlemler veritabanında A’yı içeren ve aynı zamanda B’yi de içeren işlemlerin sayısının sadece A’yı içeren işlem sayısına oranıdır. Dolayısıyla A⇒B şeklinde ifade edilen ilişki kuralı için güven değeri, Güven( A ⇒ B ) = Destek( A∪ B ) /Destek( A ) = | A∪ B |/ | A | eşitliği yardımıyla hesaplanır. Aslında bir ilişki kuralının güven değeri, o kuralın öncül( A ) nesne setinin ortaya çıkması veya gözlenmesi durumunda sonuç ( B ) nesne seti- nin de ortaya çıkması, gözlenmesi olasılığıdır ve P( B│A ) şeklinde gösterilir. Güven değeri [0,1] arasında değer alır ve yüzde olarak yorumlanır

Soru 10

İşletmelerin varlığını sürdürebilmesi için yöneticilerinin doğru kararları ve doğru stratejileri belirlemesi için bilgiyi hangi koşullarda elde etmelidir?

A	Doğru yer
B	Doğru zaman
C	Doğru kişi
D	Doğru karar
E	Doğru strateji

10 numaralı soru için açıklama

İletişim ve bilişim teknolojilerinde yaşanan gelişmeler dünyada her şeyin hızla değişmesine neden olmaktadır. İster kâr amaçlı işletmeler, ister diğer kurum ve kuruluşlar açısından olsun, değişimlere ayak uydurabilmek başarı için önemli bir gerekliliktir. İşletmeler açısından ele alındığında bu değişimler; ekonomik koşullarda, iş yapma biçimlerinde, müşteri beklentilerinde, müşteri eğilimlerinde, rakiplerin stratejilerinde vb. ortaya çıkmaktadır. İşletmelerin bu değişimlere ayak uydurabilmesi, rakipleriyle yarışabilmesi ve varlıklarını başarılı bir biçimde sürdürebilmesi için, işletmelerde karar verici konumunda olan yöneticilerin, doğru kararlar vererek doğru stratejiler belirlemeleri gerekmektedir. Bu da ancak zamanında elde edilebilen doğru bilgilerin kullanımıyla mümkün olacaktır.

Soru 11

Kümeleme yöntemlerinin uygulanmasındaki amaç aşağıdakilerden hangisidir?

A	Küme içi homojenlik arttırılırken kümeler arası homojenliğin azaltılması amaçlanır.
B	Küme içi homojenlik azaltılırken kümeler arası homojenliğin artırılması amaçlanır.
C	Kümeler ara sındaki farklılıkları ve kümeler içi benzerlikleri en düşük düzeye indirmektir.
D	Kümeler ara sındaki farklılıklar azaltılırken kümeler içi farklılıkları en yüksek düzeye çıkarmaktır.
E	Kümeler ara sındaki benzerlikler artırılırken kümeler içi farklılıkları en yüksek düzeye çıkarmaktır.

11 numaralı soru için açıklama

Kümeleme yöntemleri; uzaklık (distance), benzerlik (similarity) ya da farklılık (dissimilarity) matrisinden yararlanarak birimleri ya da değişkenleri kendi içinde homojen ve kendi ara larında heterojen uygun kümelere ayırırken, kümeleri belirlemede izledikleri yaklaşımlara göre iki temel alt gruba ayrılırlar. Bunlar; Aşamalı kümeleme yöntemleri (Hierarchical Clus ter Analysis Methods) ve Aşamalı olmayan kümeleme yöntemleri (Nonhierarchical Cluster Analysis Methods) olarak ele alınmaktadır. Her iki yöntemde de ortak amaç kümeler ara sındaki farklılıkları ve kümeler içi benzerlikleri en yüksek düzeye çıkarmaktır. Yani, küme içi homojenlik arttırılırken kümeler arası homojenlik ise azaltılmaktadır. Hangi tekniğin kullanılacağı küme sayısına bağlı olmakla birlikte her iki tekniğin birlikte kullanılması çok daha yararlıdır. Böylece hem sonuçları hem de iki tekniğin hangisinin daha uygun sonuçlar verdiğini karşılaştırmak mümkün olmaktadır. Bu iki yöntem dışında ileri sürülmüş bir takım kümeleme algoritmaları varsa da bu yöntemler yaygın kullanımı olan yöntemler değildir.

Soru 12

> x=read.csv(“c:/ulkeler.txt”)
> dist.x=dist(x,method=”euclidean”)
> dist.x
> h=hclust(dist.x,method=”single”)
> h
> clusters=cutree(h, k=3)
> clusters
> plot(h,labels=x$Ulke)
> rect.hclust(h, K=3)

Yukarıda Öklid Uzaklık Matrisi ile Tek Bağlantı Kümeleme Analizi işlemi gerçekleştiren R komut kümesinde kümeleme dendrogramını görüntüleyen komut satırı hangisidir?

A	> plot(h,labels=x$Ulke)
B	> clusters
C	> h$merge
D	> dist.x
E	> h

12 numaralı soru için açıklama

Sayfa 174-178 arasında yapılan analizler sonucunda elde edilen dendrogramın görüntülenmesi için ise plot(h,labels=x$Ulke) komutu kullanılır. Veri dosyasında bulunan ülke sütunundaki ülkelere ait isimlerin dendrogramda gösterimi için komutta bulunan labels=x$Ulke ifadesi kullanılmıştır.

Soru 13

Kümeleme analizinde sonuçların bağlantılar, uzaklıklar ve birimlerin bağlanma düzey lerinin bir ağaç biçiminde ele alınarak ayrıntılı bir biçimde özetlendiği; genellikle x ekseninde birimler ve y ekseninde de uzaklıklar olacak şekilde yapılandırıldığı; değişkenlerin ya da birimlerin hangi aşamada ve hangi uzaklık ya da benzerlik düzeyinde bir araya gelerek küme oluşturduklarının ayrıntılı biçimde görüldüğü grafiksel yöntem aşağıdakilerden hangisidir?

A	Dendrogram
B	Cluster
C	Manhattan (City-Block) uzaklığı
D	Farklılık matrisi
E	Plot

13 numaralı soru için açıklama

Kümeleme analizinde sonuçlar dendrogram (ağaç diyagramı) adı verilen grafiksel yön temle sunulurlar. Dendrogramlarda bağlantılar, uzaklıklar ve birimlerin bağlanma düzey leri bir ağaç biçiminde ele alınarak şekillendirilir ve kümelenme süreci bu şekilde ayrıntılı bir biçimde özetlenir. Genellikle dendrogramlar; x ekseninde birimler ve y ekseninde de uzaklıklar olacak şekilde yapılandırılırlar. Dendrogramlarda değişkenlerin ya da birimlerin hangi aşamada ve hangi uzaklık ya da benzerlik düzeyinde bir araya gelerek küme oluşturdukları ayrıntılı biçimde görülmek tedir.

Soru 14

Ana hedefi şirket performansını artırmak ve pazarda rekabet avantajı sağlamak için insanların doğru kararlar almalarına yardımcı olmak olan web madenciliği sınıflandırması hangisidir?

A	Kişiselleştirme
B	İş zekası
C	Kullanım karakteristiği
D	Örüntü analizi
E	Sistem geliştirme

14 numaralı soru için açıklama

İş zekasının ana hedefi şirket performansını artırmak ve pazarda rekabet avantajı sağlamak için insanların doğru kararlar almalarına yardımcı olmaktır. Web kullanım madenciliği müşteri davranışları hakkında bilgileri ayıklamak ve yararlı ve etkili bir veritabanı oluşturmak için uygun bir tekniktir. İnternet üzerinden yapılan ürün ve hizmet satışları için müşteri potansiyelini arttırmak, var olan müşterinin devamlılığını sağlamak, daha çok satış gerçekleştirebilmek ve daha etkin bir lojistik ve stok yönetimi gerçekleştirebilmek için web kullanım madenciliği sonuçlarından yararlanılabilir.

Soru 15

Veri setine ilişkin uzaklık matrisini bulmak için aşağıda verilen komutlardan hangisi kullanılır?

A	>table(x$Ülke,results$cluster)
B	>plot(h,labels=x$Ülke)
C	>results$size
D	>x=read.csv(“c:/ulkeler.txt”)
E	ist.x=dist(x,method=”euclidean”)

15 numaralı soru için açıklama

Veri setine ilişkin uzaklık matrisini bulmak için dist.x=dist(x,method=”euclidean”) komutu kullanılır.

Soru 16

Aşağıdakilerden hangisi yanlıştır?

A	Veri ambarında yer alan verilen üzerinde çok boyutlu, çok yönlü analiz ve sorgulama yapılmasını sağlayan sistemlerdir.
B	Büyük miktardaki veri yığınları üzerinde analiz yaparak veriler arasında var olan ve geleceğin tahmin edilmesine yardımcı olacak anlamlı ve yararlı ilişki ve kuralların bilgisayar yazılımları aracılığıyla aranması faaliyetleridir.
C	Çeşitli analiz araçlarını kullanarak veriler arasındaki örüntü ve ilişkileri keşfederek bunları doğru tahminler yapmak için kullanan bir süreçtir.
D	Veri analizi için gelişmiş ve karmaşık araçlar kullanarak yığın veri kümeleri içinden daha önceden bilinmeyen olgu ve olayları keşfetmek ve veriler arasındaki mantıklı ilişkileri ve kalıpları ortaya çıkarmak amacıyla yapılan çalışmalardır.
E	İstatistiksel ve matematiksel tekniklerle birlikte örüntü tanıma teknolojilerini kullanarak çeşitli depolama ortamlarında kayıtlı bulunan veri yığınları üzerinde gerçekleştirilen elemeler sonucunda anlamlı yeni korelasyon, örüntü ve eğilimlerin keşfedilmesi sürecidir.

16 numaralı soru için açıklama

Veri ambarında yer alan verilen üzerinde çok boyutlu, çok yönlü analiz ve sorgulama yapılmasını sağlayan sistemler OLAP'tır.

Soru 17

Aşağıdakilerden hangisi pazar sepeti analizinin faydalarından biri değildir?

A	Müşterinin kişisel tercihlerinin belirlenmesine yarar
B	Müşteri portföyünün genişlemesine yarar
C	Birlikte satışa sunulacak ürünlerin belirlenmesini sağlar
D	Ürün satış raflarının tasarlanmasına yardım eder
E	Promosyon düzenlemelerine imkan verir

17 numaralı soru için açıklama

Pazar sepeti analizi, müşteri portföyünün genişlemesine olanak sağlamaz.

Soru 18

Bir alışveriş veritabanından oluşturulacak ilişki kuralları arasından işe yarayacak bilgiyi üretmek amacıyla kullanılacak ilişki kuralına ne denir?

A	Veri madenciliği
B	Pazar sepeti analizi
C	İlişki kuralları
D	İlginç kural
E	Enteresan kural

18 numaralı soru için açıklama

Bir alışveriş veritabanından oluşturulacak ilişki kuralları arasından işe yarayacak bilgiyi üretmek amacıyla kullanılacak ilişki kuralına ilginç kural denir.

Soru 19

R ile sınıflandırma ve regresyon ağacı oluşturabilmek için hangi paketin kurulu olması gerekmektedir?

A	digest
B	curl
C	colorspace
D	car
E	rpart

19 numaralı soru için açıklama

R ile sınıflandırma ve regresyon ağacı oluşturabilmek için rpart paketinin R’de kurulu olması gerekmektedir.

SONUÇLAR

19 tamamladınız.

←

Liste

→

Geri dön

Tamamlananlar işaretlendi.

1	2	3	4	5
6	7	8	9	10
11	12	13	14	15
16	17	18	19	Son

Geri dön

(2 Kişi oy verdi, 5 üzerinden ortalama puan: 2,50. Bu yazıya oy vermek ister misiniz?)

Veri Madenciliği 2018-2019 Final Deneme Sınavı