Kayıt Ol

Giriş

Şifremi Kaybettim

Lost your password? Please enter your email address. You will receive a link and will create a new password via email.

soru ekleme

Soru sormak için giriş yapmalısınız.

Giriş

Kayıt Ol

.........

SQL Server 2012’de Data Quality Services başlangıç – DQS’ye Giriş

SQL Server 2012’de Data Quality Services başlangıç – DQS’ye Giriş

Data Quality Service, SQL Server’ın çok önemli bir konseptidir.

Bu makale yeni başlayanlar için Data Quality Service’e giriş niteliğindedir. Bir Excel dosyası kullanacağız

Bu yazıda, Bilgi Tabanı oluşturma hakkında bilgi edinebileceğimizi ve verilerin kalitesini belirlememize yardımcı olmanın yanı sıra verilerin kötü kalitesini düzeltmemize yardımcı olabileceğimizi göreceğiz.

İşte bu eğitimde öğreneceğimiz iki önemli adım.

  • Yeni Bir Bilgi Tabanı Oluşturma
  • Yeni Bir Veri Kalitesi Projesi Oluşturma

Hadi Bilgi Tabanına başlayalım. Yeni New Knowledge Base’e tıklayın.

dqs1

Projemizde Excel’i bir bilgi tabanı olarak kullanacağız. İşte kullanacağımız Excel. İki sütun var. Biri Colors, diğeri Shade. Bağımsız sütunlardır ve birbirleriyle ilişkili değildirler. Göstermeye çalıştığım nokta, Sütun A’da benzersiz veriler var ve Sütun B’de yinelenen kayıtlar var.

dqs3

New Knowledge Base üzerine tıkladığınızda aşağıdaki ekran açılacaktır. Yeni bilgi tabanı adını girin.

dqs4

İLERİ’yi tıkladığınızda, EXCEL dosyasını seçmesine izin verecek olan aşağıdaki ekran görüntülenir ve kullanıcıların kaynak sütununu seçmelerine de izin verir. Colors ve Shade’i bir kaynak sütun olarak seçtim.

dqs5

Bir etki alanı oluşturmak çok önemlidir. Burada, Colors ve Shade’den kompozit oluşturulan benzersiz bir alan veya alan adı oluşturabilirsiniz.

dqs6

Bu ilk örnek olduğundan, benzersiz alan oluşturacağım – Colors için Alan Colors oluşturacağım ve Shade için Alan Shade oluşturacağım.

dqs7

Etki alanı oluşturduktan sonra ekranın nasıl görüneceğini gösteren ekran.

dqs8

İLERİ’yi tıkladığınızda size veri bulma işlemini gerçekleştirebileceğiniz aşağıdaki ekrana geleceksiniz. START düğmesini tıklatmak, sağlanan kaynak verilerin işlenmesine başlayacaktır.

dqs9

Önceden işlenmiş veriler, kaynak verileri ile ilgili çeşitli bilgileri gösterecektir. Bizim durumumuzda Colors sütununun benzersiz veri olduğunu, Shade’in benzersiz olmayan verilere sahip olduğunu ve benzersiz veri satırlarının sadece ikisinin olduğunu göstermektedir.

dqs10

Bir sonraki ekranda, değerler benzersiz olarak listelendiği için aslında daha fazla satır ekleyebilir ve verilerin sıklığını görebilirsiniz.

dqs11

İleriye tıklandığında, yeni oluşturulan bilgi tabanı yayınlanacak.

dqs12

dqs13

Şimdi bilgi tabanı oluşturuldu. Herhangi bir rasgele veri almaya ve üzerinde DQS uygulaması yapmaya çalışacağız. Basitlik amacıyla başka bir excel sayfası kullanıyorum. Gerçekte aynı SQL Server tablosunu kolayca kullanabilirsiniz.

dqs131

DQS Projesini başlatmak için New Data Quality Project ‘e tıklayın.

dqs14

Bir sonraki ekranda hangi bilgi tabanını kullanacağını soracaktır. Yakın zamanda oluşturduğumuz Color Bilgi tabanımızı kullanacağız.

dqs15

Renk bilgisi tabanımızda iki sütun vardı – 1) Colors ve 2) Shade. Bizim durumumuzda, burada her iki eşlemeyi de kullanacağız. Kullanıcı burada bir veya daha fazla sütun haritalama seçebilir.

dqs16

Şimdi komple projenin en önemli aşaması. Başlat’a tıklayın ve temizleme işlemini yapar ve çeşitli sonuçlar gösterir.

dqs17

Bizim durumumuzda işlenecek iki sütun vardı ve görevi gerekli bilgiyle tamamladı. Colors sütunlarında kendiliğinden herhangi bir değeri düzeltmediğini ancak Shade değerinde bir öneri olduğunu ortaya koymuştur. Değerleri düzeltmek için DQS’yi eğitebiliriz.

dqs19

Şimdi tıklayın ve etki alanı renkleri sol taraftan seçili tutun. Düzeltilmesi gereken iki hatalı sütun olduğunu gösterecektir. Gelecekte bir kez düzeltilen değerin otomatik olarak düzeltileceği yer burası.

dqs20

Burada elle değeri düzelttim ve Onayla düğmelerini tıkladım. Onay düğmelerini tıkladığımda satırlar bu sekmede kaybolacak ve Düzeltilmiş Sekme’ye geçecektir. Sekmeyi reddetmiş olsaydım satırları Geçersiz Sekme’ye taşırdı.

dqs21

Bu ekranda, düzeltilen 2 satırın nasıl gösterildiğini görebilirsiniz. Düzelt sekmesine tıklayabilir ve DQS sürecinden geçen daha önce onaylanmış 6 satırı görebilirsiniz.

dqs22

dqs23

Şimdi ekranın sol tarafındaki Shade alanını tıklayın. DQS sistemi, doğru cevabı Dark olarak% 77’lik güven seviyesiyle tahmin ettiğinden, bu alan çok ilginç ayrıntılar gösterir. Oldukça yüksek bir güven seviyesi ve manuel gözlem de Dark’ın doğru cevabı gösterdiğini gösteriyor. Onayla’ya tıkladım ve satır düzeltilmiş sekmeye taşındı.

dqs24

Bir sonraki ekranda DQS tüm faaliyetlerin özetini gösterir. Ayrıca, verilerin kalitesinin nasıl düzeltildiğini de gösterir. Kullanıcı verileri bir SQL Server Tablosu, CSV dosyası veya Excel ile keşfedebilir.

dqs25

Kullanıcı ayrıca verileri ve tüm ilişkili temizleme bilgilerini veya verileri keşfetme seçeneğine de sahiptir. Verileri yalnızca gösterme amaçlı olarak seçeceğim.

dqs26

Explore’ı tıklamak dosyaları oluşturacaktır.

dqs27

Üretilen dosyayı açalım. Aşağıdaki gibi görünecek ve oldukça eksiksiz ve düzeltilmiş görünüyor.

dqs28

DQS Süreci başarıyla tamamladık.

Hakkında Hilal Saim

Namık Kemal Üniversitesi/Bilgisayar Mühendisliği

Beni Takip Et

Yorum ( 1 )

  1. […]   Yukarıdaki şekilde Data Quality Services ile,ilgili kolonların önceden tanımlanmış kurala göre geçerli olup olmadığının kontrolü sağlanır.Sipariş siteminde adres bilgisi “Çiçek Sokak Bakırköy” olan müşterinin satış sisteminde olası bir yazım hatasını,programda düzelmesini istediğimiz şekilde kaydederiz.Örneğin “Çiçk Sokak” gibi.Master Data Services ile o müşteri hakkında eksiksiz  bir bilgi sağlanır.Data Quality ile detaylı bilgi için bu linki kullanabilirsiniz. […]

Leave a reply

*