Kayıt Ol

Giriş

Şifremi Kaybettim

Lost your password? Please enter your email address. You will receive a link and will create a new password via email.

soru ekleme

Soru sormak için giriş yapmalısınız.

Giriş

Kayıt Ol

.........

Using Data Quality Services to Cleanse Data

Using Data Quality Services to Cleanse Data

Bir veri kalitesi yönetimi çözümü için en önemli görevlerden biri, alan değerlerini doğrulayıp düzeltmek suretiyle verileri temizlemektir. Bu derste, verileri temizlemek ve sonuçları incelemek için DQS’yi nasıl kullanabileceğiniz anlatılmaktadır.

Veri Temizleme Projesi Oluşturma

Veri yöneticileri, bir bilgi tabanındaki bilgiyi bir SQL Server veritabanındaki veya bir Excel ‘deki verilere uygulayan bir veri temizleme projesi oluşturmak için Veri Kalitesi İstemci uygulamasını kullanabilir.

Bir veri temizleme projesi oluştururken, veri sorumlusu aşağıdakileri yapmalıdır:

1. Kullanılacak bilgi tabanını seçin ve yapılacak işlemin temizlik olduğunu belirtin.
2. Temizlenecek veriyi içeren kaynağı seçin ve içindeki sütunları bilgi tabanındaki alanlara eşleyin.
3. Veri temizleme işlemini çalıştırın ve ardından DQS tarafından üretilen önerileri ve düzeltmeleri gözden geçirin. Veri amiri, daha sonra önerileri ve düzeltmeleri onaylayabilir veya reddedebilir.
4. Temizlenen verileri bir veritabanı tablosuna, virgülle sınırlandırılmış dosyaya veya Excel’e  dışa aktarın.

Temizlenmiş Verileri Görüntüleme

Bir veri temizleme projesinin çıktısı, DQS tarafından yapılan düzeltmeler hakkında temizlenen verileri ve ek bilgileri içerir. Çıktı sütunlarına, etki alanının adını ve veri türünü birleştirerek ad verilir. Örneğin, State adlı bir etki alanının temizlenmiş çıktısı State_Output adlı bir sütunda saklanır.

Temizlenmiş veri çıktısı aşağıdaki sütun türlerini içerir:

  • Output –Veri temizlendikten sonra tüm alanların değerleri. Özgün veri kaynağındaki tüm alanlar, bilgi tabanındaki alanlara eşlenmemiş olanlar da dahil olmak üzere çıktı sütunları oluşturur (Bu durumda orijinal veri değerlerini içerirler).
  • Source –Alanlara eşlenen ve temizlenen alanların orijinal değeri.
  • Reason –Çıkış değeri temizleme işlemi tarafından seçilme nedeni. Örneğin, geçerli bir değer alan için tanımlanan öncü bir değere düzeltilebilir veya DQS bir temizleme algoritması uygulayabilir ve düzeltilmiş bir değer önermiş olabilir.
  • Confidence –DQS’nin düzeltilmiş değerlere ilişkin güveni gösteren bir gösterge. değerler için Bilgi tabanında tanımlanan öncü değerlere düzeltildiğinde, genellikle 1 (veya% 100) ‘dir. DQS bir düzeltme önermek için bir temizleme algoritması kullandığında, güven 0 ile 1 arasında bir değerdir.
  • Status –Çıktı sütununun durumu. “Doğru” değeri orijinal değerin zaten doğru olduğunu ve “düzeltilmiş” bir değerin DQS’nin değeri değiştirdiğini belirtir.

Hakkında Hilal Saim

Namık Kemal Üniversitesi/Bilgisayar Mühendisliği

Beni Takip Et

Leave a reply

*