शुरुआती लोगों के लिए SSIS ट्यूटोरियल: क्या है, Archiटेकचर, पैकेज

एसएसआईएस क्या है?

SQL सर्वर एकीकरण सेवा (SSIS) का एक घटक है Microsoft SQL Server डेटाबेस सॉफ़्टवेयर जिसका उपयोग डेटा माइग्रेशन कार्यों की एक विस्तृत श्रृंखला को निष्पादित करने के लिए किया जा सकता है। SSIS एक तेज़ और लचीला डेटा वेयरहाउसिंग टूल है जिसका उपयोग डेटा निष्कर्षण, लोडिंग और रूपांतरण जैसे कि सफाई, एकत्रीकरण, डेटा विलय आदि के लिए किया जाता है।

यह एक डेटाबेस से दूसरे डेटाबेस में डेटा ले जाना आसान बनाता है। SSIS SQL सर्वर डेटाबेस, एक्सेल फ़ाइलों जैसे कई तरह के स्रोतों से डेटा निकाल सकता है। Oracle और DB2 डेटाबेस, आदि.

एसएसआईएस में ईमेल संदेश भेजने, एफटीपी संचालन, डेटा स्रोत और गंतव्य जैसे वर्कफ़्लो कार्यों को निष्पादित करने के लिए ग्राफिकल टूल और विज़ार्ड भी शामिल हैं।

हम SSIS का उपयोग क्यों करते हैं?

SSIS टूल का उपयोग करने के मुख्य कारण इस प्रकार हैं:

  • SSIS टूल आपको विभिन्न डेटा स्टोर से डेटा मर्ज करने में मदद करता है
  • प्रशासनिक कार्यों और डेटा लोडिंग को स्वचालित करता है
  • डेटा मार्ट और डेटा वेयरहाउस को पॉप्युलेट करता है
  • डेटा को साफ़ और मानकीकृत करने में आपकी मदद करता है
  • डेटा रूपांतरण प्रक्रिया में BI का निर्माण
  • प्रशासनिक कार्यों और डेटा लोडिंग को स्वचालित करना
  • एसआईएस में एक जीयूआई होता है जो उपयोगकर्ताओं को बड़े प्रोग्राम लिखने के बजाय आसानी से डेटा बदलने में मदद करता है
  • यह कुछ ही मिनटों में एक डेटा स्रोत से दूसरे डेटा स्रोत पर लाखों पंक्तियों को लोड कर सकता है
  • डेटा परिवर्तनों की पहचान करना, उन्हें कैप्चर करना और उनका प्रसंस्करण करना
  • डेटा रखरखाव, प्रसंस्करण या विश्लेषण का समन्वय करना
  • एसएसआईएस हार्डकोर प्रोग्रामर्स की आवश्यकता को समाप्त करता है
  • SSIS मजबूत त्रुटि और घटना प्रबंधन प्रदान करता है

एसएसआईएस का इतिहास

SSIS से पहले, SQL सर्वर में डेटा ट्रांसफ़ॉर्मेशन सर्विसेज़ (DTS) का उपयोग किया जाता था, जो SQL सर्वर 7 और 2000 का हिस्सा था

संस्करण विस्तार
SQL सर्वर 2005 RSI Microsoft टीम ने DTS को नया रूप देने का फैसला किया। हालाँकि, DTS को अपडेट करने के बजाय, उन्होंने उत्पाद का नाम इंटीग्रेशन सर्विसेज (SSIS) रखने का फैसला किया।
2008 SQL सर्वर संस्करण SSIS में प्रदर्शन संबंधी बहुत से सुधार किए गए। नए स्रोत भी पेश किए गए।
SQL सर्वर 2012 यह SSIS के लिए सबसे बड़ी रिलीज़ थी। इस संस्करण के साथ, प्रोजेक्ट परिनियोजन मॉडल की अवधारणा शुरू की गई। यह संपूर्ण प्रोजेक्ट और उनके पैकेज को विशिष्ट पैकेजों के स्थान पर सर्वर पर तैनात करने की अनुमति देता है।
SQL सर्वर 2014 इस संस्करण में SSIS के लिए बहुत अधिक परिवर्तन नहीं किए गए हैं। लेकिन नए स्रोत या परिवर्तन जोड़े गए हैं जो कोड के माध्यम से अलग-अलग डाउनलोड द्वारा किए गए थेPlex या SQL सर्वर फ़ीचर पैक.
SQL सर्वर 2016 में यह संस्करण आपको अलग-अलग पैकेज के बजाय संपूर्ण प्रोजेक्ट को तैनात करने की अनुमति देता है। इसमें अतिरिक्त स्रोत हैं, विशेष रूप से क्लाउड और बड़े डेटा स्रोत और कैटलॉग में कुछ बदलाव किए गए हैं।

एसएसआईएस की मुख्य विशेषताएं

यहां, कुछ महत्वपूर्ण SSIS मूलभूत विशेषताएं दी गई हैं:

  • स्टूडियो वातावरण
  • प्रासंगिक डेटा एकीकरण फ़ंक्शन
  • प्रभावी कार्यान्वयन गति
  • अन्य के साथ घनिष्ठ एकीकरण Microsoft SQL परिवार
  • डेटा माइनिंग क्वेरी रूपांतरण
  • फ़ज़ी लुकअप और ग्रुपिंग रूपांतरण
  • टर्म एक्सट्रैक्शन और टर्म लुकअप रूपांतरण
  • उच्च गति डेटा कनेक्टिविटी घटक जैसे कनेक्टिविटी SAP or Oracle

लघु उद्योगों Archiटेक्चर

लघु उद्योगों Archiटेक्चर
लघु उद्योगों Archiटेक्चर

एसएसआईएस वास्तुकला के घटक निम्नलिखित हैं:

  • नियंत्रण प्रवाह (कंटेनर और कार्य संग्रहीत करता है)
  • डेटा प्रवाह (स्रोत, गंतव्य, रूपांतरण)
  • इवेंट हैंडलर (संदेश, ईमेल भेजना)
  • पैकेज एक्सप्लोरर (पैकेज में सभी के लिए एकल दृश्य प्रदान करता है)
  • पैरामीटर (उपयोगकर्ता सहभागिता)

आइये प्रत्येक घटक को विस्तार से समझें:

1. प्रवाह को नियंत्रित करें

नियंत्रण प्रवाह SSIS पैकेज का मस्तिष्क है। यह आपको इसके सभी घटकों के लिए निष्पादन के क्रम को व्यवस्थित करने में मदद करता है। घटकों में कंटेनर और कार्य होते हैं जिन्हें प्राथमिकता बाधाओं द्वारा प्रबंधित किया जाता है।

2. वरीयता संबंधी बाधाएं

वरीयता बाधा पैकेज घटक है जो कार्यों को पूर्वनिर्धारित क्रम में निष्पादित करने का निर्देश देता है। यह पूरे SSIS पैकेज के वर्कफ़्लो को भी परिभाषित करता है। यह पहले के कार्य के परिणाम के आधार पर गंतव्य कार्यों को निष्पादित करके दो जुड़े हुए कार्यों के निष्पादन को नियंत्रित करता है - व्यावसायिक नियम जो विशेष अभिव्यक्तियों का उपयोग करके परिभाषित किए जाते हैं।

3. टास्क

'कार्य' कार्य की एक व्यक्तिगत इकाई है। यह प्रोग्रामिंग भाषा में उपयोग की जाने वाली विधि/फ़ंक्शन के समान है। हालाँकि, SSIS में, आप कोडिंग विधियों का उपयोग नहीं करते हैं। इसके बजाय, आप सतह को डिज़ाइन करने और उन्हें कॉन्फ़िगर करने के लिए ड्रैग और ड्रॉप तकनीक का उपयोग करेंगे।

4। कंटेनर

कंटेनर कार्यों को कार्य की इकाइयों में समूहीकृत करने के लिए इकाइयाँ हैं। दृश्य स्थिरता प्रदान करने के अलावा, यह आपको वेरिएबल और ईवेंट हैंडलर घोषित करने की भी अनुमति देता है जो उस विशिष्ट कंटेनर के दायरे में होने चाहिए।

एसएसआईएस में चार प्रकार के कंटेनर हैं:

  • एक अनुक्रम कंटेनर
  • एक फॉर लूप कंटेनर
  • फोरएचच लूप कंटेनर

अनुक्रम कंटेनर: आपको सहायक कार्यों को समूहीकृत करके व्यवस्थित करने की अनुमति देता है, और आपको कंटेनर में लेनदेन लागू करने या लॉगिंग असाइन करने की अनुमति देता है।

लूप कंटेनर के लिए:अनुक्रम कंटेनर के समान ही कार्यक्षमता प्रदान करता है, सिवाय इसके कि यह आपको कार्यों को कई बार चलाने की सुविधा भी देता है। हालाँकि, यह एक मूल्यांकन स्थिति पर आधारित है, जैसे 1 से 100 तक लूपिंग।

प्रत्येक लूप कंटेनर के लिए: यह लूपिंग की भी अनुमति देता है। लेकिन अंतर यह है कि कंडीशन एक्सप्रेशन का उपयोग करने के बजाय, लूप ऑब्जेक्ट्स के एक सेट पर किया जाता है, जैसे फ़ोल्डर में फ़ाइलें।

5. डेटा प्रवाह

SSIS टूल का मुख्य उपयोग सर्वर की मेमोरी में डेटा निकालना, उसे बदलना और उसे किसी अन्य गंतव्य पर लिखना है। यदि कंट्रोल फ्लो मस्तिष्क है, तो डेटा फ्लो SSIS का दिल है

6. एसएसआईएस पैकेज

SSIS का एक और मुख्य घटक पैकेज की अवधारणा है। यह कार्यों का एक संग्रह है जो एक व्यवस्थित तरीके से निष्पादित होता है। यहाँ, अध्यक्ष प्रतिबंध उस क्रम को प्रबंधित करने में मदद करते हैं जिसमें कार्य निष्पादित होगा।

एक पैकेज आपको फ़ाइलों को सहेजने में मदद कर सकता है SQL सर्वर, msdb या पैकेज कैटलॉग डेटाबेस में। इसे .dtsx फ़ाइल के रूप में सहेजा जा सकता है, जो रिपोर्टिंग सेवाओं के लिए .rdl फ़ाइलों के समान एक संरचित फ़ाइल है।

एसएसआईएस पैकेज

7। पैरामीटर

पैरामीटर्स एक वैरिएबल की तरह ही व्यवहार करते हैं, लेकिन कुछ मुख्य अपवादों के साथ। इसे पैकेज के बाहर आसानी से सेट किया जा सकता है। इसे ऐसे मानों के रूप में नामित किया जा सकता है जिन्हें पैकेज शुरू करने के लिए पास किया जाना चाहिए।

SSIS कार्य प्रकार

SSIS टूल में, आप प्रवाह को नियंत्रित करने के लिए एक कार्य जोड़ सकते हैं। विभिन्न प्रकार के कार्य हैं जो विभिन्न प्रकार के कार्य करते हैं।

कुछ महत्वपूर्ण SSIS कार्य नीचे उल्लिखित हैं:

कार्य का नाम Descriptआयनों
SQL कार्य निष्पादित करें जैसा कि इसके नाम से पता चलता है, यह एक रिलेशनल डेटाबेस के विरुद्ध SQL स्टेटमेंट निष्पादित करेगा।
डेटा प्रवाह कार्य यह कार्य एक या अधिक स्रोतों से डेटा पढ़ सकता है। जब डेटा मेमोरी में हो तो उसे रूपांतरित करें और उसे एक या अधिक गंतव्यों के विरुद्ध लिखें।
विश्लेषण सेवाएँ प्रसंस्करण कार्य इस कार्य का उपयोग सारणीबद्ध मॉडल या SSAS क्यूब के रूप में ऑब्जेक्ट्स को संसाधित करने के लिए करें।
पैकेज कार्य निष्पादित करें आप इस SSIS कार्य का उपयोग उसी प्रोजेक्ट के भीतर अन्य पैकेजों को निष्पादित करने के लिए कर सकते हैं।
प्रक्रिया कार्य निष्पादित करें इस कार्य की सहायता से आप कमांड लाइन पैरामीटर निर्दिष्ट कर सकते हैं।
फ़ाइल सिस्टम कार्य यह फ़ाइल सिस्टम में हेरफेर करता है। जैसे फ़ाइलों को स्थानांतरित करना, नाम बदलना, हटाना और निर्देशिकाएँ बनाना।
एफ़टीपी कार्य यह आपको बुनियादी FTP कार्यक्षमताएं निष्पादित करने की अनुमति देता है।
स्क्रिप्ट कार्य यह एक खाली कार्य है। आप NET कोड लिख सकते हैं जो कोई भी कार्य करता है; जो आप करना चाहते हैं।
भेजें Mail कार्य आप उपयोगकर्ताओं को ईमेल भेजकर सूचित कर सकते हैं कि आपका पैकेज समाप्त हो गया है, या कोई त्रुटि उत्पन्न हुई है।
बल्क इन्सर्ट कार्य बल्क इन्सर्ट कमांड का उपयोग करके डेटा को तालिका में लोड किया जा सकता है।
स्क्रिप्ट कार्य का एक सेट चलाता है VB.NET या विजुअल स्टूडियो वातावरण के अंदर C# कोडिंग।
वेब सेवा कार्य यह वेब सेवा पर एक विधि निष्पादित करता है।
WMI इवेंट वॉचर कार्य यह कार्य SSIS पैकेज को कुछ WMI घटनाओं की प्रतीक्षा करने और उन पर प्रतिक्रिया देने की अनुमति देता है।
XML कार्य यह कार्य आपको किसी भी XML फ़ाइल को मर्ज, विभाजित या पुन: स्वरूपित करने में मदद करता है।

अन्य महत्वपूर्ण ETL उपकरण

  • SAP डेटा सेवा
  • एसएएस डेटा प्रबंधन
  • Oracle वेयरहाउस बिल्डर (OWB)
  • पॉवरसेंटर इंफॉर्मेटिका
  • IBM इन्फोस्फेयर सूचना सर्वर
  • डेटा ETL के लिए अमृत प्रदर्शन सूची
  • सार्जेंट डेटा फ्लो

एसएसआईएस के उपयोग के लाभ और नुकसान

एसएसआईएस उपकरण निम्नलिखित लाभ प्रदान करता है:

  • व्यापक दस्तावेज़ीकरण और समर्थन
  • कार्यान्वयन में आसानी और गति
  • SQL सर्वर और के साथ सख्त एकीकरण विजुअल स्टूडियो
  • मानकीकृत डेटा एकीकरण
  • वास्तविक समय, संदेश-आधारित क्षमताएं प्रदान करता है
  • वितरण मॉडल के लिए समर्थन
  • SSIS द्वारा SQL में डेटा डालने में नेटवर्क की बाधा को दूर करने में आपकी सहायता करता है
  • SISS आपको डेटा को तेजी से लोड करने के लिए OLE DB के बजाय SQL सर्वर गंतव्य का उपयोग करने की अनुमति देता है

एसएसआईएस के नुकसान

एसएसआईएस उपकरणों के उपयोग में कुछ कमियां इस प्रकार हैं:

  • कभी-कभी गैर-विंडोज़ वातावरण में समस्याएँ पैदा होती हैं
  • अस्पष्ट दृष्टि और रणनीति
  • SSIS में वैकल्पिक डेटा एकीकरण शैलियों के लिए समर्थन का अभाव है
  • अन्य उत्पादों के साथ समस्याग्रस्त एकीकरण

SSIS सर्वोत्तम अभ्यास उदाहरण

  • SSIS एक इन-मेमोरी पाइपलाइन है। इसलिए यह सुनिश्चित करना महत्वपूर्ण है कि सभी परिवर्तन मेमोरी में हों
  • लॉग किए गए ऑपरेशन को न्यूनतम करने का प्रयास करें
  • संसाधन उपयोग को समझकर क्षमता की योजना बनाएं
  • SQL लुकअप रूपांतरण, डेटा स्रोत और गंतव्य को अनुकूलित करें
  • इसे सही ढंग से शेड्यूल और वितरित करें

सारांश

  • SSIS का पूर्ण रूप SQL सर्वर इंटीग्रेशन सर्विसेज़ है
  • SSIS टूल आपको विभिन्न डेटा स्टोर से डेटा मर्ज करने में मदद करता है
  • SQL सर्वर एकीकरण सेवा के महत्वपूर्ण संस्करण 2005, 2008, 2012, 2014 और 216 हैं
  • स्टूडियो वातावरण, प्रासंगिक डेटा एकीकरण फ़ंक्शन और प्रभावी कार्यान्वयन गति SSIS की कुछ महत्वपूर्ण विशेषताएं हैं
  • नियंत्रण प्रवाह, डेटा प्रवाह, इवेंट हैंडलर, पैकेज एक्सप्लोरर और पैरामीटर्स आवश्यक SSIS आर्किटेक्चर घटक हैं
  • SQL कार्य निष्पादित करें, डेटा प्रवाह कार्य, विश्लेषण सेवाएँ प्रसंस्करण कार्य, पैकेज कार्य निष्पादित करें, प्रक्रिया कार्य निष्पादित करें, फ़ाइल सिस्टम कार्य, FTP कार्य, भेजें Mail कार्य, वेब सेवा कार्य कुछ महत्वपूर्ण हैं
  • व्यापक दस्तावेज़ीकरण और समर्थन
  • SSIS की सबसे बड़ी कमी यह है कि इसमें वैकल्पिक डेटा एकीकरण शैलियों के लिए समर्थन का अभाव है
  • SAP डेटा सेवाएँ, SAS डेटा प्रबंधन, Oracle वेयरहाउस बिल्डर (OWB), पावरसेंटर इंफॉर्मेटिका, IBM इन्फोस्फेयर सूचना सर्वर
  • SSIS एक इन-मेमोरी पाइपलाइन है। इसलिए, यह सुनिश्चित करना आवश्यक है कि सभी परिवर्तन मेमोरी में हों

इस पोस्ट को संक्षेप में इस प्रकार लिखें: